找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 237|回复: 0

腾讯AI实验室重磅发布!Crab模型:让AI像人类一样理解视听场景

[复制链接]
发表于 2025-5-28 22:04 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
           

w1.jpg

      
            龙哥寄语:
想要一个能同时理解音频和视觉信息的AI模型吗?Crab带你进入多模态场景理解的新时代!这个来自腾讯AI实验室的神奇"螃蟹"模型,不仅能听懂声音、看懂画面,还能像人类一样把视听信息完美融合!🐙        

      

w2.jpg

论文标题:
Crab: A Unified Audio-Visual Scene Understanding Model with Explicit Cooperation发表日期:
2025年3月作者:
Henghui Du, Guangyao Li, Chang Zhou, Chunjie Zhang, Alan Zhao, Di Hu发表单位:
中国人民大学高瓴人工智能学院、清华大学、腾讯PCG原文链接:
https://arxiv.org/pdf/2503.13068开源代码链接:
https://github.com/GeWu-Lab/Crab
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-8-5 14:31 , Processed in 0.105534 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表