论文标题:
Crab: A Unified Audio-Visual Scene Understanding Model with Explicit Cooperation发表日期:
2025年3月作者:
Henghui Du, Guangyao Li, Chang Zhou, Chunjie Zhang, Alan Zhao, Di Hu发表单位:
中国人民大学高瓴人工智能学院、清华大学、腾讯PCG原文链接:
https://arxiv.org/pdf/2503.13068开源代码链接:
https://github.com/GeWu-Lab/Crab
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.