我爱免费 发表于 2024-5-6 17:13

AI简报 | Kimi官方正内测新智能体;DeepSeek发布全球最强开源MoE模型;Sora放出人物替换功能...

作者:AssoAI


I EXPRESS DELIVERY

AI速递

国内首个AI体育“浦动”大模型亮相,原创AI助推竞技体育水平提升

2024年汤姆斯杯暨尤伯杯赛(汤尤杯)在成都成功举办,中国羽毛球队赢得了双冠军。

在赛事直播中,上海人工智能实验室推出的“浦动体育技战术实时分析大模型”首次亮相,该模型能够基于羽毛球比赛的视频画面实时分析关键参数,为观众提供了科技感十足的观赛体验。



“浦动”模型结合了央视听媒体大模型,实时传输分析结果至中央导播控制系统,为直播观众提供了专业的AI技战术分析。

该模型的优势在于无需运动员穿戴任何设备,避免了对运动员表现的影响,同时满足了直播的时效性要求。它不仅适用于比赛直播,还能在日常训练中帮助教练和运动员提升竞技水平。



上海AI实验室的研究团队开发了原创算法,使用大模型技术替代了传统的测量与动作跟踪方法,通过计算机视觉和算力进行数据分析。

马斯克爆出特斯拉 Optimus 人形机器人更多细节:娴熟分装电池、自我矫正..

特斯拉的Optimus人形机器人在最新演示中展示了其在电池工厂中进行电池分装的能力,以及在行走方面的显著进步,包括更快、更远和更稳定的步伐。



机器人利用端到端神经网络,结合2D摄像头、触觉和力传感器来执行精确的操作,并能自主恢复故障。

Optimus在特斯拉的FSD计算机上运行,通过板载电池供电。它通过人类远程操作收集的训练数据进行学习,以执行多样化的任务。



目前,尽管速度仍有提升空间,但Optimus的成功率在提高,且失误在减少。特斯拉团队正致力于提升其移动速度和适应性,同时保持其人性化特征。

马斯克也透露了Optimus未来的升级目标,包括增加手部的自由度。自从2021年首次提出构想以来,Optimus已经经历了多次技术迭代和能力提升,其发展速度和潜力受到业界的广泛关注。

AI战斗机首次空中格斗人类,美空军“FSB”加速部署千架

美国空军在加州爱德华兹空军基地进行了一项历史性的测试,其中AI控制的F-16战斗机X-62A VISTA与人类飞行员驾驶的同型号战斗机进行了空中格斗。

美国空军部长Frank Kendall亲自参与了这次飞行体验,对AI战斗机在战斗中的表现给予了高度评价,并相信AI系统未来能够承担决定是否发射武器的重任,但他同时强调了人类监督的重要性。



美国空军计划在未来几年内部署上千架AI战斗机,以应对日益激烈的大国竞争和空军当前面临的挑战,如人手短缺、成本问题以及战略优势的削弱。

预计到2028年,一部分AI战斗机将被部署到战场,特别是在西太平洋地区。



AI战斗机的智能系统由加州初创公司EpiSci提供,该公司专注于开发国家安全领域的下一代任务自主性解决方案。

EpiSci的Tactical AI系列自主系统不仅在模拟环境中进行了大量学习,还在实际飞行中进行了测试,以不断提升其性能。

【Sora新技术演示】打破常规,实现视频元素的智能替换!

从Sora最新推出的视频编辑技术来看,它允许用户在视频中直接更改特定元素,同时系统自动确保其他元素的一致性。



这项技术的核心在于使用先进的图像识别算法来识别和替换视频中的人物和物体,同时对光影、纹理、颜色等视觉元素进行智能调整,以保持视频的整体风格和逻辑。

尽管在大多数情况下效果显著,Sora的技术在细节处理上仍有改进空间。特别是在元素替换后,有时阴影或光线与原始画面不完全吻合,这可能会稍微影响观赏体验。



为了提升技术,Sora的开发团队正在专注于细节的优化,努力实现技术上的精确对接和视觉上的无缝衔接。

目前该人物替换功能也在其他产品所拥有,了解更多(视频号最新起号方法!AI一键生成机器人视频!条条10w+!)

Kimi官方发布有关更多Kimi+信息,正开发个人创建智能体功能!

Kimi作为目前的当红AI明星,官方也自然投入了大量的资金宣传与研发,假期偷偷上线的Kimi+就是最好的说明,它是Kimi智能助手的扩展系列,由多个具有特定专业技能的AI分身组成。



在网页版聊天框里输入@或在左侧工具栏,即可召唤他们!

这些分身能够独立或协作解决用户在写作、设计、学术研究等方面的特定问题,形成高效的AI解决方案。

Kimi+系列正在不断扩展,未来将推出更多专业AI以覆盖更广泛的用户需求。此外,个人创建Kimi+的功能也在开发中,将允许用户定制个性化的AI分身。



同时,Kimi团队正在内测研报生成器,这是一个能够对资料进行结构化思考并生成深度长文的AI智能体。

DeepSeek发布全球最强开源MoE模型!专攻数学、代码和推理、支持 128K 上下文窗口

DeepSeek公司发布了其第二代开源MoE(Mixture of Experts)模型DeepSeek-V2,该模型在性能上取得了显著提升,同时降低了成本。

DeepSeek-V2在多个评测榜单中表现出色,尤其是在中文和英文综合能力方面,与GPT-4-Turbo和文心4.0等闭源模型相媲美。



该模型采用了创新的MLA架构和自研的Sparse结构DeepSeekMoE,显著减少了计算量和推理显存,以236B的总参数和21B的激活,实现了与70B到110B Dense模型相当的性能,同时显存消耗大幅降低。

DeepSeek-V2的API定价极具竞争力,每百万tokens输入1元、输出2元,远低于市场上其他同类产品。



此外,DeepSeek-V2模型和相关技术报告已经完全开源,免费商用,无需申请,模型权重可在Hugging Face平台获取,技术报告则可在GitHub上查阅。



DeepSeek公司秉持开放的开源精神,推动AGI事业的发展,并通过其对话官网和API开放平台为用户提供服务,注册用户可获赠一定数量的Tokens,优质项目还有机会获得更多额度。

了解更多(注册就送1000万Tokens!幻方AI的DeepSeek(深度求索)值得体验!)









页: [1]
查看完整版本: AI简报 | Kimi官方正内测新智能体;DeepSeek发布全球最强开源MoE模型;Sora放出人物替换功能...