萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 81|回复: 0

海兔AI早观察0424 | 美国科技巨头交锋新战场:AI智能体

[复制链接]
发表于 2024-4-24 03:39 | 显示全部楼层 |阅读模式
作者:海图智能科技




01

美国科技巨头的新战场:AI智能体的开发竞赛

微软、Meta、OpenAI和谷歌等公司正在开发能够在极少人类干预下执行复杂任务的AI智能体。这些智能体包括能够自动创建和跟踪发票、重写应用程序代码、操作多个应用程序以及执行多步骤任务如预订旅行等。微软计划在下个月的Build开发者大会上宣布其智能体功能,而OpenAI正在秘密研发能够操作计算机的智能体。尽管AI聊天机器人已经获得认可,但客户期望软件能够自动化处理更复杂的任务。研究人员也在寻找防止智能体失控的方法,以避免执行有害操作。这些进展预示着AI在自动化和复杂任务处理方面的巨大潜力。



图片来源:36氪

02

Meta开放Horizon OS,打造MR领域的“安卓”

继发布开源AI模型Llama 3后,Meta宣布将向第三方头显制造商开放支持Meta Quest系列头显的Horizon操作系统。这一操作系统基于Android构建,针对VR和MR进行优化,集成了inside-out追踪、眼球、面部、手部和身体追踪等技术。Meta的这一举措旨在为消费者和开发者提供更多选择和更广阔的生态系统构建机会。



图片来源:36氪

03

AI如何塑造00后一代的娱乐习惯

AIGC(人工智能生成内容)技术正在改变00后一代的娱乐习惯,从AI翻唱、AI换脸到AI绘画,这些技术不仅提供了新的自我表达工具,也逐渐成为年轻人娱乐生活的一部分。AI技术的应用正在扩展到互动同人文和AI智能体,使得最年轻的用户群体能够无障碍地将表达任务交给AI。AI换脸技术、AI翻唱和AI辅助视频创作等在音视频领域的应用已经成熟并形成了新的生态分支。同时,AI技术的发展也对传统的二次创作形式和生态造成了冲击,它降低了创作门槛,解放了生产力,但也可能影响到传统创作者的热情和创作生态。AI技术的进步预示着代际差异的加剧,00后和10后对AI技术的接受度和依赖性可能会影响未来的娱乐内容创作和审美趋势。



图片来源:36氪

04

微软发布并撤回开源大模型WizardLM-2,因遗漏投毒测试

微软发布了一款号称性能媲美GPT-4的开源大模型WizardLM-2,但发布几小时后,模型权重和公告被删除。原因是团队在发布流程中遗漏了必要的投毒测试。投毒测试是评估AI模型是否会产生有毒、有偏见或不正确内容的重要步骤。尽管如此,一些网友在模型被删除前已经下载了权重,并对其进行了测试,结果表明7B模型性能给他们留下了深刻印象。微软团队承诺,在完成测试后会重新上线模型。这一事件凸显了在AI模型发布前进行充分测试的重要性,以避免可能的负面影响和对公众信任的损害。



图片来源:36氪

05

微软VASA-1框架:一张照片加音频即可生成逼真数字人视频

微软亚洲研究院推出了VASA-1框架,这是一个能够根据单张肖像照片和一段语音音频生成逼真说话面部视频的AI系统。该技术利用视觉情感技巧,可以精确同步唇音、生成逼真的面部行为和自然头部运动。这项技术的应用前景广阔,可以改善有障碍患者的交流方式、增强人工智能辅导教育的趣味性、提供医疗保健场景下的治疗支持等。然而,它也引发了关于视频证据可信度和潜在诈骗风险的讨论。尽管存在一些瑕疵,如牙齿大小的不一致,但VASA-1生成的视频在不知情的情况下仍难以被普通人辨认出来。该框架的核心创新包括基于扩散的整体面部动力学和头部运动生成模型,以及使用视频开发出的富有表现力和解耦的面部潜空间。



图片来源:36氪

06

Llama 3在大模型排行榜中位列第五,英文单项与GPT-4并列第一

大模型评测社区LMSYS发布了一份大模型排行榜单,其中Meta的Llama 3模型在总榜上位列第五,而在英文单项榜单中与GPT-4并列第一。该榜单基于模型一对一的对战,由全网测评者自行命题并打分。Llama 3在1.27万次对战中取得了第五名的成绩,而GPT-4的三个不同版本占据了榜单的前四名。Meta首席科学家LeCun和PyTorch之父Soumith Chintala对Llama 3的成绩表示赞赏。LMSYS的评测系统允许任何人参与,通过battle和side-by-side两种模式进行测试,最终根据Win Rate数据和Elo评价系统换算成分数得到排行榜。此外,Llama 3现在也可以在大模型推理平台Groq上运行,显示出较快的处理速度。



图片来源:36氪

07

加州理工华人团队用AI颠覆数学证明,自动化80%证明步骤

加州理工学院的团队通过AI技术极大提高了数学证明的自动化程度,他们的工具Lean Copilot可以自动化80%以上的数学证明步骤,比之前的基线aesop提高了2.3倍。这一成果是由华人研究员宋沛洋主要贡献的,他与导师Anima Anandkumar和Kaiyu Yang共同完成了这项研究。Lean Copilot作为一个形式化数学工具,允许大型语言模型(LLM)在Lean定理证明助手中提出证明策略,并允许人类无缝地进行干预和修改。这一工具的开发是为了解决自动化定理证明的挑战,因为现有的LLM在进行数学和推理任务时可能会犯错误。通过Lean Copilot,研究人员能够构建出用于生成策略建议、完成中间证明目标和使用LLM选择相关前提的工具。这些工具在实验中表现出色,证明了它们在辅助人类自动化定理证明上的有效性。这项工作不仅展示了AI在数学研究中的潜力,也为数学家和AI研究者之间的协作提供了新的途径。



图片来源:36氪

08

《芯片简史》作者汪波谈AI时代芯片面临的挑战

《芯片简史》作者汪波教授在湛庐2024世界读书日活动上讨论了AI时代芯片技术面临的挑战。汪波教授指出,芯片的发展与人工智能的快速进步紧密相关,芯片为AI提供了必要的算力。然而,芯片产业目前面临三大挑战:内存墙、功耗墙和频率墙。内存墙指的是CPU在存储数据时速度缓慢的问题;功耗墙涉及到芯片运行产生的巨大热量,目前的散热技术难以应对;频率墙则是CPU频率已多年未有显著提升。此外,晶体管尺寸的不断缩小也逼近了物理极限,如隧穿效应等问题。汪波教授还提到,除了技术挑战,还有气候变化、人口老龄化、电力资源短缺等更大范围内的挑战。



图片来源:36氪

09

微软发布iPhone可运行的ChatGPT级模型,挑战OpenAI

微软推出了Phi-3系列小模型,其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。微软宣称,4bit量化后的phi-3-mini能在iPhone 14 Pro和iPhone 15使用的苹果A16芯片上每秒生成12个token,这意味着现在手机上能本地运行的最佳开源模型已经达到ChatGPT水平。Phi-3系列的核心优势在于其训练数据,微软团队发现,使用大语言模型生成的合成数据和严格过滤的高质量数据可以有效提升中小模型的能力。这一进展给OpenAI带来了压力,网友期待OpenAI推出GPT-3.5的继任者以应对挑战。

10

Meta开放Quest头显操作系统,华硕、联想等加入合作

Meta公司宣布将首次向竞争对手设备制造商开放其Quest头显操作系统,即Meta Horizon OS,以扩大其在VR和MR行业的影响力。华硕、联想等硬件制造商将生产基于该系统运行的设备。Meta希望通过此举为消费者提供更多选择,并为开发人员提供更强大的生态系统。尽管VR和MR头显市场目前仍是小众领域,但Meta的这一开放策略可能会推动行业发展,尤其是在苹果推出高端头显设备Vision Pro后,Meta需要有效措施应对市场竞争。



来源


    美国科技巨头交锋新战场:AI智能体——36氪

    Meta 疯狂卷,继 Llama 3 后,重磅发布MR界的“安卓”操作系统——36氪

    被AI改变的00后娱乐习惯——36氪

    发布几小时,微软秒删媲美GPT-4开源大模型,竟因忘记投毒测试——36氪

    微软「诈骗届」王牌框架,真到可怕,一张照片+音频即可生成数字人——36氪

    大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五——36氪

    加州理工华人用AI颠覆数学证明,提速5倍震惊陶哲轩,80%数学步骤全自动化——36氪

    文津奖获奖图书《芯片简史》作者汪波:AI时代,芯片未来面临什么样的挑战?——36氪

    微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了——36氪

    围剿Vision Pro?Meta宣布开放头显操作系统,华硕联想等已“入伙”——36氪






「海国图智研究院」是中国第一批新型社会智库之一,由芝加哥大学政治学博士、暨南大学国际关系学院教授陈定定于2015年在深圳发起创立,现总部位于广州,另外在北京、上海、深圳、成都等地设有办公室。研究院在《2020年全球智库报告》中入选“人工智能政策与战略研究”最佳榜单,位居全球第24位。



「海图科技」是海国图智研究院孵化的新一代信息技术高科技企业,于2018年在广州成立。海图科技的核心产品包括企业出海智能服务平台、智能工作站、AI数智人、国际政治经济咨询与决策等智能服务。依托海图研究院多年的政商积累,强大的国内外资源整合能力,通过“搭平台、做研究、搞活动、谋项目”等服务形式,集成化、系统性和智能化地搭建综合服务工作载体,推动实现产学研资源共享、优势互补,提高企业、政府、个人的智能决策能力。



「海兔平台」(www.haituaigc.com)致力于赋能企业出海,为企业提供高质量商业情报。目前,平台涵盖了AI 文秘助理、AI 商业情报、AI 国际传播、AI 咨询献策等四大功能,为跨境国际业务企业提供一站式服务。(可通过点击“阅读原文”跳转海兔平台)



其中,AI文秘助理是一款人工智能聊天机器人,可以担任您的企业助理、学习助理、生活助手等等,它可以模拟对话,为您回答任意问题;AI 商业情报为企业提供政经商业情报,包含全球科技相关情报、科技前沿动向;给技术密集型企业、学术机构、政府单位提供丰富的文献、图表数据;AI 国际传播运用最新的AI虚拟形象技术,结合语音识别、语音合成、虚拟形象驱动等AI核心技术,实现用户与AI数智人之间的实时互动、业务资讯、智能问答、服务导览,可24小时+多直播间+多平台直播,提高企业营销效率;AI 咨询献策基于选择区域、行业、类别、议题,获取你的定制内容,辅助智能决策。





文章推送方式

微信:关注“海图智能科技”公众号

网站:https://www.haituaigc.com

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网 |网站地图

GMT+2, 2024-5-5 09:17 , Processed in 0.056693 second(s), 15 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表