找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 137|回复: 0

国庆放长假,AI圈不休息,盘点一下国庆期间AI圈的大事儿

[复制链接]
发表于 2025-10-8 19:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
国庆节长假马上就要结束了,一个八天的长假,不知道大家过得怎么样?希望没有被拥挤的人潮和车流影响出行的心情。在我们放假的这八天,科技行业最卷的AI圈显然没有休息,接下来我们就来盘点一下这些天都发生了些什么?

OpenAI发布Sora 2.0视频生成模型及Sora App上线:OpenAI于10月1日凌晨发布迄今最先进的视频生成模型Sora 2.0,同时推出同名社交应用“Sora”,用户可通过文本生成带声音的视频。Sora App上线两天内在美加地区iOS下载量达16.4万次,冲上美国App Store免费榜第三。

  -- 点评:AI视频创作进入一个社交时代,让我们看看OpenAI的新玩法。

OpenAI推出GPT-5 Instant升级版:10月5日,OpenAI发布GPT-5模型升级版“GPT-5 Instant”,大幅加强了模型的共情理解和生成能力,可更温和地识别用户情绪并提供帮助。可以说,这一步让AI聊天更具“人味”,对话体验又进了一步。

-- 点评:这个对AI陪伴类应用不知道是福还是祸?不知道把GPT-5 Instant集成到企业服务机器人中是不是会有比人更好的效果?

OpenAI开放ChatGPT应用SDK:在10月7日的开发者大会上,OpenAI宣布向开发者开放ChatGPT平台,推出Apps SDK。开发者可以在ChatGPT内部直接构建完整的应用(含前端界面和后端逻辑),通过聊天方式调用外部数据和功能。

-- 点评: OpenAI从Plugin、到GPTS再到现在的Apps in ChatGPT,OpenAI开始逐渐了解生态玩法了。对于开发者来讲,显然不能错过这个新的流量机会。

OpenAI发布AgentKit智能体开发套件:同场发布的AgentKit是一套用于快速构建和部署AI智能体(Agent)的工具集。现场演示中,零售商Albertsons用它快速搭建商业分析智能体,在销量下降时自动分析历史趋势并给出建议。

-- 点评:今年是Agent爆发的一年,有生态野心的OpenAI开发一套智能体开发套件是必然的。

OpenAI升级Codex编码助手(GPT-5 Codex版):OpenAI宣布其AI编程助手Codex结束预览测试正式发布(GA),并由专为编程训练的全新GPT-5 Codex模型驱动。可以说,这意味着AI开始真正参与软件开发,自动化程度大幅提升,传统编程正在被重塑。

-- 点评:AI编程领域Claude是处于领先的,不知道GPT-5 CodeX能追上Claude Code吗?

Thinking Machines Lab推出Tinker微调工具:10月1日,由前OpenAI技术负责人Mira Murati领导的Thinking Machines Lab发布首个产品Tinker,一款自动化的AI模型微调工具。Tinker可帮助研究者和开发者轻松基于开源大模型(如Meta的LLaMA和阿里的Qwen)进行定制化训练。

-- 点评:Mira离职后创业的产品围绕开源微调,随着大模型能力的进一步增强,何时需要微调是所有AI应用团队的一个艰难的抉择。

微软推出Microsoft 365 Premium订阅:10月1日起,微软将个人版Copilot Pro整合进Office家族,推出每月$19.99的“Microsoft 365 Premium”订阅服务,包含Copilot聊天、图像生成、Researcher等AI功能。

-- 点评:AI在生产力工具领域的竞争日趋白热化,微软怎么可能放弃这个市场呢?对于一众创业公司,如何找细分和差异化仍旧是生存的核心。

NVIDIA与富士通达成AI基础设施合作:10月5日,英伟达宣布与日本富士通签署战略合作协议,将联合开发面向医疗、制造和机器人等领域的全栈AI基础设施。双方计划通过NVLink Fusion技术实现CPU/GPU高速互联,致力于2030年前完成晶片封装一体化,预计将能效提高两倍。值得注意的是,硬件巨头抱团攻克能耗和散热难题,有望加速下一代AI算力升级。

-- 点评:英伟达现在各种战略合作玩的飞起,全球第一股很会玩。

腾讯混元图像3.0问世并夺得LMArena冠军:10月5日,国际大模型竞技场LMArena最新榜单显示,腾讯于9月28日开源的混元图像3.0在26款模型的全球盲测中排名第一,被评为最佳综合文生图模型。

-- 点评:混元模型算是国庆节期间国内唯一上新闻的AI产品了,文生图模型卷到现在,就看谁的细节处理更好了。

谷歌推出Gemini 2.5 Compute Use: 在智能体时代,谷歌也在自己的Gemini 2.5模型中推出了利用API调用Compute Use的能力。开发者可以利用Gemini 2.5的API直接调用Compute Use工具实现界面操作,据说可以直接完成验证码的输入。Poke的测试说Gemini 2.5 Compute Use领先于其他的竞争对手。

-- 点评:大模型加上Compute Use或者Browser Use,这对传统的RPA企业会造成很大的影响。不过能让很多过去需要人机交互的场景用AI来彻底完成了。

总结

国庆节假期一共8天时间,不过这8天时间AI领域继续一贯的卷,各种大模型能力的进展让我们眼花缭乱。让我们看看接下来第四个季度AI会发展成什么样子吧。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-10-11 15:16 , Processed in 0.092210 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表