Moonshot AI推出名为“Kimi Linear”的48亿参数混合架构模型(Kimi-Linear-48B-A3B-Base/Instruct),交错使用Kimi Delta Attention(KDA)和Modified Linear Attention(MLA),实现75%的KV Cache减少,并在1M上下文下将解码吞吐量提升6.3倍,RULER基准得分84.3%。解决了长上下文处理和高效推理的行业痛点,被视为“智能体时代注意力机制的新起点”,提升AI模型训练效率和应用扩展,引发全球技术社区深度讨论,推动线性注意力架构的创新。
4. Perplexity AI Sonar Pro Search模式(2025年10月30日)
Perplexity AI与OpenRouter独家合作推出Sonar Pro Search模式,支持多步骤代理推理、动态工具执行、实时思想流传输和自适应研究策略,允许模型根据需求执行多次实时搜索,提升复杂查询处理能力。强化AI在信息检索和研究中的作用,提升搜索适应性和深度,激发开发者社区讨论,推动代理式搜索技术的进步和知识获取效率。
Anthropic扩展Claude for Financial Services,包括beta版Excel插件(支持单元格数据交互)、实时市场连接器(集成LSEG、Moody's等数据源),以及预置代理技能如现金流建模、DCF分析和投资报告生成,提供更高透明度和实时洞察。成为垂类AI应用的标杆,提升金融行业决策效率和合规性,推动AI在专业领域的渗透,影响金融科技生态和企业级应用创新。
7. Hailuo AI MiniMax Music 2.0发布(2025年10月31日)
Hailuo AI发布MiniMax Music 2.0生成式音乐平台,可生成长达5分钟的专业级歌曲,支持逼真合成人声、多乐器控制,风格覆盖流行、爵士等;同时发布Speech 2.6(延迟<250ms,支持语音克隆和情感表达)和Hailuo-2.3-fast图像到视频模型(Video Arena排名第7)。推动多模态AIGC创新,成为AI生成内容新热潮,相关演示在社区广泛传播,影响媒体创作工具和娱乐行业数字化转型。
四、算力、AGI路线图与行业标准
8. OpenAI AGI发展路线图(2025年10月28日)
CEO Sam Altman概述AGI路线图,设定两个高风险、高影响力的内部里程碑:目标在2026年9月前实现自动化AI研究实习生级别能力,并在2028年3月前达到具备真正自动化AI研究员的完整能力。同时承诺部署约30 GW算力,总拥有成本高达1.4万亿美元,长期目标扩展至125 GW。为AGI实现提供了明确时间表和计算资源规划,是全球AI研究的核心参考,激发行业对AGI进度的热议,推动计算基础设施投资和研究方向调整。
9. Agent Data Protocol (ADP)发布(2025年10月28日)
Neulab发布Agent Data Protocol (ADP),一个统一代理监督式微调数据集的标准,包含127万条轨迹(约360亿token),覆盖13个数据集;实验显示平均性能提升20%,在OpenHands、SWE-Agent等基准达SOTA水平,无需领域特定调优。降低代理数据整合成本,推动AI代理生态标准化和发展,是基础性进步,提升模型训练效率和跨框架兼容性。
Neulab于2025年10月29日发布Agent Data Protocol (ADP),这是一个用于代理监督式微调(SFT)数据集的统一开放标准。它包含127万条轨迹(约360亿token),覆盖13个数据集,并已进行规范化处理,以兼容编码、浏览和工具使用等框架。实验结果显示,平均性能提升了20%,在OpenHands、SWE-Agent和AgentLab上达到或接近SOTA水平,且无需领域特定调优。
DSPy社区于本周持续强调“Programming, not Prompting”原则,突显其在结构化任务中的优势。该原则有利于模型升级(例如从gpt-4o升级至4.1),并可有效避免提示工程中因模式变更而导致的工作重置。一位社区成员分享了一个案例:他避免了在签名文档字符串中写入冗长的示例(6881字符、878词),而是利用DSPy Example的结构化编程方式进行了定义。
Hugging Face于2025年10月30日发布《The Smol Training Playbook》,一份214页的全面指南,由其科学团队总结,专注于小型语言模型训练的实际经验。该手册覆盖完整的LLM流水线:预训练数据策展,包括数据清洗和多样性优化;模型架构选择,如多查询注意力(MQA)、分组查询注意力(GQA)、修改线性注意力(MLA)、旋转位置编码(RoPE)、Yarn扩展、NoPE无位置编码,以及SSM混合架构;后训练阶段,从监督微调(SFT)到DPO、KTO、ORPO和RLHF;稳定性优化技巧,如z-loss正则化和QK-Norm;MoE扩展,涵盖专家粒度、负载均衡和路由优化;中期训练干预与自适应数据混合;基础设施调试,涵盖数据并行(DP)、张量并行(TP)、管道并行(PP)、FSDP,以及NVLink、InfiniBand和GPUDirect等硬件优化。社区反馈强调,该手册揭示了论文中常被忽略的实际陷阱,如形状不匹配、数据洗牌错误和调试策略,并提供了开源代码和实验结果。
Google Cloud于2025年10月22日更新安全公告,披露了Vertex AI API在2025年9月23日发生的一项技术问题,造成少量流式响应被错误路由至不同用户,主要影响第三方模型。此事件源于HTTP Expect:100-continue desync,这强调了API安全在AI部署中的重要性。
Windows用户在Nous Research AI Discord和Smol AI社区中于2025年10月30日反馈,本地模型训练面临依赖性问题,例如LF文件格式错误和WSL环境损坏,导致代理无法识别工具。建议切换至Linux或WSL以避免这些问题;Modular Mojo Discord指出Windows支持较少,因其非Unix结构和GPU通信规则增加了开发复杂性。
更多交流,可加本人微信
(请附中文姓名/公司/关注领域)
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.