找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 98|回复: 0

【12月17日AI早报】英伟达发布用于智能体AI的Nemotron 3开源模型

[复制链接]
发表于 2025-12-17 02:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
w1.jpg

早上好。在人工智能淘金热中出售铁锹的公司也迈出了一大步,开始亲自挖矿了。

凭借其全新强大(且完全开源)的Nemotron 3模型,Nvidia正为西方开发者提供他们一直缺失的竞争性选择——同时确保他们在使用过程中持续依赖其硬件。

今日AI动态简报:

• 英伟达发布用于智能体AI的Nemotron 3开源模型

• AI推理模型在CFA考试中取得优异成绩

• 使用 Cursor 的新编辑器设计更出色的网站

• Perplexity 研究揭示用户如何使用 AI 智能体

• 4款新AI工具、社区工作流等

今日要闻

NVIDIA
🤖 英伟达发布用于智能体AI的Nemotron 3开源模型

w2.jpg

图片来源:Nvidia

The Rundown:Nvidia刚刚推出这是其Nemotron 3系列,一个专门为构建多智能体AI系统设计的开源模型家族——标志着这家芯片制造商在尖端模型开发领域迄今最重要的推进。

为何重要:美国封闭式实验室正越来越多地自主研发芯片,而中国领军企业则在全球开放模型应用领域占据主导地位。Nvidia发布强大且完全开放的模型,为西方开发者提供了具有竞争力的开源选择,同时也促使他们在此过程中持续基于Nvidia硬件进行开发。

• 该系列包含三种规模:Nano(300亿参数)、Super(1000亿参数)和Ultra(5000亿参数),其中Nano版本现已推出,更大规模版本将于2026年发布。

• Nano在编码和指令遵循基准测试中超越了类似规模的模型,如Qwen3-30B,同时其响应生成速度也快了三倍以上。

• 与大多数封闭的美国竞争对手不同,Nvidia 在发布模型的同时,也公开了训练数据、微调工具和强化学习环境。

• 这家芯片制造商将 Cursor、Perplexity、ServiceNow 和 CrowdStrike 列为在编码、搜索、企业自动化和网络安全领域的早期采用者。

人工智能与金融
🤑 AI推理模型在CFA考试中取得优异成绩

w3.jpg

图片来源:Reve / The Rundown

The Rundown:一项新研究刚刚发现六款领先的AI模型现已通过特许金融分析师(CFA)认证考试全部三个级别的测试,其中Gemini 3.0 Pro在一级考试中创下97.6%的历史最高分。

为何重要:在标准化考试中取得优异成绩与应对金融分析的日常需求仍是两码事,但这些考试中模型进步的速度令人惊叹——掌握金融知识的模型可能将行业价值转向人类技能,例如客户判断与关系管理。

• 研究人员测试了GPT-5、Gemini 3.0 Pro、Claude Opus 4.1、Grok 4和DeepSeek-V3.1在涵盖所有考试等级的980道题目上的表现。

• GPT-5在二级测试中以94.3%的成绩位居榜首,而Gemini 3.0 Pro在最难的建构式回答部分以92%的表现占据主导地位。

• 2023年,GPT 3.5未能通过前两个级别,而GPT-4仅通过了第一级——从这一水平跃升至接近满分的成绩大约花费了24个月。

• An 纽约大学研究9月的测试也显示有模型通过了全部三个级别,但得分在70多分,而当前前沿系统的得分接近满分。

AI 训练
🎨 使用 Cursor 的新编辑器设计更出色的网站

w4.jpg

The Rundown:了解如何快速设置并使用 Cursor 的全新可视化设计编辑器来优化您的前端设计,无需再与 Figma 等设计工具来回切换。

专业提示:请确保在使用过程中通过 Git 保存你的进度。Git 能让你更轻松地回滚任何不需要的样式更改,你甚至可以要求智能体为你编写 Git 提交信息。

1. 在 Cursor 中新建一个包含 HTML 和 CSS 文件的项目(需要最新更新)—— 要求 Cursor 智能体构建一个简单的index.html + styles.css或使用模板

2. 安装实时服务器扩展:点击CMD+Shift+P搜索"Open with Live Server",然后复制URL并粘贴到Cursor浏览器中。CMD+Shift+B)

3. 开启元素选择器,点击任意元素即可在设计面板中编辑属性,或在当前聊天中告知智能体您希望进行的修改。

4. 点击应用以使代理进行更改——点击“保留”或“全部保留”以保存(代理会自动更新类,因此更改将应用于所有匹配的元素)

人工智能研究
📊 Perplexity 研究揭示用户如何使用 AI 智能体

w5.jpg

图片来源:Perplexity

The Rundown:Perplexity 与哈佛大学刚刚已发布一项针对该公司Comet浏览器用户如何使用AI代理的研究发现,使用主要集中在认知工作和研究上,而非自动化简单任务。

为何重要:在AI智能体兴起的浪潮中,我们经常看到预订航班/门票、订购杂货和处理日常任务等用例。但Perplexity的研究(可能与ChatGPT或其他助手的倾向有所不同)显示,用户更倾向于将其用于深度工作场景,而非个人生活便利。

• 研究人员分析了自七月上线的Perplexity Comet浏览器中数亿条匿名查询数据。

• 超过半数的查询涉及研究或工作流程管理,常见任务包括总结、文档编辑和课程作业协助。

• 科技工作者、学者、市场营销人员和金融专业人士构成了活动的主体,其采用率与国内生产总值和教育水平相关。

• 随着时间的推移,用户行为发生了变化,那些最初以旅行规划等休闲查询开始的用户,后来往往转向更深入的知识型工作。

其他快讯

近期热门 AI 工具

•  📊 Quadratic- 为你代劳的AI电子表格。将原始数据转化为洞察与可视化,无需忍受旧工具的繁琐。

📚 Gemini深度研究助手 - Google用于长期上下文收集与合成任务的SOTA智能体

•  🤖 Nemotron 3- Nvidia 新推出的开源模型系列,专为构建多智能体系统而设计

•  🚀 Manus 1.6- 针对复杂智能体工作的新性能升级

今天人工智能领域的其他快讯

Merriam-Webster 评选‘Slop’为2025年度词汇,其定义为“通常由AI批量生成的低质量数字内容”。

美国人事管理办公室推出"科技力量"计划,旨在招募1000名处于职业生涯早期的AI和软件工作者进入联邦政府岗位。

Manus 已发布其AI代理平台推出1.6版本,新增移动应用开发功能与可视化设计编辑器,同时实现了性能提升。

Klarna 推出Agentic Product Protocol,一个开放标准,让AI助手能够访问超过1亿个跨商家的产品。

AI2 已发布Olmo 3.1是其开源模型系列的升级版本,该实验室声称这是“最强大的完全开源推理模型”。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-17 08:25 , Processed in 0.093727 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表