找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 176|回复: 0

阿里千问“驻桌”,构建AI生态入口 | 每周AI信息参考(11.24-11.30)

[复制链接]
发表于 2025-12-1 14:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
01  阿里千问“驻桌”,构建AI生态入口
11月26日,阿里千问大模型与夸克AI浏览器完成深度融合,成为常驻电脑桌面的智能助理。这次整合使千问大模型成为夸克AI浏览器的系统底座,用户在浏览器首页搜索框和侧边栏可直接调用,还能通过桌面千问大模型调用读屏、快捷框、侧边栏、悬浮球、划词和截屏六大智能套件能力,将AI能力贯穿于搜索、阅读、文档撰写、文件处理等高频场景。阿里表示,此举是千问项目的关键落子,旨在将千问打造成贯穿其所有C端产品的统一AI引擎,重构PC生产力,构建AI生态入口。02   DeepSeek开源数学推理模型,严谨度提升72%11月27日,DeepSeek开源数学推理模型DeepSeekMath-V2,该模型采取自验证数学推理训练框架,构建了“生成器—验证器—元验证器”三位一体自循环架构,具有自我纠错、严谨推理能力,打破了只求答案不重过程的局限。实验数据显示,自验证机制将推理严谨性提升72%,同时效率提升8倍以上。该模型的代码与权重已同步至GitHub和Hugging Face。业内认为,这将加速自验证技术的普及。03  腾讯混元OCR模型开源,支持14种小语种翻译11月25日,腾讯混元开源HunyuanOCR模型。该模型依托混元原生多模态架构打造,由原生分辨率视频编码器、自适应视觉适配器、轻量化混元语言模型三部分组成;采用端到端理念设计,各项功能仅需单次前向推理即可直达最优结果。其参数量仅为1B,多项核心能力达到SOTA效果。其在复杂文档解析的OmniDocBench测评中获94.1分;文字检测和识别能力在自建文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频等九大应用场景基准上表现突出;支持14种高频小语种翻译中文或英文的效果,并且取得ICDAR2025端到端文档翻译比赛小模型赛道冠军,可应用于票据字段抽取、视频字幕识别、拍照翻译等场景并能进行对应格式解析输出。04  DynaAct革新大模型推理方法
即将举行的2025年NeurIPS会议(神经信息处理系统大会)接收了来自蚂蚁和香港大学自然语言组的研究团队的论文《DynaAct: Large Language Model Reasoning with Dynamic Action Spaces》。与传统token-by-token式的CoT不同,DynaAct提出以Action Space Optimization(动作空间优化)为核心的TTS(Test-Time Scaling)范式:在每一步推理中动态构建可选动作集合,并通过学习算法从中选择最优动作,从而让推理路径更高效并更具结构化。该推理方法通过动态构建动作空间优化测试时扩展,与传统的长思维链方法不同。实验表明,在多个基准测试中,该方法优于现有技术,并且随着搜索次数的增加表现出稳定的性能提升趋势。05  谷歌发布Gemini 3
北京时间11月19日凌晨,谷歌发布其最新一代人工智能模型Gemini 3。在应用场景上,该模型突出学习、构建、规划三个方向。在学习领域,依托100万token的上下文窗口(相当于约75万个单词),Gemini 3可处理长篇学术论文、多个小时的视频讲座,并将其转化为交互式学习材料。据称,构建能力是Gemini 3“被看好”领域,谷歌称其为“打造过的最好的氛围编程(vibe coding)和智能体编程模型”。为配合Gemini 3发布,谷歌同时推出全新开发平台Antigravity。Antigravity旨在让开发者从繁琐的编码细节中“悬浮”起来,在更高任务层面操作。在这个平台上,智能体(agent)被提升到一个专门界面,能够直接访问编辑器、终端和浏览器,自主规划和执行复杂的端到端软件任务,同时还能验证自己生成的代码。规划能力则体现在Gemini 3对长期任务的把控上。在发布后的采访中,DeepMind CEO德米斯·哈萨比斯表示,在通往AGI(通用人工智能)的道路上,谷歌正在“深入个性化、记忆和语境(Context)”。


附录
人民网、传播内容认知全国重点实验室智能产品主流价值语料库:赋能大模型价值观对齐。优选入库3200多万篇基础语料、32万对问答语料、500多万对图文语料,已在一批主流大模型厂家得到应用验证。人民智媒大模型:面向党政服务、媒体服务的大模型应用基座。基本解决大模型政治方向、舆论导向、价值取向、事实幻觉等问题,能够协助党政机关、企事业等单位构建各类模型。“写易”智能创作引擎:面向公务人员、媒体从业者、国企管理者等用户,提供智能写作、智能审校、写作素材知识库调用等服务。“自在”心理疏导大模型:提供心理疏导、情绪管理、亲子交流和家校共育等服务,已上线国家智慧教育公共服务平台。校园端支持家校心理数据统计与筛查分析。人民审校和内容风控大脑:提供时政信息表述审校、综合信息审校等内容安全服务,支持文本、图片、音视频等多模态内容审校,可在内容发布前辅助审校,也可在内容发布后开展多平台巡查和风险筛查。“初芯”智能体平台:集大模型应用、知识管理、智能开发于一体,具有意识形态安全、数据隐私保障、一站式零门槛、赋能深度场景优势,智能体可用于智能传播、智慧舆情、文旅健康、生活服务等各类场景。“初见”智能体:汇聚三甲医院专家科普以及国家卫生健康委、体育总局推荐的体重和健身知识,提供健康体重管理建议和多元健身课程,是一款简单实用的健康体重管理助手。AI经贸文旅智能体:形成平台、数据、算力、算法、模型、智能体“六位一体”创新架构,提供多语种智能翻译服务,实现政策智能查询、智能商贸匹配、智能展销、智能行程规划等应用,满足经贸文旅领域多维度需求。已在广西桂林、宁夏银川落地。智能硬件“AI之眼”:集成麦克风、摄像头等传感器,面向文博智能导览、户外活动和运动场景,实现多模态交互、智能讲解、导航导览三大核心功能。人民数据确权“三证”:通过108项数据确权实质性审查,为符合审查条件单位颁授“数据资源持有权证书”“数据加工使用权证书”“数据产品经营权证书”,支持快速融资。业务合作联系方式
电话:010-65368401  
邮箱:yjy@people.cn来源|人民网研究院
w1.jpg
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-17 09:54 , Processed in 0.090450 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表