萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 177|回复: 0

AI商业洞察 | OpenAI新推理模型“幻觉”更严重,准确性引发担忧

[复制链接]
发表于 2025-4-21 13:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
作者:微信文章
01
AI+商业Artificial Intelligence & Bussiness
OpenAI新推理模型“幻觉”更严重,准确性引发担忧
OpenAI最新推出的推理AI模型o3与o4-mini,在编程和数学任务领域展现出了卓越的表现。然而,内部测试结果却暴露出一个不容忽视的问题——它们“幻觉”(即编造信息)的频率相较于前代模型显著升高。

以PersonQA测试为例,o3有33%的回答出现了“幻觉”现象,这一比例远超o1的16%以及o3-mini的14.8%;而o4-mini的“幻觉”率更是高达48%。对于这一现象,OpenAI目前尚未给出明确的解释,为何在推理能力增强的同时,“幻觉”问题却愈发严重。

第三方研究机构Transluce进一步指出,o3甚至会编造“自己运行代码”的详细过程。尽管这些模型在创造性任务方面具有一定优势,但高“幻觉”率无疑将限制它们在法律、商业等对信息准确性要求极高的场景中的应用。

针对这一问题,专家们认为,结合网页搜索能力或许是一条缓解“幻觉”问题的有效途径。OpenAI方面也明确表示,减少“幻觉”仍然是当前研发工作的重中之重。

全球初创企业Q1融资创新高,但2025年市场前景依旧黯淡

据PitchBook的最新数据显示,2025年第一季度,全球初创企业的融资总额达到了915亿美元,环比增长18.5%,这一成绩创下了近十年来第二高的季度纪录。然而,在这看似亮眼的融资数据背后,却隐藏着令人担忧的市场前景。

PitchBook资深分析师Kyle Stanford发出警告称,当前的市场前景比以往任何时候都更加悲观。由于特朗普政府实施的关税政策引发了经济不确定性,加之股市的动荡不安,众多企业的IPO(首次公开募股)计划和大额收购计划纷纷推迟,导致投资者原本期待的资本回流未能如期实现。

值得注意的是,在本季度的融资总额中,OpenAI一家公司就占据了44%的份额,其余九家大型融资公司也合计占据了27%。这意味着,绝大多数初创企业仍然面临着资金获取的困境,甚至可能遭遇估值下调或被低价收购的风险。

分析师们普遍预测,如果经济衰退的趋势持续下去,2025年将有更多的初创企业面临倒闭的危机。

微软发布超高效BitNet AI模型,可在CPU上运行

近日,微软研究人员宣布推出名为BitNet b1.58 2B4T的最新AI模型,是迄今为止规模最大的1-bit AI模型(又称“bitnet”)。该模型拥有20亿参数,采用MIT开源许可证,可在包括苹果M2在内的普通CPU上运行,无需依赖高成本GPU。BitNet通过将权重简化为-1、0、1三种数值,实现极高的内存与计算效率。

据微软测试,该模型在基础数学(GSM8K)与物理常识推理(PIQA)等基准测试中,表现优于Meta、谷歌和阿里巴巴的同级模型。在部分任务中,它的运行速度甚至是同类模型的两倍,内存占用却大幅减少。然而,该模型需配合微软自研的bitnet.cpp框架运行,目前仅支持特定硬件,不兼容GPU,限制了其在AI基础设施中的普及性。

Hence推出AI顾问平台,助企业应对地缘政治风险

随着特朗普政府新一轮关税政策加剧全球贸易紧张局势,近日,英国初创公司Hence AI推出新产品“Hence Global”,利用AI帮助企业识别并管理地缘政治与商业风险。

据悉,该平台每年收费1500美元,远低于传统咨询费用,已被国际律所Pillsbury等采用。Hence Global能根据客户设定生成每日简报,追踪相关新闻、监管动态及市场情绪,并根据企业角色(如客户、竞争对手或供应商)调整分析方式。其背后依托Palantir技术平台,结合多种AI模型实现信息整合与风险预判。Hence联合创始人Sean West称,该工具能在数分钟内完成分析师需耗费一天完成的工作,尤其适合资源型、受监管严格或舆情敏感的企业。该产品已吸引TravelPerk等客户,公司正寻求新一轮融资。

AI视频编辑初创公司Capsule完成1200万美元A轮融资,升级协作功能

近日,视频编辑AI平台Capsule宣布完成1200万美元A轮融资,计划升级其AI视频编辑工具,重点加强品牌内容制作的智能化与协作体验。目前,Capsule总融资额达1975万美元。

Capsule的AI视频编辑助手专为市场营销、销售和媒体团队设计,新版本将引入AI“联合制片人”功能,能够根据用户输入的提示,如“从最近的活动制作一条宣传片”,自动推荐视频片段排序、标题与图像添加位置等,帮助缺乏专业经验的用户轻松制作高质量视频内容。

此外,Capsule还将推出实时协作编辑功能,支持多人同时处理视频的不同部分,进一步提升编辑效率。现有评论功能也允许团队成员在视频时间线上添加批注和反馈。

自2024年10月公测后正式上线以来,Capsule已吸引包括HubSpot、Instacart和Ramp在内的多家知名企业使用。其AI工具集包括自动转录、简介摘要生成、品牌风格标题卡制作、图像生成、文本动画等,广受市场欢迎。

Capsule目前提供免费版与企业订阅版,此轮融资将用于扩充AI工程、产品与视觉设计团队,并加强销售网络布局。联合创始人兼CEO Champ Bennett表示,公司去年的三分之一收入来自客户扩展,反映出产品获得了良好市场接受度。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-5-7 12:09 , Processed in 0.051924 second(s), 15 queries , Redis On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表