找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 153|回复: 0

【AI早报 2025-06-04】OpenAI 代理开发工具与语言模型功能更新

[复制链接]
发表于 2025-6-4 01:12 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
AI早报 2025-06-04

目录

    OpenAI 代理开发工具与语言模型功能更新Hume AI 发布 EVI3:情感智能语音交互新标杆ElevenLabs 推出 Conversational AI 2.0:企业级语音交互平台英伟达与麻省理工学院合作推出 Fast-dLLM 框架,大幅提升 AI 推理速度智源研究院开源轻量级超长视频理解模型 Video-XL-2Cerebras 推理 API 全面开放,每日提供百万免费 TokenGoogle 开源 Deep Research 模板并更新 AI 用例库Anthropic 为 Claude Pro 带来深度研究与集成功能You.com 的 ARI 深度研究代理表现出色新加坡国立大学推出 OmniConsistency:低成本实现图像风格化一致性YouTube 官方推出 AI 生成摘要功能Google NotebookLM 新增公开分享功能小米将多枚“Kimi”商标转让给月之暗面
OpenAI 代理开发工具与语言模型功能更新


OpenAI 更新了代理开发工具和语言模型功能,包括 Codex 的互联网访问和长期记忆功能开放。

Codex 现已向 ChatGPT Plus 用户开放,新增互联网访问功能(默认关闭)。OpenAI 提醒用户注意潜在安全风险,如提示注入、信息泄露等。为降低风险,用户可设置域名白名单并限制 HTTP 请求方法(仅允许 GET、HEAD 和 OPTIONS)。

OpenAI 发布了 TypeScript 版本的 Agents SDK,并引入 RealtimeAgent 功能。Realtime API 新增 Traces 支持,语音转语音模型也得到改进。即将推出两款新音频支持模型:gpt-4o-audio-preview-2025-06-03 和 gpt-4o-realtime-preview-2025-06-03。

ChatGPT 的长期记忆功能已向所有免费用户开放,模型可访问完整聊天历史记录,提供更个性化响应。

https://platform.openai.com/docs/codex/agent-network

Hume AI 发布 EVI3:情感智能语音交互新标杆


Hume AI 发布第三代语音交互模型 EVI3,以卓越情感理解能力引发关注。

EVI3 是多模态语音语言模型,集语音转录、推理和语音合成于一体。支持30多种复杂语音风格,推理延迟低至300毫秒。在1720人盲测中,EVI3 在七个维度上超越 GPT-4o。

模型通过分析用户语音的音调、节奏和音色精准捕捉情绪状态,调整回应语气。Hume AI 使用强化学习技术和10万+语音样本优化了音高、语速和情感风格。

EVI3 已通过 iOS 应用和在线演示平台开放体验,API 接口即将推出。计划优化多语言能力,支持法语、德语等。

https://demo.hume.ai/

ElevenLabs 推出 Conversational AI 2.0:企业级语音交互平台


ElevenLabs 发布 Conversational AI 2.0,提供更自然、智能的语音交互体验。

平台引入轮流对话模型,实时分析用户语音提示,避免传统系统中的停顿或打断。支持32种语言的高质量语音合成,无需手动配置即可实现多语言无缝切换。

集成检索增强生成(RAG)技术,实时从企业知识库提取信息。推出批量通话功能,支持同时向数千客户发起个性化语音通知。

平台具备 HIPAA 合规性和欧盟数据驻留支持,提供 WebSocket API 和多种 SDK(JavaScript、React、Python、iOS)。

https://elevenlabs.io/blog/conversational-ai-2-0

英伟达与麻省理工学院合作推出 Fast-dLLM 框架,大幅提升 AI 推理速度


英伟达联合 MIT 和香港大学发布 Fast-dLLM 框架,推理速度最高提升27.6倍。

框架引入两项核心创新:
技术描述
块状近似 KV 缓存机制将序列分块,预先计算并存储激活值
置信度感知并行解码策略根据阈值选择性解码高置信度词元

在 GSM8K 数据集上,生成长度1024词元时实现27.6倍速度提升,准确率76.0%。在 MATH 基准测试中,加速倍数6.5倍,准确率39.3%。

https://nvlabs.github.io/Fast-dLLM/

智源研究院开源轻量级超长视频理解模型 Video-XL-2


智源研究院开源 Video-XL-2 模型,实现长视频理解技术突破。

模型架构:
组件技术细节
视觉编码器SigLIP-SO400M
动态 Token 合成模块DTS
大语言模型Qwen2.5-Instruct

优化策略包括分段式预装填和双粒度 KV 解码机制。单张24GB显卡可处理千帧视频,80GB显卡支持万帧输入。在主流评测基准上超越现有轻量级开源模型。

https://unabletousegit.github.io/video-xl2.github.io/
https://huggingface.co/BAAI/Video-XL-2
https://github.com/VectorSpaceLab/Video-XL

Cerebras 推理 API 全面开放,每日提供百万免费 Token


Cerebras 推理 API 全面开放,每日提供100万免费 Token。

API 推理速度可达 GPU 的20倍,运行 Llama4Scout 模型时生成速度超过2600 Token/秒。支持 Llama4 和 Qwen3-32B 等主流开源模型。

Cerebras 在北美和欧洲新建六大数据中心,推动生成式 AI 在医疗、金融等领域的应用。

Google 开源 Deep Research 模板并更新 AI 用例库


Google 开源基于 Gemini 2.5 的 Deep Research 模板,更新 AI 用例库至601个案例。

Deep Research 模板特点:
    多轮反思能力自动判断信息充分性答案来自实时网页数据并标注引用前端:React/Tailwind CSS/Shadcn UI后端:LangGraph 驱动 Gemini 模型逻辑

https://github.com/google-gemini/gemini-fullstack-langgraph-quickstart
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Anthropic 为 Claude Pro 带来深度研究与集成功能


Anthropic 为 Claude Pro 新增深度研究和集成功能。

功能包括与远程 MCP 服务器的自定义集成,以及 Zapier、Asana 等预构建服务器集成。可将数小时研究缩短至数分钟。正在开发代号“FIDDLEHEAD”的新集成,可能是 Slack 工作空间的 Claude 集成。

推出“Claude Explains”技术博客,展示 Claude 写作能力。

https://www.anthropic.com/claude-explains

You.com 的 ARI 深度研究代理表现出色


You.com 的 ARI 研究代理提供三倍以上引用,能从500+来源生成 PDF 报告。

输出完全可追溯和可审计。可连接到 Crunchbase、Drive 等工具,适用于并购、尽职调查等场景。

新加坡国立大学推出 OmniConsistency:低成本实现图像风格化一致性


NUS 发布 OmniConsistency,低成本复现 GPT-4o 的图像风格化一致性。

仅用2600对高质量图像和500小时 GPU 算力训练。模块化架构兼容各种风格化 LoRA 模块。

https://github.com/showlab/OmniConsistency

YouTube 官方推出 AI 生成摘要功能


YouTube 推出 AI 生成视频摘要功能,帮助用户快速了解内容。

Google NotebookLM 新增公开分享功能


Google NotebookLM 支持公开分享笔记、学习指南和团队文档。

https://goo.gle/4mKTrjm

小米将多枚“Kimi”商标转让给月之暗面


小米将多枚2013年申请的“Kimi”商标转让给北京月之暗面科技有限公司。

作者@橘鸦Juya,如果AI早报对你有所帮助,欢迎点赞、关注、分享。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

我是开心果

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-6-6 05:28 , Processed in 0.089028 second(s), 28 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表