AI前沿日报|Opera Mini浏览器引入AI助手;腾讯 “元宝” 入驻微信;OpenAI发布多模态模型;谷歌开放Live功能

我爱免费 · 发表于 2025-4-18 09:48

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章
导读

1.Opera 将 AI 助手 Aria 引入 Android 版 Opera Mini 浏览器

2.腾讯 AI 助手 “元宝” 入驻微信，功能丰富

3.OpenAI 发布最强多模态模型 o4 - mini 与满血版 o3，性能卓越功能创新

4.Kimi 团队发布 Kimina - Prover 预览版，引领数学定理证明革新

5.Adobe 战略投资 AI 视频生成领军者 Synthesia，推动企业视频制作变革

6.谷歌 Gemini Live 功能向所有安卓用户免费开放

7.豆包大模型更新，两款前沿模型通过火山引擎开放 API

8.AI 音乐创作引发版权争议，应用与纠纷并存

9.Midjourney 图像编辑器重大更新，多功能升级巩固 AI 创意领先地位

10.谷歌推 Gemini 2.5Flash 预览版，增强推理能力且成本可控

1.Opera 将 AI 助手 Aria 引入 Android 版 Opera Mini 浏览器

挪威浏览器公司 Opera 宣布，其 AI 助手 Aria 正式登陆 Android 版 Opera Mini 浏览器，让低端设备及流量受限用户也能便捷体验 AI。Aria 能帮用户快速获取资讯、了解主题及生成图像，借助整合 OpenAI 和 Google 模型提供相关答案。

2.腾讯 AI 助手 “元宝” 入驻微信，功能丰富

腾讯旗下 AI 助手 “元宝” 正式入驻微信，用户可在微信框搜索或扫码添加到通讯录进行对话。元宝搭载混元和 DeepSeek 双模引擎，依托腾讯混元大模型和 DeepSeek 提供服务，支持聊天、答题。能自动解读转发的公众号文章，解析 100M 以内文件，具备图片识别分析功能。但不支持设置聊天背景、语音 / 视频通话、拉进群聊等，无法修改备注昵称、用其 Logo 当头像，缺少红包等功能，鸿蒙微信 1.0.5 版本暂不支持。

3.OpenAI 发布最强多模态模型 o4 - mini 与满血版 o3，性能卓越功能创新

OpenAI 正式发布最新且功能最强的多模态模型 o4 - mini 和满血版 o3。这两款模型亮点显著，不仅可同时处理文本、图像和音频，还能作为智能体自动调用网络搜索、图像生成、代码解析等工具，且具备深度思考模式，可在思维链中对图像进行思考。

4.Kimi 团队发布 Kimina - Prover 预览版，引领数学定理证明革新

Kimi 技术团队发布 Kimina - Prover 预览版技术报告，并开源 1.5B 和 7B 参数的模型蒸馏版本、Kimina - Autoformalizer - 7B 模型及修订的 miniF2F 基准测试数据集。Kimina - Prover 由 Numina 和 Kimi 团队联合研发，是一款数学定理证明模型，在形式化定理证明领域采用推理驱动探索范式。

Arxiv 技术报告:https://arxiv.org/abs/2504.11354

GitHub 代码库:‍https://github.com/MoonshotAI/Kimina-Prover-Preview‍

Hugging Face 模型下载:https://huggingface.co/collections/AI-MO/kimina-prover-preview-67fb536b883d60e7ca25d7f9

5.Adobe 战略投资 AI 视频生成领军者 Synthesia，推动企业视频制作变革

英国初创公司 Synthesia 在企业 AI 生成视频领域表现优异，获 Adobe 战略投资。该公司专注于 AI 视频化身技术创新，已是行业佼佼者，年度经常性收入破 1 亿美元。全球 6 万多家公司使用其服务，其中超 70% 是财富 100 强企业，每日能生成大量 AI 视频。Synthesia 平台可让企业用预设或定制的 AI 化身制作生动视频，广泛用于企业培训、沟通、营销等场景。

6.谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布 Gemini 应用中的 Gemini Live 功能免费向所有安卓用户开放。此功能本月初仅对 Pixel 9 和三星 Galaxy S25 用户，且需 Gemini Advanced 订阅才可使用，因积极用户反馈，谷歌决定扩大普及。Gemini Live 能实时识别手机摄像头和屏幕内容并反馈信息，如在水族馆可识别生物并分享相关知识。

7.豆包大模型更新，两款前沿模型通过火山引擎开放 API

豆包大模型发布系列更新，豆包 1.5·深度思考模型和豆包文生图模型 3.0 经火山引擎开放 API，供开发者及企业客户使用。这两款模型在推理、通用任务及视觉推理、图像生成方面达业界前沿水平。

8.AI 音乐创作引发版权争议，应用与纠纷并存

法国流媒体平台 Deezer 数据显示，约 18% 上传歌曲由 AI 生成，每日超 20000 首 AI 曲目上传，数量近四个月前两倍。Deezer 创新负责人称 AI 内容涌入趋势未减，其在一月推出检测工具，筛选 AI 创作曲目，过滤算法推荐中的此类内容。但 AI 在创意产业发展引发法律纠纷，众多艺术家、版权持有者指责 AI 公司未经授权使用其受版权保护作品训练模型。

9.Midjourney 图像编辑器重大更新，多功能升级巩固 AI 创意领先地位

全球领先的 AI 图像生成平台 Midjourney 宣布图像编辑器更新。此次更新全面优化用户界面，新 UI 设计直观流畅，降低学习门槛，提升操作效率与创作体验；新增图层功能，支持分层管理图像不同部分，让创作更灵活精准；引入智能选择工具，利用 AI 算法精准选取图像区域，简化复杂编辑操作；升级 AI 驱动审核机制，智能过滤不当内容，保障创作环境安全；新版编辑器支持直接编辑 MJ 图像，还能上传外部媒体，适用更多创作场景。此外，所有会员等级均可访问新版编辑器。

10.谷歌推 Gemini 2.5Flash 预览版，增强推理能力且成本可控

谷歌在 Gemini 系列中推出全新 Gemini 2.5Flash 预览版，旨在为开发者提供更强推理能力。借助 “思考” 过程，开发者能灵活控制成本与延迟，打造高性价比方案。相比 2.0Flash，Gemini 2.5Flash 在推理能力上升级显著，是谷歌首款全混合推理模型，开发者可自主选择启用 “思考” 功能，并通过设置思考预算，在质量、成本和延迟间找到平衡点。

-end-

感谢收看【AI前沿日报】，每日AI资讯首选平台！我们精选全球10件最值得关注的AI事件，涵盖技术突破、行业趋势与市场动态，助您洞察未来脉搏。探索AI无限可能，从这里开始！

账号		自动登录	找回密码
密码			注册

AI前沿日报|Opera Mini浏览器引入AI助手;腾讯 “元宝” 入驻微信;OpenAI发布多模态模型;谷歌开放Live功能

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块