萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 158|回复: 0

AI前沿日报|Opera Mini浏览器引入AI助手;腾讯 “元宝” 入驻微信;OpenAI发布多模态模型;谷歌开放Live功能

[复制链接]
发表于 2025-4-18 10:48 | 显示全部楼层 |阅读模式
作者:微信文章
导读

1.Opera 将 AI 助手 Aria 引入 Android 版 Opera Mini 浏览器

2.腾讯 AI 助手 “元宝” 入驻微信,功能丰富

3.OpenAI 发布最强多模态模型 o4 - mini 与满血版 o3,性能卓越功能创新

4.Kimi 团队发布 Kimina - Prover 预览版,引领数学定理证明革新

5.Adobe 战略投资 AI 视频生成领军者 Synthesia,推动企业视频制作变革

6.谷歌 Gemini Live 功能向所有安卓用户免费开放

7.豆包大模型更新,两款前沿模型通过火山引擎开放 API

8.AI 音乐创作引发版权争议,应用与纠纷并存

9.Midjourney 图像编辑器重大更新,多功能升级巩固 AI 创意领先地位

10.谷歌推 Gemini 2.5Flash 预览版,增强推理能力且成本可控



1.Opera 将 AI 助手 Aria 引入 Android 版 Opera Mini 浏览器

挪威浏览器公司 Opera 宣布,其 AI 助手 Aria 正式登陆 Android 版 Opera Mini 浏览器,让低端设备及流量受限用户也能便捷体验 AI。Aria 能帮用户快速获取资讯、了解主题及生成图像,借助整合 OpenAI 和 Google 模型提供相关答案。



2.腾讯 AI 助手 “元宝” 入驻微信,功能丰富

腾讯旗下 AI 助手 “元宝” 正式入驻微信,用户可在微信框搜索或扫码添加到通讯录进行对话。元宝搭载混元和 DeepSeek 双模引擎,依托腾讯混元大模型和 DeepSeek 提供服务,支持聊天、答题。能自动解读转发的公众号文章,解析 100M 以内文件,具备图片识别分析功能。但不支持设置聊天背景、语音 / 视频通话、拉进群聊等,无法修改备注昵称、用其 Logo 当头像,缺少红包等功能,鸿蒙微信 1.0.5 版本暂不支持 。



3.OpenAI 发布最强多模态模型 o4 - mini 与满血版 o3,性能卓越功能创新

OpenAI 正式发布最新且功能最强的多模态模型 o4 - mini 和满血版 o3。这两款模型亮点显著,不仅可同时处理文本、图像和音频,还能作为智能体自动调用网络搜索、图像生成、代码解析等工具,且具备深度思考模式,可在思维链中对图像进行思考。



4.Kimi 团队发布 Kimina - Prover 预览版,引领数学定理证明革新

Kimi 技术团队发布 Kimina - Prover 预览版技术报告,并开源 1.5B 和 7B 参数的模型蒸馏版本、Kimina - Autoformalizer - 7B 模型及修订的 miniF2F 基准测试数据集。Kimina - Prover 由 Numina 和 Kimi 团队联合研发,是一款数学定理证明模型,在形式化定理证明领域采用推理驱动探索范式。

Arxiv 技术报告:https://arxiv.org/abs/2504.11354

GitHub 代码库:‍https://github.com/MoonshotAI/Kimina-Prover-Preview‍

Hugging Face 模型下载:https://huggingface.co/collections/AI-MO/kimina-prover-preview-67fb536b883d60e7ca25d7f9



5.Adobe 战略投资 AI 视频生成领军者 Synthesia,推动企业视频制作变革

英国初创公司 Synthesia 在企业 AI 生成视频领域表现优异,获 Adobe 战略投资。该公司专注于 AI 视频化身技术创新,已是行业佼佼者,年度经常性收入破 1 亿美元。全球 6 万多家公司使用其服务,其中超 70% 是财富 100 强企业,每日能生成大量 AI 视频。Synthesia 平台可让企业用预设或定制的 AI 化身制作生动视频,广泛用于企业培训、沟通、营销等场景。



6.谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布 Gemini 应用中的 Gemini Live 功能免费向所有安卓用户开放。此功能本月初仅对 Pixel 9 和三星 Galaxy S25 用户,且需 Gemini Advanced 订阅才可使用,因积极用户反馈,谷歌决定扩大普及。Gemini Live 能实时识别手机摄像头和屏幕内容并反馈信息,如在水族馆可识别生物并分享相关知识。

7.豆包大模型更新,两款前沿模型通过火山引擎开放 API

豆包大模型发布系列更新,豆包 1.5·深度思考模型和豆包文生图模型 3.0 经火山引擎开放 API,供开发者及企业客户使用。这两款模型在推理、通用任务及视觉推理、图像生成方面达业界前沿水平。

8.AI 音乐创作引发版权争议,应用与纠纷并存

法国流媒体平台 Deezer 数据显示,约 18% 上传歌曲由 AI 生成,每日超 20000 首 AI 曲目上传,数量近四个月前两倍。Deezer 创新负责人称 AI 内容涌入趋势未减,其在一月推出检测工具,筛选 AI 创作曲目,过滤算法推荐中的此类内容。但 AI 在创意产业发展引发法律纠纷,众多艺术家、版权持有者指责 AI 公司未经授权使用其受版权保护作品训练模型。



9.Midjourney 图像编辑器重大更新,多功能升级巩固 AI 创意领先地位

全球领先的 AI 图像生成平台 Midjourney 宣布图像编辑器更新。此次更新全面优化用户界面,新 UI 设计直观流畅,降低学习门槛,提升操作效率与创作体验;新增图层功能,支持分层管理图像不同部分,让创作更灵活精准;引入智能选择工具,利用 AI 算法精准选取图像区域,简化复杂编辑操作;升级 AI 驱动审核机制,智能过滤不当内容,保障创作环境安全;新版编辑器支持直接编辑 MJ 图像,还能上传外部媒体,适用更多创作场景。此外,所有会员等级均可访问新版编辑器。



10.谷歌推 Gemini 2.5Flash 预览版,增强推理能力且成本可控

谷歌在 Gemini 系列中推出全新 Gemini 2.5Flash 预览版,旨在为开发者提供更强推理能力。借助 “思考” 过程,开发者能灵活控制成本与延迟,打造高性价比方案。相比 2.0Flash,Gemini 2.5Flash 在推理能力上升级显著,是谷歌首款全混合推理模型,开发者可自主选择启用 “思考” 功能,并通过设置思考预算,在质量、成本和延迟间找到平衡点。

-end-

感谢收看【AI前沿日报】,每日AI资讯首选平台!我们精选全球10件最值得关注的AI事件,涵盖技术突破、行业趋势与市场动态,助您洞察未来脉搏。探索AI无限可能,从这里开始!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-5-2 17:49 , Processed in 0.054165 second(s), 15 queries , Redis On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表