找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 426|回复: 0

AI瞭望塔 | 0628-0704一周AI动态速览

[复制链接]
发表于 2025-7-5 07:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
每周5分钟帮你掌握AI最新动向,让我们一起看看最近AI又有哪些新的能力迭代 (๑╹◡╹๑)

前言
AI暸望塔 -本期重点关注
本周我们精选了国内外新的AI产品、应用案例进展。

本期重点关注:

1.Deepmind机器人本地化模型,突破性实现机器人本体独立运行。

2.Hailuo视频agent,技术路线清晰,适合内容创作者提前布局。

3.Claude-Artifacts功能支持作品fork与模板复用,产品经理/创业者可快速验证MVP。

4.凯文·凯利指出:智能眼镜可能成Agent主流入口,5年内AI将具备情绪回应能力。
一、行业瞭望(0621-0627)

1、6月24日,Deepmind 推出新一代机器人AI模型 它可以在机器人本体上独立运行 无需依赖云端计算资源

主要亮点:可以在机器人本体上独立运行,无需依赖云端计算资源。该模型整合了视觉、语言理解和动作决策能力,能够完成高度灵巧且多变的实际任务。

    减少对云计算的依赖 → 降低延迟,提升响应速度。

    在网络不稳定环境下正常运行 → 提高可靠性。

    实现通用操作能力和快速适应新任务 → 提高机器人通用性。


Gemini Robotics On-Device 标志着机器人AI迈入“可用”、“可部署”、“可泛化”的新阶段。

它具有的意义包括:

边缘智能普及化:机器人可以独立思考、执行任务,不再依赖外部服务器。

部署成本下降:适应性强 + 快速微调 → 降低行业应用门槛。

跨硬件统一模型架构:未来可实现一个模型适配各种形态的机器人设备。



二、新AI产品\应用案例

1、Gemini Code Assist 是 Google 推出的一款 AI 编程辅助插件,主要运行于 Visual Studio Code(Visualstudio 插件下载)

主要亮点:

    多语言支持:适用于任意主流编程语言。

    多环境可用:支持常见 IDE、Google Cloud 服务。

    上下文智能感知:响应基于代码当前状态进行优化。

    AI 与安全并重:企业版支持合规、私有化上下文、VPC 安全访问。

    灵活计费:支持免费试用、按需升级。


2、未来 UI 的雏形:实时生成交互界面-Gemini 2.5 Flash-Lite 能在点击瞬间预测并生成下一屏的 UI 和内容,完全基于上下文

3、Hailuo AI 推出 Hailuo Video Agent 无需专业知识和剪辑技巧 通过自然语言一键生成创意视频

主要亮点:Hailuo Video Agent 的技术路线被明确规划为三大阶段,逐步提升定制能力与自动化程度:

阶段一:模版驱动的视频生成(现已开放)

    提供预设 Agent 模板,用户按照提示输入文字或图片内容,即可一键生成精致短视频。

    这一阶段侧重于“即用型”创意体验,适合非专业用户快速上手。

阶段二:半定制型视频生成(计划在夏季推出)

    用户可在模板基础上,对视频的各个部分进行编辑,包括脚本、镜头风格、配音等,提升创作灵活性。

    面向有一定创作需求或审美偏好的用户。

阶段三:完全自动化的视频创作流程(开发中)

    系统可根据用户输入的创意描述,自动生成完整的视频内容,几乎无需人为干预。

    这是面向“从创意到成片”的全流程智能代理愿景。


3、支付宝上线首个「AI 打赏」服务( 蚂蚁百宝箱 | 阿里云百炼)

主要亮点:

    开发者可在智能体中接入打赏功能。

    用户可直接为喜爱的智能体打赏支持。

    依托蚂蚁百宝箱与阿里云百炼平台实现接入。


4、Anthropic Claude 推出Claude Artifacts创作空间和应用发布分享功能(案例:学习伴侣|产品需求文档(PRD)|帮助团队深入剖析问题的助手|解梦机器)

1)Artifacts创作空间:用户可以在里面创建、保存和分享他们用Claude做出来的东西。比如,你可以用Claude创建一个节奏机器(就像视频里展示的),然后分享给别人。

主要功能

    提供一个集中的界面,管理所有 Claude 生成的项目和创作。

    用户可以浏览精选示例(curated examples)。

    所有 Artifact 项目都可以被**“fork”** —— 即复制并进行个性化修改。

    包括多种模板,如游戏、闪卡、编程工具、创意练习等(从截图和视频中可见)。

2)嵌入AI能力:当你创建这些东西时,Claude的AI能力可以直接被嵌入到里面,无需申请API,而且你可以直接发布分享你创建的应用。比如你创建一个学习工具,Claude的AI可以根据用户的技能水平提供个性化的辅导或答案。当你分享这些嵌入AI能力的作品时,其他人可以通过他们的Claude账户使用。这些使用会计入他们的订阅,而不是你的。这样,创建者和用户之间的成本和使用权得到了平衡。

核心功能

    用户可以利用 Claude 的智能,直接在作品中嵌入 AI 功能,创建功能性 AI 应用。

    应用发布后,使用者需使用自己的 Claude 账户登录,从而实现计费独立(不会占用原作者的 token 或额度)。


Claude Artifacts 是一种面向非程序员和产品原型设计者的强大工具。它让你能以最少的开发成本,验证 AI 产品想法,并快速将其呈现为交互式体验。

想从 0 到 1 搭建 AI 应用?这就是最轻量、最快速的方式。

不会写代码但有创意的人:Claude 可以帮你从 0 到 1 快速落地;

产品经理、运营人、内容创作者:不再受限于“有个想法却没人帮忙做”;

开发者:可以快速试验新思路,不再从空白页面起步;

创业者:轻资产验证 MVP,快到飞起。


5、ElevenLabs 发布新一代语音设计工具 Voice Design v3 支持 70+语言 可设计控制各种语音个性

主要亮点:

    允许用户通过文本提示词创建符合角色设定的个性化语音。

    新版本模型具备更高音质、更丰富的表达力。语音角色的个性和韵律(如语气、语速、语调变化、年龄和性别)拥有更细致控制。

    支持 70+语言 和数百种本地口音,适合制作级用途。


6、豆包更新“AI编程”功能,能直接可视化修改网页



7、「抖音搜索」App 升级为「AI 抖音」App

w3.jpg

8、支付宝上线全民级的AI健康管家“AQ”

三、专家访谈\行业会

1、李建忠对话凯文.凯利:AI的进化与颠覆

关键摘要:

    真实世界的数字建模,我们正在用真实世界训练AI,让它们拥有“空间智能”(spatial intelligence),教会它们物理法则、远近概念和三维原理等。我们在未来,会戴上智能眼镜,真正进入那早已存在的世界。

    技术的普遍趋势,就是从通用工具开始,逐步走向更具体、更专业的细分,包括AI,一开始,只有一种“锤子”,它能干所有事。随后,有了各种专门的锤子:大锤、小锤、羊角锤等,有了锤子的“物种大爆发”。相机也是如此,从一种相机,分化出了长焦相机、红外相机、水下相机等等。

    AI的“异人智能”,与人类的智能,即使智能原理等同,也不能将AI和人类划等号,AI的意识,和我们的意识,不会是同一种,AI的创造力,会是一种异人的创造力(幽默感也是)。

    在未来25年的时间尺度里,人类最重要的能力,就是“人性本身”,人类未来的工作,很大一部分就是去管理AI,并替它们承担责任。

    AI下一阶段的核心战争,将是Agent的入口之争,而入口可能是智能眼镜,概念上讲这个入口,就像坐在肩膀上的精灵,看你所看,听你所听,在你耳边轻声提示。

    我们需要一个操作系统,来定义AI时代人机交互的标准,我们需要一个标准的协议,这样无论我们做什么动作、说什么话,在任何地方都代表相同的意义。

    AI将带来的下一个浪潮:空间智能,未来的内容,会向“镜像世界”、向三维沉浸式内容体验迁移。二维的平面内容已经不够,我们想要的是3D,甚至是加上了时间维度的4D。

    未来AI不仅会“生成”内容,它们也会“消费”内容,一些由机器人生成的东西,将只被其他机器人阅读。这会成为未来经济模式的一部分。随着未来全球人口趋于平缓,AI可能成为我们所创造的内容、软件和媒体的“消费者”。它们甚至,会为了阅读未见过的新奇内容,选择付费。

    在未来,也许只要5年,一个更大的冲击即将到来,那就是:AI将是“有情绪”的,它们能回应我们的情绪,并产生情绪上的反应。想象一下你养的狗,它不会说话,但你爱它,它也爱你,你们关系亲密。现在,想象这只狗不仅能说话,还能博览群书,能和你谈天说地,给你建议,解释一切,并且随时愿意陪你玩。

    未来绝大多数机器人,都不会是人形的,但很多可能会是“人类尺寸”,很多机器人会是“人类尺寸”,是因为基础设施,比如门、楼梯,都是为人类尺寸设计的。


AI 眼镜被认为AI 大模型的最佳应用载体之一。AI 眼镜在传统眼镜基础上搭载了人工智能技术,可集成相机、蓝牙耳机、AR 等多重设备或功能。AI眼镜占据人体唯一无接触多模态(视觉+听觉+语言)交互入口,为 AI 大模型落地移动终端硬件的绝佳载体。

2、Sam Altman提醒创业者:ChatGPT将来要做的,大家就绕开吧(视频)

关键摘要:

1)关于 AI 及 ChatGPT 要做的事

    AI 的进化:从问答工具,到全天候智能体,直至「即时软件」的出现,和机器人时代的到来。

    对应策略:先把认知(AI)的部分做到极致,再连接到机器人上。我期待有一天,当用户订阅“最高级的 ChatGPT”时,会免费送一个机器人。

2)创业者的最大机会:抓住「产品与能力」的巨大缺口。

    创业公司的防御性:打造独特领域下「唯一好用的产品」,再去靠品牌、以及「记忆」这类网络效应。不要做翻版 ChatGPT,不要做人人都在做的热门方向。

    招人的“最重要原则”:「招人看斜率,而不是 Y 轴截距」。意味着,看一个人的成长潜力,而非当前光鲜的履历。

推荐阅读:

AI瞭望塔 | 0617-0624一周AI动态速览

什么是大模型后训练
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-10-22 23:09 , Processed in 0.105050 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表