找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 181|回复: 0

前沿AI速递:世界第一个设计Agent、Cursor发布Bugbot、GitHub推出Spark等更多重磅AI工具更新

[复制链接]
发表于 2025-7-26 17:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
最新大模型进展:
1. NVIDIA发布Llama Nemotron Super v1.5: NVIDIA宣布推出Llama Nemotron Super v1.5,称其在同等权重级别的模型中推动了推理能力的边界,并且是目前可以在单个H100上部署的最佳模型,代码和数据均已开源。

https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

2. Runway推出Aleph: 一种编辑、转换和生成视频的新方式。能够通过对话的方式,对视频进行添加、删除、改变人物视角、环境等多种操作。非常强大。

https://runwayml.com/research/introducing-runway-aleph

3. 通义语音模型: 通义语音团队开源了两个基础语音模型SenseVoice和CosyVoice,其中SenseVoice在中文和粤语的识别性能上优于Whisper。

w1.jpg

4. 通义千问Qwen推出机器翻译模型Qwen-MT 基于Qwen 3打造。

5. OpenAI 的下一代语言模型 GPT-5 预计将在八月初正式发布。CEO 山姆・阿尔特曼透露,GPT-5 的进展顺利,并提到其强大的推理能力令人惊讶。

......

最新AI工具和平台进展:

1. GitHub推出Spark和Copilot更新: 微软CEO萨提亚·纳德拉宣布推出GitHub Spark,这是一个Copilot中的新工具,可以用自然语言将想法转化为全栈应用程序。

w2.jpg

https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers

同时,GitHub Copilot的“野兽模式”(Beast Mode)受到好评,它是一种自定义聊天模式,能赋予Copilot更强的能力。

w3.jpg

https://gist.github.com/burkeholland/88af0249c4b6aff3820bf37898c8bacf

2. Midjourney视频功能更新: Midjourney现在支持创建具有特定开始和结束帧的视频,从而可以制作循环视频,并将视频生成功能引入了Discord。

3. Cursor发布Bugbot: 在过去一个月中,Cursor在人类编写的拉取请求(PR)中发现了超过100万个错误。现在,他们发布了发现这些错误的系统Bugbot,该系统已成为许多领先工程团队(如Datadog、Shopify)必需的合并前检查工具。

w4.jpg

https://cursor.com/bugbot

4. Windsurf: 平台上线了Kimi K2和Qwen3-Coder 480B Instruct模型

5. SiliconFlow: 平台上线了Kimi-K2-Instruct和百度的ERNIE-4.5-300B-A47B模型

6. Pika 正在构建首款纯AI社交视频应用,并已开放早期访问的候补名单。传统社交应用是“人与人连接”的平台,而Pika则开创了“人与AI共同创作”的全新社交范式。

7. 字节 Agent 产品扣子空间上线网页设计功能。

w5.jpg

8. 谷歌发布构建AI应用工具Opal:无需代码用自然语言即可打造AI应用

https://www.opal.so/

9. 世界第一个设计Agent: 全链路智能设计重塑创作体验。Lovart AI 的核心亮点在于其“全链路智能设计”能力,它能够将用户的简单文本描述或模糊创意,转化为一整套专业、像素级精准的设计作品。

w6.jpg

https://www.lovart.ai/

......

最新AI在医学进展:

1. AI在医学教育中的影响: 微软研究院的播客节目“医学人工智能革命,重访”探讨了生成式AI对医学培训的深远影响,涵盖了从课堂学习到临床实践的各个方面。 一位教授表示,与医学生讨论他们对AI在医学中的看法和行动非常有启发性,他们正在积极地学习和应用AI。

2. 微软亚洲研究院在新加坡设立实验室: 该实验室是微软在东南亚的首个研究实验室,将与新加坡保健服务集团(SingHealth)等机构合作开发AI解决方案,并致力于培养本地AI人才。

3. 生物蛋白研究的突破:

ESM3模型: 团队在《科学》杂志上展示了生成式语言模型ESM3,该模型能够对蛋白质的序列、结构和功能这三个基本属性进行推理。目前,ESM3已通过API的公开测试版免费向全球研究人员提供。

DPAC技术: 一种新的方法DPAC通过对比学习来对齐蛋白质和DNA语言模型,然后使用模拟退火直接从序列中设计新的DNA结合蛋白,而无需结构信息。

.....

自动驾驶:

1. 特斯拉的Robotaxi与未来展望: 关于特斯拉Robotaxi的讨论十分活跃。 一位用户分享了他在特斯拉餐厅的体验,认为这正是他想象中未来的样子:为特斯拉充电、享用汉堡、观看电影。 同时,有股东提议特斯拉向xAI投资50-100亿美元。

2. The Boring Company获得安全奖项: 埃隆·马斯克的The Boring Company因其在安全、应急准备和恢复能力方面的卓越表现,获得了美国运输安全管理局(TSA)颁发的最高荣誉——金标准奖。

3. Unitree发布人形机器人: 中国机器人公司Unitree发布了其G1人形机器人,并展示了其完成世界首次“鲤鱼打挺”的视频,显示了人形机器人智能的快速进步。 他们还推出了售价5900美元起的R1智能伴侣机器人,该机器人集成了大型多模态模型。

.....

最新AI技术教程 / 开源项目:

1. 可以直接在Hugging Face模型页面上运行由Together AI支持的Qwen 3 Coder。性能可与业界顶尖的闭源模型如Claude Sonnet 4相媲美。

https://huggingface.co/spaces/androaichain/Qwen-Qwen3-Coder-480B-A35B-Instruct

通义灵码也可以用全新的Qwen3-Coder模型,免费向用户开放,使用量不受限制。用户现在可以在通义灵码AI IDE、VSCode以及Jetbrains插件端轻松体验到Qwen3-Coder带来的高效编程辅助。

2. 一位作者正在与Hugging Face合作撰写一本关于视觉语言模型(VLM)的O'Reilly书籍,并已开放早期章节供社区反馈。

w7.jpg

https://www.oreilly.com/library/view/vision-language-models/9798341624030/

4. Picotron: 这是一个用于4D并行计算的极简教育性代码库,旨在帮助人们以易于理解的方式学习大型语言模型。
https://github.com/huggingface/picotron
https://github.com/huggingface/picotron_tutorial

5. OpenHands: 该项目的一个鲜为人知的功能是它允许用户启动一个前端的网页,然后让智能体通过可视化的方式测试该前端网页,并会自动修复功能确保其正常工作。

https://www.youtube.com/watch?v=jMyTCXpEz10
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-8-4 09:36 , Processed in 0.136564 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表