大模型日报|OpenAI505员工联名逼宫请奥特曼回归;微软像素级评估GPT-4前沿科研能力;李彦宏AI原生时代的冷思考和热驱动

我爱免费 · 发表于 2023-11-21 17:54

作者：大模型日知录
价值3000元的AI大模型应用开发实战课，来我知识星球299元学

1.OpenAI 505员工联名逼宫请奥特曼回归，Ilya痛悔赶走CEO！威胁董事会立即解散，否则集体跳槽微软

OpenAI的大戏，居然还没落幕？Altman入职微软后，Ilya发文表示后悔，并参与了505名员工的联名信，呼唤Altman回归。

2.微软230页报告，像素级评估GPT-4前沿科研能力：潜力无限速速上车！

微软AI4Science部门发布230页报告，详细描述了GPT-4为代表的大语言模型在生物，药物发现，计算化学，偏微分方程，材料设计等5个科研领域的应用潜力。而且，作者还把目前GPT-4表现不好的地方也贴心地标记出来，防止科研人员踩雷。

论文地址：https://arxiv.org/abs/2311.07361

3.GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还有多远？

在最新的研究中，来自马萨诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力，特别是题目包含图像的考题 —— 这对医疗人工智能系统来说一直以来都是一项挑战。
该研究表明，GPT-4V 不仅超越了 GPT-4 和 ChatGPT 等前辈，还超越了大部分医学生，为人工智能能够作为辅助诊断和临床决策的工具提供了理论上的可能。该研究分析了 GPT-4V 在不同医学子领域的性能。
同时，该研究还指出了医疗人工智能在一致解释方面的局限性，强调了人机协作在未来医疗诊断中的重要性。论文链接：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3
4.李彦宏：AI原生时代的“冷思考”和“热驱动”

两个“冷”思考

第一个，中国的大模型很多，但是基于大模型开发出来的AI原生应用却非常少。有报道说，截止10月份国内已经发布了238个大模型，而6月份的时候这个数字是79个，相当于4个月就翻了3倍。但中国有多少AI原生应用呢？我想在座的各位，很少有人能说出一二个来。如果我们看国外，除了有几十个基础大模型之外，实际上，已经有了上千个AI原生应用，这是在中国市场上没有的。

第二个冷思考，由于没有智能涌现能力，专用大模型的价值其实非常有限。我看到一个现象，很多行业、企业，甚至很多城市都在买卡、囤芯片，建立智算中心，想要从头训练自己的专用大模型。殊不知这样炼出来的大模型是没有智能涌现能力的。因为，只有当你的模型的参数规模足够大，训练数据量足够多并且能够不断投入，进行迭代，才能够产生智能涌现，大模型才能具有触类旁通的能力。也就是说，你没教过的东西，它也会了。所以，大模型的产业化模式，应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型，专用的小模型反应快，成本低，大模型更智能，可以用来兜底。

三个“热”驱动

第一，强大的基础模型，会驱动AI原生应用爆发。

第二，拥抱AI时代，需要由CEO、一把手来驱动。

第三，繁荣的AI原生应用生态，会驱动经济增长。
5.音乐领域的ControlNet开源

ControlNet是一种为图像合成模型提供细粒度控制的新颖方法。现在有一种类似的音乐生成模型，可以让您控制许多特征，如语音和音调。这种新型音乐生成模型可以为音乐家们提供更多的创作可能性，使其更好地掌握音乐创作的过程，实现精准的音乐表达。与ControlNet相似，这种音乐生成模型也能够为用户提供更加灵活的控制方式，使其能够更好地实现自己的音乐创作想法。

https://musiccontrolnet.github.io/web
6.生产级LLM工具开发者指南

使用语言模型构建工具是一种新兴的工程学科，涵盖了高性能计算、GPU编排和监控。在这个领域，LLMs（语言模型）是至关重要的组件，它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用LLMs，包括如何利用GPU高效地扩展LLMs，以及如何实现LLMs的监控和调试。

https://buildingaistuff.com/p/the-developers-guide-to-production
7.AI Exploits：开源的真实世界AI/ML漏洞利用案例

近日，一份名为AI Exploits的GitHub仓库发布，其中包含了一系列真实世界中的AI/ML漏洞利用案例，以帮助人们更好地了解和防范这些漏洞。这个项目的目标是通过公开这些案例来增加人们对AI/ML漏洞的认识，同时也希望能够激发更多人参与到AI/ML安全领域的研究中来。该项目已经收集了数十个漏洞利用案例，其中一些已经得到了对应厂商的修复，而另一些则仍在等待修复。这个代码库的发布也引发了相关领域的讨论和关注，不少专家表示这个项目对于提高人们的AI/ML安全意识具有重要意义。

https://github.com/protectai/ai-exploits
8.DeepMind与YouTube合作推出音乐合成系统

DeepMind在音乐合成领域已经有多年的研究，现在刚刚宣布推出了一个功能强大的新系统。有趣的是，这个系统的很大一部分提升来自于与音乐版权方的数据合作。这意味着，模型在训练时使用了艺术家的音乐，以得到更好的效果，同时确保了艺术家得到了相应的报酬。该模型将以多种形式提供，其中之一是通过YouTube Shorts Studio。

https://deepmind.google/discover/blog/transforming-the-future-of-music-creation
9.Meta公布视频编辑和创作模型

一般情况下，当你使用生成模型生成一张图片后，它不完全是你想要的。然而，使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法，即将所有生成视为指令，从而使编辑功能出现。这与新的模型架构的简单性相结合，是一个不错的进步。

https://ai.meta.com/blog/emu-text-to-video-generation-image-editing-research
10.微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身，使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频、图片、音频等多媒体内容的技术。微软表示这一技术可以用于游戏、电影、教育等领域。

https://techcrunch.com/2023/11/15/microsoft-launches-a-deepfakes-creator
11.SentAlign-大型文档句子对齐工具

SentAlign是一种新的用于对齐大型平行文档中句子的工具，可以高效地处理数千到数万个句子。该工具可帮助研究人员和工业界从大型文本中提取信息，并提高机器翻译等自然语言处理任务的效果。SentAlign使用了一种基于变压缩率的方法来对齐句子，这种方法可以在不占用过多内存的情况下快速处理大型文档。此外，SentAlign还提供了一个用户友好的界面，让用户方便地进行调整。

https://arxiv.org/abs/2311.08982v1
12.Orb 简化 AI 产品的计费问题

大多数公司仍在思考如何为 AI 和 LLM 工具计费。是套餐？积分？代币？无论您选择哪种模型，Orb 都能使其实现起来非常容易。只需选择您的定价模型和计费指标即可！跟踪消费、防止欺诈，并将定价与价值（包括 GPU 运行时）对齐。试用免费沙盒。

https://www.withorb.com/ai

账号		自动登录	找回密码
密码			注册

[计算机] 大模型日报|OpenAI505员工联名逼宫请奥特曼回归;微软像素级评估GPT-4前沿科研能力;李彦宏AI原生时代的冷思考和热驱动

本帖子中包含更多资源

浏览过的版块