找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 129|回复: 0

AI 芯片技术路径

[复制链接]
发表于 2025-12-16 03:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
感谢大家的阅读,希望本文能提供一点价值。建议设置星标,这样就能第一时间收到最新文章。
由于人工智能行业处于快速发展期,人工智能算法尚在不断开展前沿技术探索,因此也涌现了处理不同人工智能任务的芯片。AI 芯片存在不同的技术路径和分类标准,目前尚无统一的划分标准。主流研究机构通常认为 AI 芯片包括通用型、专用型计算架构。
1
通用型技术简介:利用并行处理能力来加速各种计算任务,不局限于特定的应用领域,旨在提供一个灵活的、可编程的平台,能够适应多种不同的计算需求。对应芯片类型:通用GPU技术原理:基于 GPU 强大的多核并行计算能力,通过裁剪 GPU 的图形显示能力,将相应芯片资源设计用于通用计算和张量/矩阵计算, 利用强大的并行处理能力、浮 点、整型计算能力来执行非图形计算任务。具体对于 AI 训练和 AI 推理应用,通过 GPU 的向量、张量、标量等指令组合出训 练或推理需要的运算操作,实现对智能算法和通用计算的支持。在人工智能领域的应用情况:多用于云端智算中心,是训练端的主流选择,也是目前渗透率最高的 AI 芯片类型。在自动驾驶等边缘端领域应用随着自动驾 驶技术的发展逐渐扩大。优缺点 :(1)技术成熟,通用性和灵活性较好,可快速部署、支持算法快速迭代;(2)单个计算核心支持向量、 张量、标量等多种高频计算指令,并由众多计算核心高效配合完成计算任务;可以支撑大量数据的并行计算,适合对数据密集型的应用进行计算和处理,在训练端是主流选择;(3)GPU 架构的软件开发者众多,软件生态更加丰富,生态圈成熟;(4)提供从低精度 INT8/FP8 到高精度 FP64 等各种选项,适用于具有不同精度和混合精度计算要求的工作负载;(5)芯片面积较大,高效率缓存系统简化软件开发者开发难 度的同时需要复杂的设计实现。代表厂商 :英伟达、AMD 等。
2
专用型技术简介:专为特定应用或领域定制的计算架构,旨在针对某一特定任务或一组相关任务进行优化,以提供更高的计算性能、能效和资源利用率。对应芯片类型:ASIC、FPGA技术原理:
ASIC:通过对特定的智能应用和算法的计算和访存特点进行抽取和抽象,定义出一套适用于智能算法的指令集和处理器架构,从而支持人工智能算法和应用
FPGA:通过集成大量的可重构逻辑单元阵列,可支持硬件架构的重构,从而支持不同的人工智能模型。在人工智能领域的应用情况:
ASIC:在云端和边缘端目前处于应用推广期,渗透率低于 GPU,在云端,主要应用于任务明确、 算法固定的场景;在端侧,在手机、可穿戴电子设备等对芯 片面积、功耗较为敏感的设备上有广泛应用。
FPGA:在芯片原型验证与仿真中有着广泛应用, 在 AI 芯片市场渗透率相对 较低。优缺点 :
ASIC:(1)针对特定模型所需算子进行优化定制,在定制化开发完成后,ASIC 在其所针对的特定场景或模型下有更好的适配性,在算力、功耗等方面具备 优势;(2)单个张量计算核心较大, 降低数据通路设计复杂度,提升能效;同等芯片面积下,计算核心数量较少;(3)熟悉特定 ASIC 架构的软 件开发者较少,软件开发门槛高,模型算法快速迭代后算子开发周期长,软件迁移成本较高;(4)人工智能计算通常不使用 FP64,因此大多不支持双精度 浮点运算,混合精度计算开发 难度较高;(5)芯片面积较小,经过优化的模型运行能效较高

FPGA:(1)可无限次编程,延时性较低,依靠可编程性,适用于开发周期较 短的产品,以 及开发试错阶段等; (2)成本、能效、开发环境与主流技术路径仍有差距。代表厂商 :
ASIC:谷歌、华为海思、寒武纪等
FPGA:Intel 、 Xilinx 等

3
总结通用 GPU 具备灵活的指令集和精巧的处理器架构,可覆盖人工智能领域多 元化应用场景,是目前主流的AI 芯片计算架构。根据 IDC 数据,2024 年中国加速服务器市场中 GPU 服务器依然是主导地位,占据 70%的市场份额。从海外大模型厂商的算力布局来看,ASIC 厂商如谷歌的整体算力储备中大部分算力芯片依然为 GPU。 通用 GPU 在人工智能场景具有比较优势,主要系:1)ASIC 等专用型计算架构的设计目的是针对特定场景进行优化,其在更多维的计算类型和场景中适应性较低,通用性能不足。考虑到人工智能算法正处于不断发展演进的过程,模型结构并未固化,大模型的迭代速度持续加快、迭代创新日趋频繁,算子也随之快速变化,通用 GPU 相较 ASIC 等专用型计算架构能更高效适应算法快速更迭的 环境。2)在云端,服务器需要服务下游不同的应用场景,客户快速迁移、大规模复制的能力更为关键,因此对 AI 芯片的通用性和灵活性要求较高。 随着云端智算集群的需求快速扩张以及后训练、推理等阶段新模型结构的快速演变,具有更强通用性、灵活性和可扩展性优势的通用 GPU 仍将是未来主流 的 AI 芯片技术路径之一。
资料来源:沐曦股份首次公开发行股票并在科创板上市招股说明书

免责声明:本公众号对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,且不构成任何投资建议,对于使用该信息而引发或可能引发的损失将由投资者自行承担。投资者不应以该等信息取代其独立判断或仅根据该等信息做出决策。同时,我们尊重原创。文字图表等素材,版权属于原作者或其代理人。若涉及版权问题,敬请联系我们,立即做删除处理。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-17 00:36 , Processed in 0.084788 second(s), 27 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表