据悉,AI算力设备,超聚变布局覆盖单台小站、单台服务器,再到集群。超聚变近期还展示了X3 8000智能工作站、超聚变 KunLun Pro for AI整机液冷AI集群。近日,IDC中国发布《IDC中国液冷服务器市场追踪报告(2025年上半年)》,超聚变在中国标准液冷服务器市场位居第一,在整体液冷服务器市场位居前三。
丁元钊指出,客户在AI落地的关键痛点是:一是算力的安全性,有可选的算力,国产和非国产的都可以;二是围绕Token如何快速实现,实现Token的快速输出和优化;三是针对一些中小场景,很多客户希望是开箱即用。针对客户痛点,超聚变推理加速技术有三大方向。一、框架调参模版话,内置主流模型、AI加速卡推理加速模版,上下游都是开源的,不管是底层芯片、上层的大模型,都是持续和国内、国际厂商合作;二、GPU切分复用,支持英伟达、华为等主流厂商,单卡承载多个小模型,大幅度降低部署成本,提升卡的利用率;三、以存促算,提升多轮对话推理性能,降低部署成本。