找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 238|回复: 0

AI大模型药物研发:从辅助工具到核心生产力

[复制链接]
发表于 2025-6-16 12:29 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
w1.jpg

w2.jpg

w3.jpg

w4.jpg

引言:AI通过靶点发现、分子设计、临床试验优化等全链条赋能,直击传统新药研发面临的周期长、投入大、成功率低的痛点,其技术价值得到广泛认可,并已跨过“讲概念”的初期阶段进入技术验证期。生成式AI与大模型的广泛应用以及AI接连获得诺贝尔物理学奖和化学奖等事件,为AI大模型制药注入新的生机。在AI逐渐从“辅助工具”升级为药物研发的“核心生产力”的背景下,结构性的投资机会日趋显现。

w5.jpg

w6.jpg

01

基本概念

w7.jpg

AI 制药(AIDD,即 AI drug discovery)是指将机器学习、自然语言处理及大数据等人工智能技术应用到制药领域各个环节,显著优化新药研发的效率及质量,降低临床失败概率及研发成本。

w8.jpg

02

技术原理



当前驱动AI制药公司的技术分为两类:一类是以人工智能算法为核心技术,在硬件设备的支持下和各类生物数据库的基础上开发模型进行新药研发;另一类是以前沿生物技术为核心,人工智能作为提高效率的工具辅助新药分子的发现和设计。

w10.jpg

图1.AI制药技术原理(资料来源:海通国际,华医研究院整理)

通过改进信息提取、文本分类、文本摘要和情感分析等能力,AI驱动的语言模型显著加速和优化了药物发现和开发过程,提高了效率,降低了成本,并增加了成功率。

w11.jpg

图2.药物发现和开发中的人工智能语言模型(资料来源:AI-based language models powering drug discovery and development,华医研究院整理)

w12.jpg

03

发展历程



2010以前,AI制药尚处于萌芽阶段,中国以学术研究为主。传统药企对AI技术关注有限,药物研发仍依赖高通量筛选和实验验证。2010 - 2015年,大数据和云计算技术兴起,跨国药企在华设立研发中心,引入早期AI工具。本土企业开始尝试AI辅助的虚拟筛选,但应用范围有限。

2016 - 2020年,AlphaFold引发的AI热潮推动深度学习在药物研发中的应用,风险投资关注AI制药赛道,初创企业崛起,AI制药快速发展。

2020年至今,AI制药爆发增长,AI加速抗病毒药物和疫苗研发,老药新用研究中AI快速筛选潜在候选药物。AlphaFold3、Evo2等生命科学领域的大模型引发关注,生成式AI与大模型在制药领域被广泛应用。

w14.jpg

图3.AI技术在制药行业的应用发展历程(资料来源:Deep Pharma Intelligence,华医研究院整理)

w15.jpg

04

应用场景



01

靶点的发现和识别


    多组学分析和药物靶点预测: AI算法可以一定程度上跨越多组学数据中存在的“维数灾难”,通过多维度组学数据的整合和高通量功能筛选能够更加系统地发现与临床密切相关的靶点。

    基于序列的蛋白质可药靶性的发现:具有相似序列的蛋白质在一定程度上具有相似的结构和功能。因此,靶点与成功靶点的序列相似性分析是研究潜在靶点的可药靶性的重要途径。

    基于蛋白质网络的可药靶性发现:基于网络的可药靶性发现的原理是在知识图谱及其嵌入(GRE)模型上,评估和推断不同生物实体之间的相互作用,从而发现新的可药靶性蛋白。

    基于网络药理学的靶标发现:将药物、靶标等内容抽象成一个复杂的生物分子网络,可以通过它们之间的相互作用关系来认识疾病发生和发展的生物学机制。

w17.jpg

图4.PandaOmics平台(资料来源:英矽智能,华医研究整理)

02

虚拟筛选

基于结构的虚拟筛选包括常规的分子对接方法和从头设计等其他方法。传统的基于配体的虚拟筛选(LBVS)方法可以分为基于化合物相似性的模型和用于活性预测的定量结构-活性关系(QSAR)模型。基于化合物相似性的模型又可以分为基于配体分子相似性匹配和基于药效团模型的药物设计方法。深度学习推动分子相似性方法和药效团模型的发展,也极大地丰富和发展了QSAR模型。

w18.jpg

图5.DeepScreening系统(资料来源:deepscreening.xielab.net,华医研究院整理)

03

小分子药物从头设计

对分子的不同描述方法,会引进不同的机器学习算法。采用简化分子线性输入规范(SMILES)的描述,可以通过采用长短期记忆网络(LSTM)来实现;当分子采用图形描述时,可以采用蒙特卡罗树搜索来生成新分子;还有自动编码器和生成对抗网络等算法都可以用在分子生成模型中。

w19.jpg

图6.Chemistry42平台(资料来源:Journal of Chemical Information and Modeling,华医研究院整理)

04

大分子药物从头设计

大分子药物从头设计借助人工智能与机器学习技术,突破天然多肽/蛋白的成药性限制,直接探索更广阔的蛋白序列与结构空间,加速目标蛋白开发并推动理论和技术突破。其核心方法涵盖蛋白质结构预测以及蛋白质/多肽药物设计。结构预测旨在解析蛋白功能以支撑药物设计,而AI驱动的新型设计策略已实现多类治疗性多肽的智能化构建。

w20.jpg

图7.NautilusTM平台(资料来源:Nature,华医研究院整理)

05

ADMET性质预测

以机器学习、深度学习为代表的ADMET预测模型可以从ADMET数据中学习化学结构与药效学的关联,并能迁移至其他未知化学结构中进行高通量筛选,以降低候选化学实体的临床失败率,有效地促进了药物研发的进程。

w21.jpg

图8.拜耳ADMET工具(资料来源:Drug Discovery Today,华医研究院整理)

06

药物晶型预测

晶体结构预测(CSP)是基于计算的分子晶型预测中的一步。近年来,人工智能技术的进步为药物晶型预测提供了新的手段。

w22.jpg

图9. XtalCSPTM晶型预测流程(资料来源:晶泰科技,华医研究院整理)

07

逆合成预测

逆合成预测不仅能够降低药物的制造成本,而且能够有效解决药物分子生产途径单一的问题。逆合成分析包含“单步逆合成反应预测”和“多步逆合成预测”。单步逆合成预测可以分为基于模板和无模板的逆合成预测。基于人工智能和机器学习的反应模板包括使用Transformer编码模型和基于规则的NLP模型;基于无模板的单步逆合成预测可以利用包括Transformer和GNN这类神经网络模型。而在多步逆合成预测中可以使用蒙特卡洛树搜索、束搜索等算法。

w23.jpg

图10. ChemAIRS逆合成设计平台(资料来源:智化科技,华医研究院整理)

w24.jpg

05

产业链分析



AI制药产业链上游可以分为提供AI技术和提供生物技术的企业:前者中辅助制药的人工智能硬件设备包括服务器和芯片等;后者包括提供CRO服务和先进设备的企业。中游部分按照商业模式可以分为:AI+Biotech、AI+CRO、AI+软件/服务三类;同时IT头部企业以及AI与其他技术的结合应用也占据部分中游市场下游合作方包括传统药企、Biotech公司和CXO企业选择适配的AI制药合作伙伴已成为药企、Biotech及CXO参与该领域的主流模式。

w26.jpg

图11.AI制药行业产业链图谱(资料来源:智药局,华医研究院整理)

w27.jpg

06

传统AI制药

与AI大模型制药的对比



传统AI制药与AI大模型制药在技术底层架构上存在显著差异,这种差异直接决定了二者在药物研发中的角色定位和应用边界。传统AI制药以经典机器学习算法为核心,例如随机森林、支持向量机(SVM)和决策树等,其特点是依赖专家经验构建规则驱动的模型。AI大模型制药则基于深度学习框架,如Transformer、生成对抗网络(GAN)和变分自编码器(VAE),构建参数规模达数十亿级的预训练模型。这类技术依赖海量多源数据(如AlphaFold2训练使用的蛋白质结构数据库PDB),并具备跨任务迁移学习能力。

w29.jpg

表1.传统AI制药与AI大模型制药的对比(资料来源:华医研究院整理)



07

竞争格局



国内AI制药产业形成多元化参与格局:企业类型涵盖传统药企、CXO服务商、垂直领域AI企业、科技巨头四类主体,通过AI SaaS、AI CRO和AI Biotech三类模式实现商业化。

w32.jpg

图13.AI制药市场的主要参与者(资料来源:量子位,华医研究院整理)

在技术路径的选择上,呈现“双轨并进-融合升级”路径:传统技术派(多为2020年前成立)聚焦药物发现单环节,依托机器学习/深度学习技术以CRO或管线开发变现;大模型创新派(2020年后崛起)借助互联网/学术资源深耕蛋白质设计、抗体工程等前沿领域;融合型企业则通过整合传统AI与生成式大模型构建复合竞争力,推动行业向"数据智能+生成式设计"的混合技术范式迭代,形成覆盖药物研发全链条的智能化解决方案。



08

总结



AI大模型与制药行业日益深度融合,产业竞争正从技术研发向商业化落地加速迁移,其核心价值亟待首款上市管线与闭环商业模式验证。在AI大模型制药领域,算法及数据能力的战略地位尤为凸显:具备多模态数据整合能力、拥有高质量私域数据储备且能构建"模型-实验-数据"闭环的企业更具发展潜力。从新药研发全流程来看,当前AI大模型主要在药物发现及临床前研究阶段发挥显著作用,临床试验阶段因涉及复杂医学知识、政策法规及临床经验融合,AI技术渗透率仍处低位。尽管该阶段技术开发面临临床数据获取、多学科交叉等挑战,但其降本增效的潜在商业价值巨大。

w35.jpg

研报收录征集



《华医研报》之《AI大模型在药物研发领域的应用研究报告》企业火热收录中,欢迎相关企业及其他各方机构通过以下邮箱与我
们联系:yiyuntech@huayifund.cn

《华医研报》是由华医研究院倾力打造的医疗大健康产业各个细分赛道的深度研究报告。每一篇深度研究报告都对一个细分赛道进行全方位分析,从产业现状到产业未来,从技术路径到市场竞争,从全球标杆到国内龙头,以专业的视角和丰富的企业案例阐述华医对医疗大健康的独到见解。

银行、券商、投资人和产业人均是《华医研报》的忠实读者。自《华医研报》推出以来,受到产业各界的广泛好评。



声明

w38.jpg

本文节选自华医研究院行业深度报告:2025年6月《AI大模型在药物研发领域的应用研究报告》。

报告中的信息或所表达意见不构成投资、法律、会计或税务的最终操作建议。我公司不就报告中的内容对最终投资建议作出任何担保。

w39.jpg

来源:华医研究院

作者:傅浩轩

编辑:邵利娟

医耘科技

医耘科技致力于以量化模型,对国内医疗大健康企业进行画像与评价。

旗下华医研究院是国内极少数一级市场医疗投资研究院,也是国内医疗投资全景图的界定者。专注医疗产业6大板块、36个子行业以及200+细分领域,拥有行业领先的企业成长性价值评价体系,经过多年的研究积累,研究院已拥有超过3.5万家大健康企业的经营数据,并长期保持互动,实时更新企业最新动态,已成为国内领先的医疗健康企业大数据研究机构,被业内人士称为医疗大健康领域的标准普尔。

华医研究院

华医研究院是医耘科技旗下独立的后台研究机构,是国内极少数一级市场医疗投资研究院,也是国内医疗投资全景图的界定者。专注医疗产业6大板块、36个子行业以及200+细分领域,拥有行业领先的企业成长性价值评价体系,经过多年的研究积累,研究院已拥有超过3.5万家大健康企业的经营数据,并长期保持互动,实时更新企业最新动态,已成为国内领先的医疗健康企业大数据研究机构。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-8-18 17:56 , Processed in 0.246983 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表