AI制药新浪潮:让AI“看脸”识药!

新闻 · 发表于 2025-5-30 22:08

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章

嘿，朋友们！“AI制药”这个词是不是已经刷爆了你的朋友圈，成为科技界和医药界共同瞩目的焦点？传统的AI方法，例如让AI去“阅读”分子的化学式（像SMILES序列这种线性字符串）或者去细致分析由原子和化学键构成的分子结构图（如图神经网络GNN所做的那样），无疑已经在药物发现的征途上取得了令人鼓舞的进展，为我们筛选和设计潜在药物分子提供了有力的工具。但今天，我们要聊点更酷、更富有想象力的——让AI直接“看”分子的“照片”来学习和发现新药！没错，你没有听错，就像我们人类通过观察面部特征来识别人一样，AI也开始学习通过分子的视觉特征来识别它们、预测它们的性质，甚至启发新药的设计。这无疑为AI制药打开了一扇全新的大门。

最近，一篇发表在国际知名期刊《Briefings in Bioinformatics》上的重磅综述《Image-based molecular representation learning for drug development: a survey》就为我们系统地梳理了这个新兴且潜力无限的领域。这篇推文将带你深入解读这篇综述的精髓，一同探索计算机视觉（CV）这项在图像识别、自动驾驶等领域大放异彩的技术，是如何与药物研发这一古老而又充满挑战的科学领域碰撞出耀眼的火花，并有望让新药发现之路变得更加直观、更加高效！准备好了吗？让我们一起踏上这场AI“看脸”识药的奇妙探索之旅吧！想象一下，如果AI能像经验丰富的化学家一样‘一眼’洞察分子的潜力，甚至启发我们设计出从未想过的新药结构，那将为攻克疑难杂症、守护人类健康带来怎样革命性的希望？
🤔 药物研发的老大难与AI的“前浪”们

我们都深知，新药研发绝非易事，它堪称一场充满未知与挑战的“九九八十一难”的修行：

为了改变这一成本高昂、效率低下的现状，科学家们和产业界都将殷切的目光投向了飞速发展的人工智能（AI）。在AI赋能药物研发的诸多环节中，一个至关重要的核心任务，就是构建精准且高效的分子表示——也就是说，如何将复杂多样的分子结构和性质信息，巧妙地转化成AI模型能够理解并有效处理的“语言”或“数据格式”。

在“图像派”AI崭露头角之前，AI制药领域的“前浪”们已经探索并实践了多种主流的分子表示方法：

这些“前浪”们无疑为AI制药的进步立下了汗马功劳，推动了整个领域的发展。但是，追求卓越的科研人员总是在不断探索更好、更强大的工具和方法。于是，一种全新的、更贴近人类直觉的分子表示学习方式——基于图像的分子表示学习，便应运而生，并迅速吸引了业界的广泛关注！
💡 为什么是“图像”？AI“看图识珠”的独特魅力

你可能会好奇，我们已经有了那么多表示分子的方法了，为啥还要多此一举，费劲把分子画成“照片”再让AI去学习呢？直接用图像这种方式到底有什么特别的“魔力”？

简单来说，让AI“看图识药”，就像是给AI装上了一双能够洞察分子微观世界的“火眼金睛”。它不再仅仅依赖于抽象的符号或数字，而是能够直接从分子的“视觉形象”中学习，从而更全面、更深入地洞察分子的奥秘，为药物研发带来全新的视角和强大的动力。
🚀 AI如何“看图”：解密图像分子表示学习流程

那么，AI究竟是如何一步步“看懂”这些分子图像，并从中提取有用信息的呢？这篇综述为我们精心梳理并呈现了一个通用的、条理清晰的工作流程（其核心思想可见下图示意，该图改编自原论文中的图2，旨在更形象地展示这一过程）：

分子视觉表示的一般流程的图片

常用公共数据库一览 (部分列举自原论文表2):

数据库名称 (Database Name)	简介 (Description)
PubChem	由美国国立卫生研究院（NIH）下属的国家生物技术信息中心（NCBI）维护，是一个内容极其丰富的大型公共化学数据库，汇集了来自全球超过750个数据源的化合物、物质及生物活性数据。
ChEMBL	由欧洲生物信息学研究所（EBI）精心维护和运营，专注于收集和整理具有类药性的生物活性分子的化学结构、实验测定的生物活性数据以及相关的基因组学信息，是药物发现的重要资源。
ZINC	由加州大学旧金山分校（UCSF）的Irwin和Shoichet实验室合作开发和维护的商业可购买化合物数据库，特别强调化合物结构的多样性和可获得性，并提供了便捷的在线搜索和筛选功能。
DrugBank	一个综合性的、可自由访问的在线数据库，不仅提供了已批准上市药物的详细信息（如作用机制、药代动力学、药物相互作用等），也收录了大量处于临床研究阶段的在研化合物的数据。
MoleculeNet	由斯坦福大学Pande实验室发起并维护的一个旨在推动分子机器学习发展的基准平台，它包含了一系列精心挑选和整理的、用于评估和比较不同机器学习模型在分子性质预测任务上性能的公开数据集，涵盖了从量子力学计算到生物物理实验再到生理学效应等多个方面。

🧠 AI“看图”的十八般武艺：核心学习方法大盘点

让AI“看图”可不是简单地用一个模型、一种方法就能包打天下。实际上，根据我们拥有的训练数据类型（比如是否有现成的“答案”或标签）、学习的目标以及想要解决的具体问题，科学家们已经发展出了多种精妙的学习范式。这篇综述独具匠心地基于计算机视觉领域成熟的学习范式分类体系，对现有基于图像的分子表示学习研究进行了系统性的归纳和总结，为我们理解这个交叉领域的全貌提供了清晰的路线图。

下面这张精心整理的大表（其内容综合并改编自原论文中的图3、图4以及表3、表4的核心信息）将带你快速了解几种主要的学习方法、它们的核心思想、一些代表性的研究工作或模型，以及它们各自的优势与面临的挑战：

学习范式 (Learning Paradigm)	核心思想 (Core Idea)	代表工作/模型 (Examples from Survey)	优点 (Pros)	挑战 (Cons)
监督学习 (Supervised Learning)	（一句话概括：AI的‘看图答题’模式，有标准答案供学习）核心特点：这类方法依赖于“有标签”的训练数据。也就是说，我们需要为模型提供大量的分子图像，并且每张图像都对应一个已知的“答案”或“标签”（例如，该分子的生物活性值、毒性等级、是否与特定靶点结合等）。模型的目标就是学习从输入图像到这些已知标签的映射关系。
- 常规监督学习 (Vanilla)	这是最直接的监督学习方式。简单来说，就是用带有明确标签（如IC50值、毒性分类等）的分子图像集合来训练一个深度学习模型（通常是CNN），让模型直接学习预测这些性质或活性。	KekuleScope, Chemception, Deepsnap, ResNet18DNN	数据利用高效：如果拥有高质量的标签数据，模型能够充分学习并建立准确的预测模型。准确率潜力高：在数据充足且质量好的情况下，往往能达到较高的预测精度。结果相对易于解释和验证：由于有明确的预测目标和真实标签，模型的性能评估和结果分析相对直接。	高度依赖标签数据：获取大量、高质量的药物研发相关标签数据通常成本高昂且耗时（例如，需要进行大量生物实验）。对数据偏误敏感：如果训练数据存在偏差（如类别不平衡、标签错误等），模型的性能会受到严重影响。模型泛化能力可能受限：模型可能只在与训练数据相似的未见数据上表现良好，对于差异较大的新分子，泛化能力可能不足。小数据集易过拟合：在标签数据量较少的情况下，复杂的深度学习模型很容易过拟合，即过度学习训练数据的噪声和特异性，导致在新数据上表现不佳。
- 孪生CNN学习 (Siamese CNN)	（一句话概括：AI的‘找不同’或‘连连看’高手）这种方法采用一种特殊的网络结构，包含两个或多个结构完全相同、参数共享的CNN分支。每个分支分别处理一个输入分子图像，然后将它们各自提取的特征向量进行比较（例如计算距离或相似度），从而判断这两个分子是否相似，或者它们之间的关系。常用于需要比较输入的任务。	tCNNs (Liu et al.), Torres et al.	适合小样本学习：通过学习区分“相似对”和“不相似对”，即使在每个类别样本量不多的情况下也能有效学习。强大的度量学习能力：非常适合学习分子间的相似性或距离度量，这对于药物重定位（寻找老药新用）、虚拟筛选等任务非常有用。所需标签数据形式更灵活：有时只需要成对的相似/不相似标签，而非每个样本的绝对属性标签。鲁棒性强：对输入数据的噪声和变形具有一定的容忍度。	计算量相对较大：需要同时处理和比较多个输入，并训练两个网络，对计算资源的要求可能更高。模型训练和调优更复杂：如何设计有效的损失函数（如对比损失、三元组损失）以及如何构建高质量的训练样本对，都需要更专业的知识和经验。特征空间的解释性：虽然能判断相似性，但其学习到的潜在特征空间的具体含义有时不如直接预测属性的模型那么直观。
- 多模态学习 (Multi-modal)	（一句话概括：AI的‘全科医生’，综合多方信息看诊）核心思想是“博采众长”。它不仅仅依赖于单一的分子图像信息，而是尝试同时整合和学习来自多种不同类型或来源的数据（即“模态”），例如，将分子的2D/3D图像与其对应的化学名称、文本描述（如专利文献中的合成方法、性质描述）、基因表达数据、蛋白质序列信息等结合起来进行联合学习。模型的目标是学习一个能够融合所有这些信息的统一表示，或者让不同模态的信息相互补充、相互印证。	Wang et al. (专利图文信息重建), MCNN-DDI, MultiDTI	信息更全面，视角更多元：通过融合不同来源的信息，可以获得对分子更完整、更立体的理解，弥补单一模态信息的不足。可能提升预测准确性和模型鲁棒性：不同模态的信息可以相互校验和补充，从而提高模型预测的准确性，并使其对单一模态的噪声或缺失不那么敏感。发现跨模态关联：有助于揭示不同类型数据之间的潜在联系，例如图像特征与文本描述中特定化学基团的对应关系，从而加深对药物作用机制的理解。	数据整合与对齐难度大：不同模态的数据结构、尺度、质量可能差异很大，如何有效地将它们整合、对齐并输入到模型中是一个巨大的挑战。不同模态数据可能存在不平衡：某些模态的数据可能远多于其他模态，导致模型学习时产生偏向，对部分模态学习不足或过度学习。计算成本高，模型设计复杂：处理和融合多种模态数据通常需要更复杂的模型架构和更大的计算资源。缺乏标准化方法和基准：多模态学习在药物研发领域的应用尚处于探索阶段，成熟的方法论和公开的基准数据集相对较少，使得不同研究之间的结果难以比较和复现。依赖数据质量：任何单一模态的数据质量差都可能拉低整体模型的性能。
无监督学习 (Unsupervised Learning)	（一句话概括：AI的‘自学探索’模式，无需标准答案也能发现规律）核心特点：与监督学习相反，这类方法主要使用“无标签”的训练数据。也就是说，我们只给模型提供大量的分子图像，但并不告诉模型这些图像对应的“正确答案”。模型需要自己从这些数据中探索和发现潜在的模式、结构或规律。
- 常规无监督学习 (Vanilla)	这是无监督学习的基础形式。直接在海量的、没有预先标注的分子图像数据上训练模型（例如使用自编码器、聚类算法等），让模型学习数据的内在表示或结构。这种学习到的表示常用于数据降维、异常检测、数据可视化，或者作为后续监督学习任务的“预训练”步骤，为模型提供一个好的初始化参数。	ImageMol, ADMET-CNN, QSAR-CNN	能有效利用海量无标签数据：药物研发领域存在大量未标记的化合物数据，无监督学习为此类数据的利用提供了可能，无需昂贵的标签成本。揭示数据中隐藏的模式和结构：能够帮助我们发现数据中未曾预料到的聚类、关联或异常，可能启发新的科学假设和药物靶点。辅助数据探索和可视化：例如通过降维技术将高维分子图像数据投影到低维空间，便于研究人员观察和理解数据分布。	学习到的模式和结果往往难以解释：模型发现了某些模式，但这些模式的具体生物学或化学意义可能不明确，需要后续大量的实验验证才能转化为实际应用。对输入数据的质量和预处理方法非常敏感：噪声、冗余特征或不恰当的预处理都可能严重影响学习效果，甚至导致错误的结论。可扩展性面临挑战：处理超大规模生物数据时，某些无监督学习算法的计算效率可能成为瓶颈，需要大量计算资源。评估困难且缺乏标准化：由于没有“标准答案”，评估无监督学习模型的好坏本身就是一个难题，也缺乏统一的评估标准和方法，使得不同研究之间的结果难以比较和复现。
- 自监督学习 (Self-supervised, SSL)	（一句话概括：AI的‘自创习题’学习法，从自身数据中找监督信号）这是一种非常巧妙的无监督学习分支，可以看作是“自己监督自己”。模型通过解决自身数据内部隐含的、自动生成的“代理任务”（pretext task）来学习有用的特征表示。例如，对于一张分子图像，可以随机遮挡掉一部分，然后让模型去预测被遮挡的部分是什么；或者将图像打乱成若干小块，让模型学习如何将它们恢复成原始图像。通过完成这些精心设计的“智力游戏”，模型被迫学习到关于数据内在结构和语义的深刻理解。	MolPMoFiT, SMR-DDI, ConvAE	高效利用无标签数据，学习能力强：继承了无监督学习的优点，并且通过精心设计的代理任务，能够学习到比传统无监督方法更复杂、更鲁棒的特征表示。预训练模型具有良好的可迁移性：通过自监督学习在大规模无标签分子图像上预训练得到的模型，其学习到的特征表示往往具有很好的泛化能力，可以方便地迁移到下游各种具体的、标签数据稀缺的药物研发任务中（如活性预测、毒性分类等），只需少量微调即可取得良好效果。能产生多样的代理任务：例如预测分子图的遮蔽部分或序列，从而对药物研发相关数据进行全面理解。	代理任务的设计至关重要：代理任务的好坏直接决定了模型能学到什么样的特征，设计一个既有效又与下游任务相关的代理任务本身就很有挑战性。模型通常比较复杂，计算需求高：为了完成复杂的代理任务，自监督学习模型（如基于Transformer或大型CNN的模型）往往结构复杂，训练过程对计算资源（如GPU）的需求也比较大。结果的可解释性仍是一个挑战：与其他深度学习方法类似，其学习过程和决策依据的透明度有待提高。对数据质量和多样性敏感：如果预训练数据质量不高或多样性不足（例如数据增强方式不当），学习到的表示可能存在偏差，影响下游任务性能。
- 迁移学习 (Transfer Learning)	（一句话概括：AI的‘经验借鉴’学习法，站在巨人肩膀上看得更远）核心思想是“站在巨人的肩膀上”。它指的是将一个在大型通用数据集（例如包含数百万张自然图像的ImageNet）或某个相关的源任务（例如预测一般化学分子的某种性质）上已经预训练好的模型，将其学到的知识和能力“迁移”到我们当前感兴趣的、但可能数据量不足的药物研发目标任务上。通常的做法是固定预训练模型的大部分参数（冻结层），只对模型的最后几层或新添加的针对特定任务的层进行微调（fine-tuning），使用目标任务的少量标签数据进行训练。	Dalkiran et al., Li et al., ImageCLEF2018	能有效解决药物研发中目标任务数据稀疏的问题：药物研发中很多特定任务的标签数据非常宝贵和稀缺，迁移学习使得我们可以在这些小数据集上也能训练出性能不错的模型。加速模型训练，提升模型性能：利用预训练模型提供的良好初始参数，可以大大缩短目标任务模型的训练时间，并且通常能达到比从零开始训练更好的性能。利用通用知识：预训练模型从大规模数据中学到的通用特征（如边缘、纹理、形状等对于图像任务而言）对于理解特定领域的分子图像也可能是有益的，有助于模型更快抓住关键信息。	“负迁移”风险：如果源域（预训练数据的领域）和目标域（药物研发任务的领域）之间差异过大，或者预训练任务与目标任务关联性不强，那么强行迁移知识反而可能损害目标任务的性能，导致效果变差。预训练模型本身的成本和获取：虽然有很多公开的预训练模型，但针对特定化学或生物图像的优质预训练模型仍然相对较少，自行进行大规模预训练的成本很高。在小数据集上微调仍有过拟合风险：尽管迁移学习有助于缓解，但在目标数据集极小的情况下，微调过程仍然可能导致模型对目标数据过拟合。模型选择和微调策略需要经验：选择哪个预训练模型、如何进行微调（例如冻结哪些层、学习率如何设置等）都需要一定的经验和尝试，缺乏统一的指导原则。

简单小结一下，帮你理清思路：

🎯 “图像派”AI大显身手：主要应用领域

那么，这些学会了“察言观色”、“看图识珠”的AI模型，究竟能在药物研发的哪些关键环节大显身手，一展其能呢？综述中为我们重点介绍了以下几个已经取得显著进展或展现出巨大潜力的主要应用领域：

🚧 机遇与挑战：AI“看图”的进阶之路

虽然基于图像的分子表示学习为AI制药描绘了一幅令人振奋的前景图，展现出巨大的应用潜力，但正如任何新兴技术一样，它目前仍处于相对早期的发展阶段。综述也客观地指出了该领域当前面临的一些关键挑战，并高瞻远瞩地为未来的研究方向提供了宝贵的启示：

🎉 总结与展望：未来可期，星辰大海！

总而言之，基于图像的分子表示学习，无疑为人工智能赋能药物研发这条充满机遇与挑战的道路，开辟了一条令人耳目一新且兴奋不已的新途径。它巧妙地将计算机视觉的强大能力引入到微观的分子世界，凭借其表示的直观性、能够充分借鉴成熟CV技术的便捷性、以及有望捕捉传统方法难以刻画的复杂分子模式等独特优势，已经在药物的早期发现、生物活性的精准预测、以及潜在毒性的有效评估等药物研发的关键环节中，展现出了巨大的潜力与应用价值。

正如这篇精彩的综述所深刻强调的那样，尽管目前基于图像的AI制药领域尚处于蓬勃发展的初期阶段，仍然面临着诸如如何在图像转换中最大限度地保真化学信息、如何提升模型在不同化学空间和任务间的泛化能力、如何在利用数据的同时确保其隐私与安全、以及如何打开模型决策的“黑箱”以增强其可解释性和可信度等一系列挑战，但这恰恰也为未来的研究者们描绘出了一幅充满无限可能的创新蓝图，提供了广阔的探索空间和宝贵的科研机遇。

我们完全有理由满怀信心地相信，随着相关算法的持续创新、计算能力的不断增强、高质量数据集的日益丰富以及多学科交叉合作的不断深入，让AI“看脸”识药的梦想将不再仅仅停留在科幻小说的畅想之中，而是会逐渐演变成现实世界中推动新药研发流程提速增效、降低成本、并最终惠及人类健康的强大引擎！这不仅仅是计算工具的革新，更是药物研发思维模式的进化。当AI拥有了‘洞察’分子视觉语言的能力，它将成为科学家探索未知、创造奇迹的得力伙伴，共同谱写人类健康事业的新篇章。这个领域的前方，是星辰大海，未来可期！让我们共同期待并参与到这场激动人心的变革中来，见证AI如何用‘慧眼’点亮新药发现的未来！

对这个激动人心的前沿方向抱有浓厚兴趣的小伙伴们，强烈建议你们深入阅读这篇综述的原文，以便从中获取更多详尽的技术细节、前沿的研究进展以及深刻的学术洞见！
📚 主要参考文献

[1] Li, Y., Liu, B., Deng, J., Guo, Y., & Du, H. (2024). Image-based molecular representation learning for drug development: a survey. Briefings in Bioinformatics, 25(4), bbae294. https://doi.org/10.1093/bib/bbae294
🖼️ 附录：文中图表速览

以下是对原综述中主要图表标题的中文翻译，帮助大家快速回顾核心内容：

账号		自动登录	找回密码
密码			注册

AI制药新浪潮:让AI“看脸”识药!

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块