如果把生物分子世界比作一座城市,那么 RCSB Protein Data Bank 就是那座城市的“国家档案馆”。自 1971 年建立以来,这个由美国科研机构联合维护的数据库已收录超过 19 万 个蛋白质三维结构,来源包括 X 射线晶体学、核磁共振(NMR)和冷冻电镜(Cryo-EM)。 在这里,每个蛋白都是可视化的艺术品:你能查看其原子坐标、结合口袋、金属离子位点,甚至用自带的 3D 浏览器旋转、比对、下载。对于想做分子对接、肽结合预测、结构可视化或机器学习特征提取的研究者,PDB 几乎是第一站。 无论是科研入门还是 AI 算法训练,这里都是你离不开的“真实世界”结构样本集。
DBAASP(Database of Antimicrobial Activity and Structure of Peptides)是全球最系统的抗菌肽数据库,收录超 2 万 条肽序列及其抗菌实验数据。 你能在这里看到每条肽的活性谱、最小抑菌浓度(MIC)、目标菌株甚至毒性信息。AI研究者可据此建立分类或回归模型,用于预测新肽的抗菌潜力或毒性风险。 在“抗生素耐药性”日益严峻的时代,DBAASP 就像是 AI 寻找新型天然防线的资料仓库。