【AI4S】Generative AI 为药物设计带来新思路:寻找“美丽分子”
Generative AI 为药物设计带来新思路:寻找“美丽分子”
- 文章速览
- 引言
- 方法
- 合成与采购
- 合成与采购简介
- 供应商mapping
- 多参数优化(MPO)
- 在GADD中优化“美”
- MPO评分函数的多种变体
- 模型预测可靠性的挑战
- 奖励的脆弱性:当优化偏离正确方向时
- 人类参与迭代的作用
- RLHF的实践:一个精简的闭环流程
- 生成式AI在药物发现各阶段的应用
- 结论
- 内容来源
人工智能生成式建模(GenAI)为发现新颖、高效且安全的药物提供了一种新兴方法,它能够系统性地探索化学空间,并设计出既易于合成、又具备理想药物特性的分子。然而,尽管其他行业已取得快速进展,GenAI在前瞻性药物发现领域的应用尚未展现出明确且持续的价值。本文主张, 生成化学的最终目标并非仅仅创造“全新”或“有趣”的分子,而是要生成那些与项目目标高度契合、并能超越传统方法带来独特价值的“美丽”分子——即那些在治疗上精准匹配药物开发需求的分子。为此,本文聚焦于GenAI应用于药物发现(GADD)时需重点关注的五大关键要素:**1)化学可合成性(需兼顾时间和成本限制);2)理想的ADMET(吸收、分布、代谢、排泄与毒性)特性;3)针对特定靶点的优良结合能力,以有效调控感兴趣的生物机制;4)构建恰当的多参数优化(MPO)函数,从而引导GenAI朝着项目目标稳步迈进;5)来自资深药物研发人员的人工反馈。**值得注意的是,在药物发现项目中,如何定义分子的“美”并非一成不变,而是随着数据积累和优先级变化而动态调整,这使得专家的主观判断不可或缺。尽管基于复杂偏好函数或多目标优化的MPO框架有助于将多元化的项目目标转化为可操作的策略,但目前仍无法完全捕捉资深药物研发人员的细腻洞察力。 通过引入人类反馈的强化学习(RLHF),我们可以有效引导GenAI生成符合治疗需求的分子——正如RLHF在训练ChatGPT等大型语言模型时发挥了关键作用,尤其帮助模型行为更贴合人类期望。虽然RLHF本身并不决定模型的基础知识,但它对于塑造模型的具体响应方式却至关重要。此外, 未来GADD领域的突破还将依赖于更精准的性质预测模型,以及能够为资深药物研发人员提供深入见解的可解释性系统。“美在于观者眼中”——而在药物发现领域,真正的“美”则由经验丰富的药物研发人员及临床成功来评判。
文章速览
- 作者提出“美丽分子”概念,强调生成模型不仅要产出新分子,还要具备合成可行性、良好ADMET性质和明确的靶点作用。
- 方法:结合生成模型(VAE、GAN、RL、Transformer)与多参数优化(MPO)、人类反馈(RLHF)、自动化合成和预测模型。
- 创新点:首次将“分子之美”定义为药物研发价值的综合体现,提出 RLHF 融合生成模型,引入专家判断。
- 结果:作者展示了多种方法在合成可行性、ADMET预测和靶点特异性方面的应用潜力,并强调人机协作可提升药物研发成功率。
引言
本文讨论了生成式人工智能(Generative AI,简称GenAI)在各行各业的应用现状,并重点探讨了其在药物发现领域的应用。虽然GenAI已经广泛应用于内容创作、市场营销、客户支持、软件开发、建筑设计等领域,但在药物发现领域仍然处于起步阶段。
文章指出,要实现GenAI在药物发现领域的突破性进展,需要克服许多挑战,包括确保生成的分子具有合成可行性、药理学相关性和对现实世界结果的积极影响等。此外,人类化学家通常认为美丽的分子不仅仅是合成可行性的体现,还包括合成实用性、分子功能和疾病修饰能力等方面的综合考虑。
为了平衡和协调成功分子设计的三个主要支柱——化学可合成性、ADMET性质和靶向特异性生物活性,作者提出了多参数优化(MPO)和强化学习与人类反馈相结合的方法。然而,在现有预测模型存在缺陷且化学空间广阔的情况下,人类反馈对于创建美丽分子至关重要。
方法
合成与采购
合成与采购简介
尽管“美丽分子”的定义可能带有主观性,但生成具备有效性和可合成性的分子则更具可衡量性。在GADD早期的研究中,我们优先通过一系列表示方法(如简化分子输入行输入规范,即SMILES,以及DeepSMILES)来确保化学结构的合理性——这些方法为化学结构的编码提供了系统化的途径,但同时也容易因语法错误而生成化学上不可行的分子。(8)为解决这一局限性,研究团队创新性地引入了自引用嵌入字符串(SELFIES),从设计层面直接确保分子表示的化学有效性。(28)然而,尽管SELFIES在理论上具备这些安全保障,实际应用中却并未展现出显著的性能提升,这很可能与其本身较高的复杂性有关——这种复杂性可能会限制模型的灵活性,并进一步缩小分子多样性范围。
除了序列化编码方式,基于图的分子表示方法能够更直观地刻画原子间的连接关系,但依然难以避免生成化学无效的结构,例如孤立片段或价态违反等异常情况。而三维表示法则更为复杂,往往会导致不合理的构象,甚至出现空间位阻冲突等问题。(29)因此,无论是二维还是三维方法,都需经过严格的验证步骤,以确保所生成的分子完全符合化学可行性的标准。此外,立体化学虽常被忽视,却至关重要——它不仅深刻影响分子的生物活性、受体结合能力,还决定了代谢稳定性。通过在生成过程中明确引入立体化学约束,不仅能提升所获分子的相关性,还能增强其在药物发现领域中的潜在下游应用价值。
尽管生成化学上有效的分子已足以满足机器学习和虚拟筛选等计算模拟需求,但要将这些分子推进至实验验证阶段,则会面临全新的挑战。单纯保证化学有效性并不意味着分子具备可合成性或市场可行性。因此,从计算预测迈向真实世界测试,关键在于如何在限定的时间与成本范围内,高效获取并制备目标分子。
在本节中,我们将深入探讨当前、新兴及未来分子采购与合成的前沿方法,重点分析它们在突破实验验证实际障碍、进而提升生成模型预测能力方面所发挥的重要作用。同时,我们还将介绍从化学供应商到自动化设计平台等多种采购策略,并着重阐述这些策略如何与生成式建模技术深度融合,从而加速新药的发现进程:一方面通过拓展可触及的化学空间,另一方面借助实验验证对计算预测结果进行精准校验,最终推动药物研发迈入高效、可靠的全新阶段。
供应商mapping
在药物发现过程中,分子的采购仍然是一个重大制约因素。**在传统的药物化学中,分子通常以已知的骨架为核心进行设计,并在特定的侧链位置引入修饰。**然而,这一模式并不一定适用于通过机器学习(ML)方法生成的分子——这些分子往往展现出高度的结构多样性,且难以简化为单一的、易于还原的骨架。这种更高的多样性给直接采购带来了挑战,因此亟需开发高效的策略,以快速识别可合成的类似物。
图2A展示了目前可用于采购生成分子的主要方法。有时,研究人员可以直接从供应商处购买感兴趣的分子,但鉴于化学空间的庞大性以及此前已合成分子数量的有限性,这种情况往往难以实现。为此,一种广泛应用的方法便是“供应商映射”,即通过检索化学供应商的库存,寻找与计算生成结构高度相似的分子。当首要目标是匹配预定义的分子特性分布时,可采用基于相似性的方法,例如利用Tanimoto相似度进行最近邻搜索。这些方法能够迅速锁定那些在商业上可用、且能近似满足所需分子特征的化合物。而对于经由结构导向技术优化的分子,则需结合额外的相似性衡量标准,以确保不会丢失关键的结构属性。此外,药效团和/或形状匹配方法提供了一种替代策略:研究人员无需依赖纯粹的分子指纹,而是基于三维对齐,从供应商数据库中精准识别出结构最相近的分子。
图2展示了生成分子的化学采购方法。其中(A)表示通过定制合成每个分子来获得生成的分子。另一种选择是将生成的分子与供应商库匹配,在那里购买相同或相似的分子,尽管可能无法获得非常相似的分子。(B)表示将生成的构建块与供应商库中最接近的可用选项匹配,然后进行组合合成以确保大规模合成,而无需对每个分子进行大量合成。
简而言之,生成分子的化学采购方法有两种:一种是定制合成每个分子;另一种是将生成的分子与供应商库匹配,然后进行组合合成以实现大规模合成。这两种方法都可以帮助我们获得所需的生成分子,并且可以根据实际需求选择适合的方法。
- 数据:结合公共数据库(如 GDB-17、Enamine REAL Space)以及实验测得的 ADMET、靶点结合数据。
- 模型结构:采用多种生成架构,包括 VAE(潜在空间平滑优化)、GAN(逼真分子生成)、RL(目标导向优化)、Transformer(捕捉复杂分子关系)。
- 输入:分子表示采用 SMILES、SELFIES、分子图结构,部分任务使用三维构象。
- 输出:生成符合药物研发目标的分子,包括合成可行性、良好 ADMET、合理靶点亲和力。
- 优化框架:多参数优化(MPO)结合权重函数、Pareto 优化,将合成可行性、ADMET、亲和力统一进目标函数。
- 人类反馈:通过 RLHF 引入药物化学家判断,避免模型“作弊”,提升生成分子与实际研发目标的一致性。
多参数优化(MPO)
在GADD中优化“美”
在理想的世界里,一个与目标产品特征(TPP)相一致的单一目标函数本应在项目启动时即已确定。然而,实际操作中,预测误差及不断积累的项目知识,使得分阶段的方法成为必要。随着模型和目标的逐步完善,这些阶段最终可融合为更加连续的优化框架。多参数优化(MPO),通常应用于强化学习(RL)领域,为小分子设计提供了务实的路径,帮助我们在药物发现各阶段根据优先级的变化灵活调整方向。尤为重要的是,这一动态优化框架必须整合前文所述的多种目标,包括针对特定蛋白的活性与选择性,以及ADMET特性与合成限制,从而确保所生成的化合物不仅得分高,更兼具化学上的实用性和治疗上的契合度——即“美”。正是通过MPO,我们得以平衡这些常常相互冲突的需求。
在早期苗头化合物的识别阶段,重点通常放在化合物的可行性和可操作性上,奖励标准涵盖合成便捷性、结构多样性以及基础活性,同时兼顾物理化学性质的限制(如分子量、logP值等)。随着项目进入从苗头化合物到先导化合物的转化阶段,以及后续的先导优化阶段,MPO的目标可进一步扩展,纳入ADMET特性及关键安全风险因素(如hERG阻滞)。而在更后期的开发阶段,则需综合考虑药物间相互作用潜力、生物利用度和安全性药理学特性,同时平衡活性、选择性与合成限制条件。为此,研究团队会持续微调奖励函数,结合强化学习与人类反馈(RLHF),确保优化过程始终符合项目约束与专家判断,从而使生成式流程与药物的可开发性、临床相关性,以及不断变化的竞争格局保持一致。
MPO评分函数的多种变体
在强化学习驱动的分子设计中,MPO评分函数将多个目标整合为单一信号,用于优化策略的改进。常见的策略包括:**1)加权求和,权重可静态设定或动态调整;2)效用函数,将每项属性映射到0至1的统一尺度,以便性能较差的指标能够主导综合评估;以及(iii)帕累托方法,无需明确权重即可识别各项目标之间互不支配的解决方案。**更先进的框架还会根据优先级的变化或实验反馈,随时间动态调整权重。这些方法使生成式AI智能体能够在探索兼顾活性、ADMET特性及合成可行性的多样化解决方案时,始终与实际约束条件保持一致(见图1)。
模型预测可靠性的挑战
**MPO综合评分的可靠性,取决于其最不可靠的组成部分。**因此,必须对模型的可靠性进行评估,并将其纳入评分函数中。除了传统的体外/体内数据验证外,机器学习预测模型还可通过显式处理不确定性以及应用领域(AD)检查来提升性能。基于距离的AD启发式方法可通过惩罚偏离训练分布较远的预测结果来近似评估模型的可靠性,但这种方法需要预先设定阈值,且提供的只是指示性保障,而非绝对可信度。相比之下,共形预测技术则通过训练一个配套模型,在交换对称性假设下,以用户自定义的置信水平生成预测区间,从而实现经过校准的不确定性量化。在实际应用中,MPO可针对位于AD范围之外或具有宽泛共形区间的模型,适当降低其贡献权重或直接予以过滤,以此将优化压力与预测的可信度紧密挂钩。
奖励的脆弱性:当优化偏离正确方向时
尽管MPO设计已相当精妙,但强化学习智能体仍可能利用目标函数中的漏洞(即“奖励黑客”行为),或过早收敛至狭窄的化学类型(局部最小值),从而削弱其实际应用价值。例如,当对接评分被纳入奖励体系时,生成器可能会添加冗长且柔性的脂肪族链,以最大化与蛋白质的相互作用,虽然这会推高对接评分,却同时损害配体的效率、渗透性及合成可行性。相反,若权重设置过于严格,则可能导致智能体过度优化单一骨架结构,而忽视了其他可能更具优势的候选化合物。为此,可采取的缓解策略包括:定期使用多样化的实验验证数据重新训练模型;借助独立方法(如分子动力学或自由能微扰法)进行交叉验证;引入具备不确定性感知能力的探索机制;以及适时调整目标函数或加入新颖性激励,以避免陷入易碎的最优解。这些现象凸显了数值化目标与化学直觉之间的脱节,同时也提醒我们:奖励函数本质上是一种近似工具,若缺乏审慎监控与持续迭代优化,生成式模型终将利用其潜在弱点。
图3. 基于强化学习的分子设计中常见的陷阱:(A) 强化学习中的奖励黑客问题,以及(B) 优化过程中的局部最小值。
在生成化学领域,一个反复出现的主题是:模型的输出可信度完全取决于用于引导其优化的评分函数。尽管MPO旨在将药物化学领域的智慧转化为量化目标,但这种转化往往并不完美。例如,结合亲和力的替代指标可能奖励那些难以成药的构象;ADMET预测模型对新型骨架的外推能力可能较差;而合成可行性评分则可能忽略区域选择性或立体选择性问题。结果便是,生成模型虽能产出优化了目标函数的分子,却可能违背了我们心目中高品质候选药物所应具备的核心原则——这就是所谓的“奖励漏洞”:这些分子或许在“游戏”中胜出,但在实际药物研发项目中却绝不会被优先考虑。因此,真正美丽的分子并非源自单纯的盲目优化,而是基于专家判断,经过全面考量、契合各阶段需求的权衡取舍所孕育而成。
人类参与迭代的作用
人类的专业知识依然不可或缺。药物研发、计算化学以及DMPK(药物代谢与药代动力学)领域的科学家能够敏锐地发现自动化评分系统所遗漏的潜在风险,例如活性代谢物、合成瓶颈及知识产权风险等。定期开展专家评审,有助于及早识别可能被利用以规避奖励机制的设计模式;而RLHF技术则能为重新加权或引入新约束条件提供依据,比如限制卤素和环系的使用。强化学习高效探索并优化可量化的目标信号,而人类判断则确保搜索过程始终聚焦于药物开发的治疗可行性与项目实施的现实性。通过这种方式,专家的介入不仅用于修正模型输出,更进一步塑造整个奖励体系的格局,从而保证通往理想分子的道路不仅是统计上看似有利,更能切实扎根于药物发现与开发的实际需求之中。
RLHF的实践:一个精简的闭环流程
以下是一个基于GADD的实际实施方案示例:
- 收集偏好:每周由一组资深化学家和经验丰富的药物猎手共同提供两两比较的偏好信息(如A vs B),并依据简洁的评分标准进行评估,涵盖合成可行性、ADMET风险、新颖性与知识产权保护潜力,以及临床应用前景等维度。
- 拟合奖励函数:利用简单偏好模型(例如轻量级图神经网络)对数据进行拟合并完成校准。
- 调整策略:采用KL正则化方法,逐步优化策略以贴合已学习的奖励函数,同时始终保持硬性约束条件的开启状态(如预警机制、AD门控及属性窗口设置)。
- 设置安全防线:通过红队模拟化合物和独立验证手段(如构象合理性检查、分子动力学抽查等),及时捕捉可能出现的失效模式,例如对接链延长攻击等潜在漏洞(见图4)。
- 数据追踪与报告:从设计到合成、再到实验检测,全面记录各环节的关键指标,包括人工成功率、配体效率富集情况、计算资源需求,以及其他感兴趣的量化数据。
图4:一个简单的目标函数示例,用于优化DOCK6评分。在仅以对接为奖励的情况下,REINVENT4会向保守的核心结构添加长而灵活的R基团,尽管这种策略通过微弱的相互作用提升了评分,却降低了分子的实际“美感”。虽然加入灵活性、尺寸和可合成性等约束条件能够有效避免此类问题,但这些限制也可能无意中过度缩小化学空间(数据未显示)。每种结构下方均标注了对应的DOCK6评分。此处所展示的问题,实际上是由于目标函数设计不佳所致,而非REINVENT4程序本身的问题。
随着生成化学的不断进步,未来的挑战将不再是设计出得分优异的分子,而在于确保这些分子真正配得上它们的高分。唯有将MPO框架建立在机制的精准性、数据驱动的不确定性以及专家的直觉之上,我们才能可靠地从统计优化阶段迈向真正卓越、高效的药物候选分子。在这条探索之路上,MPO不仅是一种评分标准,更成为分子设计领域的一座哲学基石。
生成式AI在药物发现各阶段的应用
GADD 有望通过为命中化合物识别、从命中到先导化合物的转化以及先导化合物优化阶段设计分阶段适用的目标函数,结合预测建模与强化学习,推动以数据驱动的方式高效探索化学空间,从而在这些关键环节中发挥高价值作用。然而,不同阶段对分子“美感”的评判标准各异,因此评分函数需持续更新,以防止奖励漏洞的出现,并确保药物研发方向与治疗目标高度契合。
在命中化合物识别阶段,核心关注点在于化学有效性及靶点特异性相互作用。该阶段的奖励函数应优先考虑化学合理性、分子多样性与可合成性,同时避免因虚假分子特征导致的过度拟合现象,即过分依赖高对接得分。大规模虚拟库会被快速筛选,以剔除那些具有极端理化性质或已知毒性基团的分子,从而保留一组“合理”的骨架结构。在此过程中,速度被置于计算成本较高的评估方法之上,确保能在短时间内对大量候选分子进行初步评价。尽管机器学习(ML)技术需兼顾其适用性范围,但仍可有效助力快速筛选与精准选优。此外,对接模拟虽能作为结合亲和力的初步代理指标,但也容易被利用,例如通过引入柔性连接链或增强疏水性相互作用来人为抬高得分。因此,确保化合物库的化学多样性,不仅有助于提高发现潜在优秀候选化合物的概率,还能规避已知的知识产权(IP)限制。同时,高效的实验验证率要求企业制定稳健的采购策略,以保持研发节奏,并确保最具潜力的骨架结构能够及时获取。随后,可通过早期体外研究进一步确认化合物是否具备针对目标生物活性的能力,从而为进入下一阶段提供至关重要的早期验证依据。而在这一阶段,即便采用较为粗略的ADMET过滤手段,也能有效降低后续生成式流程中可能暴露的潜在风险。一旦初步的结合分子被锁定,便正式迈入从命中化合物到先导化合物优化的关键过渡期。
在**“命中-先导”阶段**,研究重点通常转向优化命中分子,以增强其类似先导化合物的特性,确保它们既能保持对靶标的高结合亲和力,又能改善药代动力学特征。GADD方法应充分利用适合该阶段的多参数优化(MPO)功能,引导分子设计向预期的理想属性靠拢,并及时整合早期实验反馈,以完善ADMET预测。同时,通过构效关系(SAR)分析,为分子结构修饰提供依据,从而提升化合物的活性与选择性。这一阶段常用的一个基本指标是脂溶性配体效率(LLE),用以最大限度地减少非特异性脱靶相互作用。此外,计算模型还能预测化合物的吸收、分布、代谢和排泄(ADME)特性,进一步优化候选药物的成药性。结合公司内部的体外数据,能够更精准地校正ADMET预测模型,提高分子设计的准确性,使合成工作集中于那些最有可能推动项目进展的化合物。在此阶段,研究人员还会开展一系列额外的体外测试,评估化合物的代谢稳定性、溶解度及毒性,以确保先导化合物符合必要的类药性标准。随后,选定的化合物将进入早期动物体内研究,初步考察其药代动力学和毒性特征,为后续的先导化合物优化奠定基础。然而,若缺乏基于不确定性的评分机制,生成的分子可能过度依赖ADMET模型中的缺陷,导致设计出的化合物仅优化了模型预测的“假象”,而非真正具备临床开发潜力。
因此,这一阶段的核心挑战在于:**如何通过精密的MPO策略,在多种相互冲突的目标(如活性、安全性、生物利用度等)之间取得平衡,同时避免陷入局部最优解或模型过拟合的问题。**只有展现出优异治疗特性的分子,才能顺利推进至临床试验阶段。GADD的首要目标,正是借助预测模型,全面探索可合成分子的巨大空间,以实现对理想属性(如活性、溶解度、代谢稳定性等)的均衡调控。值得注意的是,降低化合物的脂溶性虽有助于改善溶解度和代谢稳定性,但需谨慎权衡对靶标亲和力的影响。这种取舍必须被明确纳入奖励函数中,往往需要动态调整权重,并结合药物化学专家的评审反馈,以防止分子设计优先级出现偏差。与此同时,实验数据会持续更新预测模型,确保分子设计不断迭代优化。而在后期的分子修饰阶段,则需以毒性预测和临床可行性评估为核心指导原则。更为关键的是,还需通过广泛的体内研究,深入验证化合物的药代动力学、生物利用度以及在疾病模型中的疗效,从而确保最终筛选出的候选药物完全符合临床试验的要求。此外,后期的分子生成工作还需充分考虑制剂的可行性、知识产权布局,以及长期潜在的毒性风险——这些因素往往难以准确预测,因此亟需人类专家的全程参与和指导。
在整个过程中,预测模型应逐步增强并最终补充药物化学领域的直觉,通过与模型适用性范围和数据驱动的迭代优化相结合,提供各阶段恰到好处的预测。数据科学家与化学家的协同合作,实时整合对活性、ADMET特性及药物进展潜力的精准预测,能够有效避免在低效骨架上的无谓投入。每一轮新的实验测量都应进一步提升模型的准确性和适用性,从而使后续的设计周期更加高效、更具针对性。最终,这将加速化学空间的探索,降低后期药物开发的失败率,并推动从早期苗头化合物到可行临床候选药物的转化进程更加敏捷。然而,要真正兑现这一愿景,仍需在数据、科学以及人机协作的工作流程上取得突破。尽管当前面临诸多挑战,作者们坚信,基于生成式AI的小分子药物发现领域前景光明,但通往成功的道路绝非坦途——唯有来自不同背景的科学家与工程师通力协作,才能彻底革新这一领域。为充分释放生成式AI在药物发现中的潜能,评分函数须与时俱进地匹配项目目标;实验反馈必须无缝融入模型更新机制;同时,专家的全程把关仍应牢牢贯穿于整个设计周期之中。此外,若不通过主动学习、不确定性量化及人类反馈等手段加以明确应对,诸如奖励规避、ADMET模型脆弱性以及领域漂移等问题将持续存在。
结论
为了对药物发现产生真正有意义的影响,生成式人工智能必须超越单纯的新颖性和可合成性,持续提出与项目需求高度契合、具备治疗潜力的分子。正如本文所强调的,精准预测ADMET特性、有效规避奖励漏洞,以及通过多参数优化实现权衡取舍,是确保生成模型不仅产出可行分子,更能创造出“优美”分子的关键——这些分子不仅要符合项目目标,还应具备最终转化为药物的潜力。而要达成这一目标,离不开对药理学相关属性(如效力、选择性、ADMET及安全性)的准确预测与优化。尽管早期研究已取得一些令人鼓舞的成果,但当前仍面临诸多重大的科学与技术挑战。
尽管许多新兴的生物技术平台公司纷纷强调自动化与端到端闭环流程的重要性,但现实中的成功依然有赖于科学家的专业判断——这是任何研发管线都无法完全替代的核心能力。这类系统有望大幅缩短研发周期,并显著提升早期发现阶段的成功率。然而,要真正实现这一愿景,还需在基础层面进行重大改进:目前的属性预测模型往往因数据稀疏或存在偏差,导致泛化能力不足。这凸显了构建高质量、多样化且标注完善的实验数据集的迫切需求,以真实反映药物发现过程的复杂性。此外,可解释人工智能(XAI)在这一领域的应用仍显滞后,限制了生成式输出的透明度,也延缓了经验丰富的药物研发人员对其实际应用的接受速度。
尤为重要的是,人类的专业知识始终是生成化学工作流程的核心所在。只有不同背景、拥有数十年实战经验的资深药物研发专家紧密协作,才能准确定义何为特定情境下的“好”分子——这种定义远超当前计算能力的范畴,涵盖新颖性、项目战略契合度,以及难以量化的设计直觉等关键因素。因此,结合人类反馈的强化学习(RLHF)及其他互动式学习框架,将成为引导生成式AI产出既能在虚拟环境中优化各项属性,又能切实推动项目进展的关键手段。
展望未来,持续推动分子表征方式、模型架构创新,并将其无缝融入药物发现全流程,将是提升生成式性能的关键所在。随着计算能力的不断提升,生成式AI将受益于里奇·萨顿提出的“苦涩教训”中所揭示的规模效应:即基于大规模数据集训练的简单通用算法,辅以硬件技术的进步,长期来看往往能超越那些由人工精心打造的领域专用系统。与此同时,量子计算等前沿技术虽有望为生成式设计带来全新突破,例如开启更高效的化学空间探索模式,但其实际应用价值目前仍处于初步探索阶段,尚难断言何时能真正落地。
总而言之,生成式人工智能无疑有望彻底变革小分子药物的研发方式。然而,要让这一技术真正兑现承诺,业界必须始终扎根于药物发现的复杂本质,以实证验证为指引,并通过人机紧密协作不断深化合作。若缺乏对奖励漏洞和模型过自信问题的有效防范,生成式AI很可能只满足于“表面上”符合目标函数要求的分子,却无法真正实现优秀药物设计的核心理念。诚然,“GADD计划”致力于创造兼具卓越性能与治疗潜力的“优美”分子,但要充分发挥生成式AI在药物发现领域的全部潜能,仍需更精准的属性预测模型、更优质的数据支持,以及更加紧密的人机协同合作。
- 合成可行性:采用 vendor mapping、组合化学库和自动化闭环合成,加速实验验证。
- ADMET:预测模型涵盖溶解度、渗透性、代谢稳定性、毒性,减少晚期失败风险。
- 靶点特异性:结合 docking、分子动力学、自由能计算和新兴的 co-folding 方法,提升结合预测精度。
- 多参数优化:通过 RLHF 调整奖励函数,避免模型生成“形式正确但不可用”的分子。
内容来源
van den Broek R L, Patel S, van Westen G J P, et al. In Search of Beautiful Molecules: A Perspective on Generative Modeling for Drug Design[J]. Journal of chemical information and modeling, 2025.