当前位置: 首页 > news >正文

解决蛋白质构象异质性的原子级建模挑战!David Baker团队PLACER框架解析

在分子世界里,蛋白质与核酸、有机及无机小分子、金属离子的相互作用对生命功能至关重要,它们的每一次识别、每一次结合,都可能影响生物功能,决定药物的疗效,甚至影响新型酶的设计成败。然而,对这些相互作用及其构象异质性的原子级建模仍是业界极具挑战性的课题。

基于深度学习(DL)的小分子对接工具如 DiffDock 相较于早期方法在精度上有所提升,但在高精度任务中性能差异并不显著, 并且在面对未见过的受体时性能会显著下降;此外,也有多种基于深度学习的方法被开发用于从化学结构生成小分子构象,但这些方法通常仅针对特定类别的相互作用对象建模,从而限制了它们在刻画蛋白质功能全谱方面的能力。

基于此,来自华盛顿大学诺奖得主 David Baker 教授的研究团队开发了一种图神经网络 PLACER(Protein-Ligand Atomistic Conformational Ensemble Resolver,蛋白质–配体原子级构象集合解析器),能够基于小分子的原子组成与键合信息,精确生成多种有机小分子的结构;并在给定蛋白质宏观结构环境的情况下,为蛋白–小分子对接任务构建小分子与蛋白质侧链的详细结构。 在酶设计研究中,该研究团队发现利用 PLACER 评估设计活性位点的准确性与预组织化程度,可显著提高设计成功率与酶活性。例如,研究人员获得了一种预组织化的反醛缩酶,其 kcat/KM = 11,000 M⁻¹·min⁻¹,远高于深度学习出现前所有设计结果。

相关研究成果以「Modeling protein-small molecule conformational ensembles with PLACER」为题,已刊登《美国国家科学院院刊》(PNAS)。

研究亮点:

  • PLACER 具备高速与随机性,能够快速生成大量预测样本,用以描绘构象异质性分布。

  • 通过对所有相互作用使用统一的原子级表示,PLACER 能够轻松扩展到生物分子之外,如大环分子和其他复杂小分子。

  • PLACER 对于计算酶设计和小分子结合体设计具有重要价值:可快速评估设计活性位点的重建精度以及关键催化/相互作用侧链官能团的预组织程度。

在这里插入图片描述

论文地址:
https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2

关注公众号,后台回复「酶设计」获取完整 PDF

数据集:多层次、多样化的数据构建验证卓越泛化能力

对于小分子构象预测,团队选用了剑桥结构数据库 (Cambridge Structural Database,CSD) 中超过 22.6 万条有机非聚合小分子晶体结构作为训练集,并挑选了 7,116 个样本作为验证集。每个分子都提供了完整的原子组成和化学键信息,同时随机初始化原子坐标,使模型学习在噪声条件下恢复精确结构的能力。这种训练策略不仅确保了模型能够捕捉小分子在不同构象下的微妙变化,还允许通过多次运行生成多样化的分子构象集合。

在蛋白-小分子体系方面,研究团队从蛋白质数据库(Protein Data Bank,PDB) 中挑选了高分辨率(<2.5 Å)的结构,包括蛋白与小分子结合的复合物,总计约 11.3 万条训练样本和 7,090 条验证样本。值得注意的是,团队仅排除了水分子,但保留了可能非生物学的小分子(如溶剂)信息,因为它们仍然提供了分子界面物理化学偏好的宝贵线索。 训练数据经过裁剪,最多包含 600 个重原子,并围绕随机选定原子中心进行高斯噪声扰动,以模拟现实中蛋白与小分子的复杂动态环境。

这种多层次、多样化的数据构建保证了 PLACER 在处理从单一小分子到复杂蛋白-小分子体系时,都能表现出卓越的泛化能力。

神经网络 PLACER:采用三轨架构,专注于原子级的侧链和小分子构象

PLACER 是一种去噪神经网络(denoising neural network),其输入包括部分扰乱的蛋白质结构及任意相互作用分子的化学结构信息(不含坐标),输出为复合物的全原子结构以及预测模型中各原子位置的不确定性,如下图 A 所示:

在这里插入图片描述

PLACER 概览

在输入阶段,分子体系被转换为一个化学图(chemical graph),其中节点代表各个重原子(为降低计算成本不建模氢原子),边代表原子之间的化学键(见上图 C)。这一表示方式在不同类型分子间是统一的。网络中每个节点包含原子类型信息及其初始被扰乱的三维坐标。网络的任务是迭代去噪输入坐标,同时估计输出模型结构中原子位置的不确定性(见上图 D)。

PLACER 采用受 RoseTTAFold(RF)启发的三轨架构,整个网络架构如下:

  • 三轨道设计(1D、2D、3D):1D 轨道处理原子特征信息;2D 轨道处理原子间对关系(如化学键、空间邻近度);3D 轨道负责原子坐标更新。

  • 迭代优化:在完成 1D 与 2D 特征的初始嵌入后,这些特征被传入迭代块(iteration block),用于循环更新嵌入向量与 3D 结构;在迭代块中,首先构建原子邻居图——对于每个原子,从空间邻近性和化学图邻近性各取一半,共选取 32 个最近邻原子;接着,通过前馈适配层(feed-forward adapter layer)将 2D 对特征投影为边嵌入(edge embeddings),并与 1D 特征、原子邻居图及当前的 3D 原子结构一起,作为 SE3-Transformer 网络的输入,用于更新 3D 坐标和 1D 嵌入向量。

  • 手性中心处理:手性中心信息通过 Type-1(向量)特征 传递给网络(见上图 E);2D 轨道中的特征经过对-对更新(pair-to-pair updates),并结合结构偏置。原子与原子对的置信度预测头分别从 1D 和 2D 轨道分支出来,完成迭代块的运算;完整训练后的网络包含八个共享权重的迭代块。

  • 损失函数设计:PLACER 的训练使用结构损失与置信度预测损失的组合,在每次迭代后应用。主要的结构损失为全原子 FAPE(Frame-Aligned Point Error);模型结构的置信度在原子级和原子对级别分别评估。

通过这种精心设计的网络架构,PLACER 可以从随机初始化坐标出发,生成多样化且原子级精确的蛋白-小分子构象集合, 为后续分析和设计提供可靠基础。与 AlphaFold 等蛋白结构预测方法不同,PLACER 不预测蛋白主链结构,而专注于原子级的侧链和小分子构象,从而显著提升计算速度,并允许生成多样化的构象集合。

成果展示:为从小分子到复杂蛋白体系的精准工程提供支撑

小分子构象预测

在 CSD 小分子数据集上的测试表明,完全训练后的 PLACER 能以亚埃精度(sub-Å)正确生成复杂分子的三维结构, 如原子数超过 50 的大环分子(macrocycles)(见下图 D),包括肽类大环分子(peptidic macrocycles)(见下图 D 顶行)。消融实验显示,缺失键距信息或减少迭代次数都会显著降低预测精度,证明 PLACER 设计的迭代和特征策略至关重要。

在这里插入图片描述

PLACER 正确生成的七个大环分子(macrocycles)示例

蛋白–小分子相互作用

研究人员使用 PLACER 生成目标蛋白口袋中小分子构象集合(下图 A),方法是多次运行网络,每次对输入坐标进行不同随机初始化。分析生成的构象集合表明,PLACER 对配体的初始位置不敏感:多个不同的起始位置都能产生接近天然构象的预测(下图 B),且这些位置覆盖了输入采样的整个空间(下图 D)。 研究人员还观察到,基于配体原子计算的预测 RMSD 分数(pRMSD)可用于从采样池中选择更精确的模型(下图 E),评分最高的模型与实验结构高度吻合(下图 C)。

在这里插入图片描述

使用 PLACER 建模蛋白–小分子相互作用

如上图 G,在 65 个药物靶点的非天然构象测试中,PLACER 在生成和选择接近天然构象方面表现优异,使用 pRMSD 评分的成功率超过传统对接工具如 Vina、GOLD 和 GalaxyDock。与表现最佳的 Rosetta GALigandDock 方法相比,PLACER 在低精度区间(配体 RMSD < 2 Å 的复合物百分比)性能更高(82.4% vs 73.6%),但在高精度区间(RMSD < 1 Å)略逊一筹(41.8% vs 51.6%)。

然而,PLACER 的性能仍然值得注意,因为与其他方法不同,它并未专门针对非天然蛋白–小分子对接任务训练,PLACER 可以从零重建小分子和蛋白侧链的构象,而其他测试方法主要依赖输入蛋白的坐标。

酶活性位点设计

PLACER在逆醛酶(retro-aldolase)设计中的应用尤为亮眼。研究团队对 RA95 系列逆醛酶及其进化改良版本进行了 50 次重复模拟,分析活性位点赖氨酸及其共价中间体的构象多样性。结果显示:对于初始计算设计中活性较低的酶,PLACER 生成的构象集合高度多样,表明缺乏预组织性;而对活性较高的进化版本,其构象集合则越来越有序。这表明,缺乏预组织性是早期酶设计的主要不足,同时 PLACER 提供了一种快速评估手段,从而可用于指导酶设计工作。

进一步,团队基于 NTF2-like 折叠设计了一轮新的逆醛酶,通过 PLACER 评估预组织程度与 kcat/KM 值的相关性。结果显示,PLACER 预测高度预组织的设计通常具有更高催化效率,其中最活跃的设计 cnRA-50 的 kcat/KM 达到 11,000 M⁻¹min⁻¹,远高于早期计算设计水平,并接近最新 RFdiffusion 和 proteinMPNN 方法设计的活性。

在这里插入图片描述

cnRA-50 催化的逆醛反应

该研究团队预计,基于 PLACER 的构象集合生成方法将被广泛应用于复杂非蛋白分子在孤立状态或蛋白环境下的结构建模,以及酶设计和蛋白–小分子结合体设计的评估。

David Baker 教授:长期专注于计算蛋白质设计的先驱

2024 年 10 月 9 日,久负盛名的蛋白质设计领域巨擘 David Baker 教授同 AlphaFold2 开发者、DeepMind 的 Demis Hassabis 和 John M. Jumper 共同获得了 2024 年诺贝尔化学奖。

David Baker 教授长期专注于计算蛋白质设计,开源了 RoseTTAFold、RFdiffusion 和 ProteinMPNN 等深度学习工具,赋能新型蛋白质的设计,同时还以成立公司的方式推动技术的产业化落地,是该领域当之无愧的世界级大师。在最新几项研究中,他的团队又在许多新方向上实现了实质突破。

例如,研究人员在研发新药时,通常会将蛋白质作为核心药物靶点,使药物与部分结构稳定的蛋白质相结合以干预疾病进程。然而,将药物靶向缺乏明确结构、序列和构象偏好的天然无序蛋白(IDPs)仍然存在挑战。在此背景下,2025 年 8 月,David Baker 团队提出了一种名为 Logos 的蛋白质设计策略,基于诱导契合(Induced Fit)的结合策略,设计了能够适应 39 种目标无序氨基酸序列的结合蛋白。这意味着更多蛋白质能为新药研发提供靶点,有望加快癌症和阿尔兹海默症的研究。

论文标题: Design of intrinsically disordered region binding proteins
论文地址: https://www.science.org/doi/10.1126/science.adr8063

2025 年 9 月 18 日,David Baker 团队的研究提出了一种全原子扩散模型——RFdiffusion3(RFD3),实现了全原子生物分子相互作用的从头设计,能够在配体、核酸和其他非蛋白质原子簇的背景下生成蛋白质结构,其比前代方法更简单且更高效。在一系列计算机模拟基准测试中,RFdiffusion3 的性能更优,且计算成本仅为前代方法的十分之一。

论文标题: De novo Design of All-atom Biomolecular Interactions with RFdiffusion3
论文地址: https://www.biorxiv.org/content/10.1101/2025.09.18.676967v1

天然离子通道在生物体系中发挥着关键作用,而其人工改造版本已被广泛用于化学遗传学工具及传感器件中。尽管蛋白质设计已被用于构建具有孔结构的跨膜蛋白,但如何像天然离子通道那样,设计出具备针对特定离子、且由氨基酸侧链精确排列形成的“选择性过滤器”,一直受到技术限制的制约。2025 年 10 月,David Baker 团队的最新研究首次使用人工智能从头设计了全新的钙离子通道,这项研究表明,即使是那些只部分为我们所理解的复杂生化功能,如今也能借助 AI 从第一性原理出发进行构建。

论文标题: Bottom-up design of Ca² ⁺ channels from defined selectivity filter geometry
论文地址: https://www.nature.com/articles/s41586-025-09646-z

综观近期成果,David Baker 教授及其团队正以惊人的速度重塑蛋白质科学的版图——从可与天然无序蛋白结合的 Logos 策略,到实现全原子级分子交互设计的 RFdiffusion3,再到首次从头构建钙离子通道的突破性研究,Baker 团队不断将计算蛋白质设计从理论推向现实。他们的工作不仅拓展了生命分子设计的边界,也让“以算法构建生命功能”的未来愈加清晰可见。

参考链接:
1.https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2
2.https://www.thepaper.cn/newsDetail_forward_31663354
3.https://www.biorxiv.org/content/10.1101/2025.09.18.676967v1
4.https://www.nature.com/articles/s41586-025-09646-z

http://www.dtcms.com/a/583043.html

相关文章:

  • 兴平住房和城乡建设局门户网站wordpress 表单校验
  • wordpress发布文章到指定页面网站怎么关键字优化
  • 做农资的网站公司名字大全免费测吉凶
  • 岳阳市交通建设投资公司门户网站wordpress主题汉化中文
  • 安防公司做网站图片湖南省郴州市十大旅游景点排行榜
  • 博物馆门户网站建设目标seo如何快速出排名
  • 影视网站的设计与实现网络服务提供者不履行法律行政法规规定的
  • 官方网站做背景墙厂家网站的开发方式
  • onethink做的企业网站在县城做商城网站
  • 【智能体-DeepMiner】利用滑动窗口 提高多轮交互能力
  • [尚庭公寓P159-169][结束][第7天]
  • 做网站用哪个编程语言wordpress多用户商城
  • 门户网站框架下载wordpress 果蔬论坛
  • C++并查集
  • Linux开发:readlink命令读取软连接指向的文件
  • 行业协会网站建设的方案郑州网站建站模板
  • 网站的设计方案wordpress做门户怎么样
  • Python 图片转字符画
  • ClamAV 在 CentOS7 上的离线安装与使用指南
  • 广东自助建站网站可以免费注册网站
  • 个人空间网站建设迅速上排名网站优化
  • 怎么检查网站死链中型网站
  • 网站平均停留时间常德烟机网站
  • Spring Boot 2.7.18(最终 2.x 系列版本)2 - 框架搭建:pom配置;多环境配置文件配置
  • mapreduce源码解读
  • wordpress 图片自动加水印东莞百度网站优化
  • 类似非小号的网站怎么做wordpress seo是什么
  • 跑酷游戏开发笔记1 背景移动 cocos3.8.7
  • 开封旅游网站建设项目方案完整html网页代码案例
  • 设计企业网站wordpress聊天小工具