ESMFold在线预测蛋白质结构
ESMFold 是由 Meta AI(前 Facebook AI)开发的一种 基于语言模型的蛋白质结构预测工具,它比 AlphaFold 更快,能够在几秒至几分钟内预测中小型蛋白质的三维结构。
其核心特点和技术优势:
-
技术原理
ESMFold 使用进化尺度的语言模型(ESM-2)学习蛋白质序列的潜在规律,通过端到端的架构直接生成原子级分辨率的结构预测。与 AlphaFold2 不同,ESMFold 无需依赖多序列比对(MSA)或外部数据库,而是通过语言模型捕捉序列中的共进化信息,显著简化了预测流程。 -
速度优势
ESMFold 的预测速度比 AlphaFold2 快 6-60 倍。例如,在单张 NVIDIA V100 GPU 上,预测一个 384 氨基酸的蛋白质仅需 14.2 秒,且无需耗时的 MSA 搜索步骤(通常需 10 分钟以上)。这一特性使其特别适合大规模宏基因组数据分析。 -
应用场景
- 宏基因组蛋白:ESMFold 在两周内预测了超过 6.17 亿个宏基因组蛋白质的结构,覆盖土壤、海水、人类肠道等环境中的未知微生物蛋白,其中 2.25 亿个预测达到高置信度(pLDDT > 0.9)。
- 孤儿蛋白与从头设计:对于缺乏同源序列的蛋白(如人工设计的全新蛋白),ESMFold 的预测准确性显著优于 AlphaFold2,填补了传统方法的空白。
-
<