rxn_yields 仓库介绍(https://rxn4chemistry.github.io/rxn_yields/)
rxn_yields 仓库介绍(https://rxn4chemistry.github.io/rxn_yields/)
rxn_yields
是一个聚焦于 “化学反应产率预测” 的开源项目,核心成果是提出Yield-BERT 模型—— 基于 Transformer 架构(rxnfp 反应指纹模型)的端到端产率预测工具。该项目由 IBM 欧洲研究院与伯尔尼大学团队开发,相关研究发表于《Machine Learning: Science and Technology》,旨在通过深度学习从反应 SMILES 中直接预测产率,尤其在高通量实验(HTE)数据上表现优异。
重点:Buchwald–Hartwig 胺化与 Suzuki–Miyaura 偶联的实验部分
该仓库的核心实验围绕两类经典交叉偶联反应展开,验证 Yield-BERT 模型的产率预测能力,具体细节如下:
1. Buchwald–Hartwig 胺化反应实验
Buchwald–Hartwig 反应是钯催化的 C-N 交叉偶联反应,广泛用于药物合成,仓库中使用的数据集是该反应产率预测的经典基准。
-
数据集来源与规模:数据来自 Ahneman 等人 2018 年发表于《Science》的研究(https://doi.org/10.1126/science.aar5169),包含3955 个标准化反应