批量下载AlphaFold结构
AlphaFold是谷歌DeepMind开发的最先进的人工智能系统,能够以前所未有的准确性和速度计算预测蛋白质结构。我们与EMBL的欧洲生物信息学研究所(EMBL-EBI)合作,发布了AlphaFold的2亿多个蛋白质结构预测,这些预测可供全球科学界免费公开使用。其中包括科学上已知的几乎所有编目蛋白质,这些蛋白质有可能将人类对生物学的理解提高几个数量级。
AlphaFold预测的结构可以从AlphaFold Protein Structure Database 和 UniProt 搜索下载,也可以通过python脚本批量下载。
批量下载脚本
import os
import requestsdef download_af_structure(uniprot_ids, outdir):os.makedirs(outdir, exist_ok=True)for uniprot_id in uniprot_ids: url = f"https://alphafold.ebi.ac.uk/files/AF-{uniprot_id}-F1-model_v4.pdb"outpath = os.path.join(outdir, f"{uniprot_id}.pdb")# 如果文件已存在,跳过下载if os.path.exists(outpath):print(f"Already exists: {uniprot_id}")continuer = requests.get(url)if r.status_code == 200:with open(outpath, "wb") as f:f.write(r.content)print(f"Downloaded: {uniprot_id}")else: print(f"Not found: {uniprot_id}")uniprot_ids = set(["A0A815KT75","A0A6P4Z083"])
download_af_structure(uniprot_ids, "test_output_dir")