UniRef100 ID 转换 UniProtKB ID
UniProtKB ID(UniProt Knowledgebase Identifier)是 UniProt数据库中蛋白质条目的唯一标识符,包括两个数据库分支:
-
Swiss-Prot(人工注释,高质量)
-
TrEMBL(自动注释)
通常有两种形式:
类型 | 示例 |
---|---|
Entry Name | CBPB2_HUMAN |
Accession ID(常用) | Q96IY4 , P12345 , A0A8B8B5A6 |
AlphaFold预测结构是基于UniProtKB accession ID生成的,如:
https://alphafold.ebi.ac.uk/files/AF-Q96IY4-F1-model_v4.pdb
UniRef100 是 UniProt Reference Clusters(UniRef)数据库的一个层级。
-
UniRef100:将 100% 序列相同 的蛋白质聚类成一个单元(包括不同物种中相同序列的蛋白)
-
每个聚类有一个 代表序列(通常来自 UniProtKB),ID 形式如:
UniRef100_Q96IY4 UniRef100_A0A8B8B5A6 UniRef100_UPI000C0409EB
UniRef100 ID 代表整个 完全一致的序列簇,而不是单个蛋白。