CXSMILES介绍
Chemaxon 扩展 SMILES/SMARTS 用于在 SMILES 字符串后存储分子的特殊特征。任何信息都可以存储在 SMILES 字符串后,只要它们由空格或制表符字符分隔,因为 SMILES 解析器会忽略这些信息,或者将它们作为注释使用。扩展特征以以下格式存储:
SMILES_String |<feature1>,<feature2>,...|
Chemaxon 的扩展 SMILES/SMARTS 不包含非 ASCII 字符,它们通常以字符代码 n 的形式被转义为 &#n;。在 S-group 中,ASCII 字符“,”、“;”、“|”、“{”、“}”也以这种方式转义。此外,符号“$”、“;”、“|”、“{”、“}”在美元符号之间(见原子标签/别名/值)也按上述方式编码。
扩展特征描述非常经济。如果分子中缺少某些特征,则不写入相应的特殊字符(例如:如果分子的原子根本没有别名字符串,则不写入“$”和“;”字符)。此外,如果分子没有任何要写入的特征,则省略扩展特征字段。
请注意,以 CXSMILES 格式生成的 SMILES 字符串部分并不总是与通过 smiles 输出生成的部分相同。例如,在二茂铁的情况下,配位键不会导出到普通 SMILES([Fe].c1cccc1.c1cccc1),但它们会出现在 CXSMILES 中(c1