hicFindTADs生成的domains.bed文件解析
hicFindTADs生成的domains.bed文件记录了鉴定出的TAD(拓扑关联结构域)的基因组位置信息。根据上下文,该文件遵循标准BED格式规范,但列的具体含义需结合hicFindTADs的输出说明解析如下:
各列解析
chrom(染色体名称)
描述:TAD所在的染色体或scaffold名称(如chr1、chrX等)
示例:chr1
格式要求:与输入Hi-C矩阵的染色体命名一致。
chromStart(起始位置)
描述:TAD的起始坐标(0-based),即染色体上第一个碱基的位置为0
示例:5000000
注意:该位置是基因组浏览器兼容的坐标系统。
chromEnd(结束位置)
描述:TAD的结束坐标(1-based),实际覆盖的碱基范围为[chromStart, chromEnd)
示例:6000000
说明:例如chromStart=5000000, chromEnd=6000000表示TAD覆盖5,000,000至5,999,999的碱基。
name(名称,可选)
描述:TAD的标识符,通常由工具自动生成或通过参数指定
示例:TAD_1
注意:此列可能包含TAD的唯一ID或其他注释信息。
score(得分,可选)
描述:TAD的置信度或显著性得分(0-1000分)
示例:750
说明:高分表示更强的TAD边界信号,可能与TAD-separation score或统计显著性相关。
strand(链方向,通常为空)
描述:TAD的链方向(由于TAD是双向结构,此列通常不适用)
示例:.或留空。
附加信息
文件生成逻辑:
domains.bed中的每一行代表一个非重叠的TAD区域,其边界由hicFindTADs通过计算TAD-separation score和统计显著性(如FDR校正)确定。
参数影响:
若启用了–thresholdComparisons或–delta等参数,可能通过附加列记录p值、q值或delta值,具体需参考输出文件的实际列数。
可视化建议:
可结合hicPlotTADs或基因组浏览器(如UCSC Genome Browser)直接加载该BED文件,观察TAD在基因组上的分布。
示例文件内容
chr1 5000000 6000000 TAD_1 750 .
chr1 8000000 9500000 TAD_2 680 .
此示例表示染色体1上有两个TAD,分别位于5,000,000-6,000,000和8,000,000-9,500,000区间,得分分别为750和680。
如需进一步操作(如合并、筛选或统计TAD长度),可结合bedtools工具链。