根据SNP列表提取SNP位点上下游的参考基因组fasta
根据 SNP 列表列表提取参考基因组fasta文件中每个 SNP 上下游各指定bp大小(如500bp) 的序列,通过--upstream
和--downstream
参数可灵活调整提取的序列长度。
1. 依赖安装
pip install pandas pyfaidx
2. 提取方法
python extract_snp_fasta.py \--snp snp.txt \ --fasta hg19.fa \ --output hg19.snp.fa \