1. uncalled4 align —— 基于 basecall 的 DTW 信号对齐
usage: uncalled4 align [-h] [--ref REF | --self] [--reads READS [READS ...]]--bam-in [BAM_IN] [-p PROCESSES] [--flowcell FLOWCELL][--kit KIT] [--basecaller-profile BASECALLER_PROFILE][--rna] [--ordered-out] [-f] [--kmer-shift KMER_SHIFT][--bam-chunksize BAM_CHUNKSIZE] [--out-name OUT_NAME][-r] [-l READ_FILTER] [-x READ_INDEX] [-n MAX_READS][--count-events] [--del-max DEL_MAX][--ins-max INS_MAX] [--unmask-splice] [--method METHOD][-c {abs_diff,z_score,norm_pdf}] [-b BAND_WIDTH][-s BAND_SHIFT] [--mvcmp-mask MVCMP_MASK][--max-norm-dist MAX_NORM_DIST] [--max-sd MAX_SD][--min-aln-length MIN_ALN_LENGTH][-N {ref_mom,model_mom}] [--zero-ts] [-C CONFIG][-o [BAM_OUT] | --tsv-out [TSV_OUT] | --eventalign-out[EVENTALIGN_OUT]] [-m PORE_MODEL] [--bam-f5c][--tsv-cols TSV_COLS] [--tsv-na [TSV_NA]] [--tsv-noref][--eventalign-flags EVENTALIGN_FLAGS][--norm-iterations NORM_ITERATIONS][--mask-skips [MASK_SKIPS]] [--skip-cost SKIP_COST][--stay-cost STAY_COST] [--move-cost MOVE_COST]Perform DTW alignment guided by basecalled alignments
执行基于 basecall 比对结果的 DTW 信号对齐
1.1 可选参数总览
英文原文 | 中文翻译 |
-h, --help | 显示此帮助信息并退出 |
--ref REF | 参考基因组 FASTA,必须与 --bam-in 中的参考一致(默认:None) |
--self | 执行无参考的“信号→basecall” 对齐(默认:False) |
--reads READS [READS ...] | FAST5、SLOW5 或 POD5 文件/目录路径,可递归搜索(默认:None) |
--bam-in [BAM_IN] | 用于引导信号对齐的 BAM,必须包含 mv 与 ts basecaller 标签(默认:None) |
-p PROCESSES, --processes PROCESSES | 并行进程数(默认:1) |
--flowcell FLOWCELL | 测序所用芯片型号,如 FLO-MIN106(默认:空) |
--kit KIT | 建库试剂盒型号,如 SQK-LSK109(默认:空) |
--basecaller-profile BASECALLER_PROFILE | basecaller 模型预设名,可选 dna_r10.4.1_260bps / dna_r10.4.1_400bps / dna_r9.4.1_400bps / rna_r9.4.1_70bps / rna004_130bps(默认:None) |
--rna | 数据为 RNA 时必须指定(默认:None) |
--ordered-out | 输出顺序与输入 BAM 顺序一致(当进程数=1 时默认开启)(默认:False) |
-f, --overwrite | 覆盖已存在的 tracks(默认:False) |
--kmer-shift KMER_SHIFT | k-mer 偏移量(默认:None) |
--bam-chunksize BAM_CHUNKSIZE | 每进程 BAM 分块大小(默认: |