lumpy:基因组结构变异SV的检测
lumpy应用
- 一、简介
- 1、SV检测一直是基因组研究领域的国际性难题,主要有以下几点原因
- 2、目前常用的SV检测方法有如下四种
- 二、软件安装
- 1、从conda安装
- 2、从docker安装
- 三、lumpy使用
一、简介
1、SV检测一直是基因组研究领域的国际性难题,主要有以下几点原因
1)测序方法的技术局限。
短读长测序技术(如Illumina)在检测大的结构变异上有困难,因为读长较短,无法跨越大的重复区域或复杂的结构变异区域;
长读长测序技术(如PacBio或Oxford Nanopore)成本较高,数据量也大,处理起来复杂。
2)SV的复杂性。
结构变异本身类型多样,比如倒位、易位等,这些变异的检测需要不同的算法和策略。
而且,有些SV可能发生在重复序列区域,比如LINE、SINE或端粒区域,这些区域的重复性高,比对困难,容易导致误检或漏检。
同时,参考基因组的质量也很重要,如果参考基因组本身在这些复杂区域有缺失或错误,会影响SV检测的准确性。
2、目前常用的SV检测方法有如下四种
第一种,利用pairend关系的reads,简称PEM的方法;
第二种,利用切割reads的方法,split read简称SR;
第三种,利用reads丰度信息,read depth简称RD;
第四种,利用序列拼接的方法;
lumpy是目前比较流行的一款SV检测工具,它同时支持PEM与SR和RD三种模式。在biostar上很多用户推荐,在lumpy所发的文章中,与Pindel,delly&