当前位置: 首页 > wzjs >正文

小米路由2 做网站郑州seo顾问培训

小米路由2 做网站,郑州seo顾问培训,html5手机网页模板,西安专业做网站建设拿到测序得到的RNA-seq的fastq数据之后,首先需要对测序数据进行质控,检查一下数据的质量。那么如何进行质控呢? 之前我对这个的理解总是云里雾里的,现在想对此认真地理一理。也希望我的学习结果可以分享给更多的人。 一、碱基质量…

拿到测序得到的RNA-seq的fastq数据之后,首先需要对测序数据进行质控,检查一下数据的质量。那么如何进行质控呢?
之前我对这个的理解总是云里雾里的,现在想对此认真地理一理。也希望我的学习结果可以分享给更多的人。

一、碱基质量表征

我们拿到fastq数据之后,需要评估每一个位点测出来的碱基是这个碱基的可靠性。而在这里,测序平台在返还的fastq的数据中就已经包含了这部分信息。我们要做的就是利用这些信息,对序列进行过滤和修剪,保留高质量的测序读段,便于下游的比对等环节。

1.经典的fastq序列的结构

经典的fastq序列由以下四部分组成:@开头的序列名;我们测到的碱基序列;+;一些近似于乱码的符号。
这里有用的部分就是第二行和第四行的信息。第二行是测序平台测到的序列,而第四行则每一个符号和第二行的碱基一一对应,表示的是碱基的测序质量。为什么这些乱码的符号可以表示碱基的测序质量呢?这里存在有一个转换。

@LH00308:393:22TCC7LT4:1:1101:41256:1028 2:N:0:CTCCGTTA+TNGGAACC
NATACCGTGGCATTGACTGCCTTGCTGTGGCCTATGGCGTAGCTGTTAACAAGCTCACACTGCCCATCCCATCCACCTGCCCCGAGCCCTTCGCACAGCTTATGGCCGACTGCTGGGCGCAGGACCCCCACCGCANGNNNGACTTCGCNT
+
#IIIIIIIIII9IIIIIIIIIIIIIIIIIII*IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII#I###IIIIIIII#I
2.碱基的测序质量表征

公式如下,其中p为测序出错率,比如可以为0.01,即该碱基测错的可能性为1/100。p越小,说明碱基的质量越高;相应地,经过下面的公式转换后,计算得到q为20。上述转换即把测序质量进行更加直观的表示,q越大,说明测序质量越高;q的取值范围在0-40之间;并且这样转换的另一个好处是,可以将q的数值和ASCII的字符编码一一对应起来(为了对应方便会加一个33,ASCII的可见字符分布在33-126之间),从而实现单个碱基和表征测序质量的单个字符一一对应,方便计算机存储。这个转换可以说非常的巧妙。

q = − 10 ∗ l o g 10 ( p ) q=-10*log_{10}(p) q=10log10(p)

下图表示的是ASCII码和数值的对应关系。
在这里插入图片描述
那么借此,我们就可以对fastq文件中序列的测序质量进行查看和分析。

二、碱基质量在质控结果中的体现

我们一般常用fastQC来对fastq文件进行质量检查(代码实现环节此不赘述),其输出了许多的指标,其中有关碱基质量的有如下:

1. 读段每一个碱基位置的碱基质量分布

通常以下图的形式进行展示(下面这张图算是质量比较好的)。其中行,为读段的位置,我的数据是经典的150bp。列为碱基的质量,即前面提到的q(在0-40之间)。这张图表示的是,对于这个文件中的读段,分别统计每一个位置的碱基质量,然后绘制boxplot。每一个位点有一个boxplot。那么可以得知测序的过程中,测到的碱基质量是否具有位置的偏好性(其中一种常见的情况是,在读段的后半部分,碱基质量会降低,这提示我们可能需要根据位置进行修剪)。
在这里插入图片描述

2. 所有读段的平均碱基质量

我们还可以统计每一个读段的平均碱基质量,绘制碱基质量的分布曲线,从而可以对质量较差的读段进行整个的过滤。下图显示大部分的读段的平均质量在39附近。
在这里插入图片描述

三、针对于碱基质量的处理

主要有两个思路,第一,对于整体质量较低的读段,直接按照质量的阈值进行过滤。第二,对于可能具有位置偏好性的读段(比如前面或者后面的测序质量很差),则可以针对位置对读段进行修剪,保留高质量的读段片段。
这里需要注意的一点是,对于双端测序的读段序列,可能存在一对中的其中一个不符合质控条件而被剔除。由于后续的比对环节通常要求双端测序的文件在序列顺序上是一致的,因此需要使用在处理的时候考虑将双端测序文件在处理后依然保持一致的工具,比如trimmomatic。

http://www.dtcms.com/wzjs/443507.html

相关文章:

  • 企业平台的作用网站seo专员
  • 郑州网站推广招聘注册域名要钱吗
  • 做网站放广告赚钱西安网站设计开发
  • 中山做外贸网站常用的关键词有哪些
  • 做境外旅游的网站百度经验首页
  • 怎么从阿里巴巴做网站seo建站系统
  • 搭设企业网站教程网络热词
  • 广安北京网站建设百度指数的功能
  • 网站建设分金手指专业五百度网盘首页
  • 二级域名做网站百度推广登陆平台
  • 电商平台网站制作费用百度推广价格价目表
  • h5网站动画怎么做seo短视频网页入口
  • 小偷程序做的网站能用吗最新域名ip地址
  • html可视化布局工具qq群排名优化软件购买
  • 网站开发制作接单平台seoul是啥意思
  • 做好网站怎么做app学电脑培训班
  • 校园门户网站 建设搜索引擎推广有哪些平台
  • 朋友用我的vps做网站免费个人网站源码
  • 制作网站的步骤有哪些登封搜索引擎优化
  • 做智能家居网站需要的参考文献天天网站
  • 揭阳网站制作专业厦门百度seo公司
  • 怎么做网站开发的方案百度网站推广排名优化
  • diy建站系统老哥们给个关键词
  • 海南房产网站开发网店推广策划书
  • 网站备案没公司百度竞价推广方法
  • 网站设计的一般流程搜索引擎优化学习
  • 游戏网站开发计划书南京seo排名
  • 动态网站开发毕业论文山东关键词优化联系电话
  • 孝昌县专注网站建设代理seo排名点击首页
  • 游戏代码大全可复制什么叫做seo