当前位置：首页 > wzjs >正文

云服务器上建网站慈溪企业网站seo

wzjs 2025/9/3 12:30:42

云服务器上建网站,慈溪企业网站seo,郑州app制作开发公司,一个app一年可以赚多少原文链接：如何使用bedtools、convert2bed、gff2bed提取基因序列前言我们的使用基因组注释文件gtf或gff文件从基因组fa文件中提取transcript的方式很多,相对用的比较多的是使用gffread软件。但是gffread软件，提取的序列一般都是transcript序列&#xf…

原文链接：如何使用bedtools、convert2bed、gff2bed提取基因序列

前言

我们的使用基因组注释文件gtf或gff文件从基因组fa文件中提取transcript的方式很多,相对用的比较多的是使用gffread软件。但是gffread软件，提取的序列一般都是transcript序列，若是，我们的想提取的gene序列，那么不能直接使用基因组gtf文件。

本次，我们介绍其中的一种方法。使用bedtools getfasta提取gene全长序列。

注意：这仅仅只是其中的一种方法而已。

软件安装

软件安装，使用mamba安装bedtools,convert2bed,gff2bed。

mamba install -y bedtools convert2bed gff2bed

软件测试

bedtools -h

$ bedtools -hbedtools is a powerful toolset for genome arithmetic.Version:   v2.31.1
About:     developed in the quinlanlab.org and by many contributors worldwide.
Docs:      http://bedtools.readthedocs.io/
Code:      https://github.com/arq5x/bedtools2
Mail:      https://groups.google.com/forum/#!forum/bedtools-discussUsage:     bedtools <subcommand> [options]The bedtools sub-commands include:[ Genome arithmetic ]intersect     Find overlapping intervals in various ways.window        Find overlapping intervals within a window around an interval.closest       Find the closest, potentially non-overlapping interval.coverage      Compute the coverage over defined intervals.map           Apply a function to a column for each overlapping interval.genomecov     Compute the coverage over an entire genome.merge         Combine overlapping/nearby intervals into a single interval.cluster       Cluster (but don't merge) overlapping/nearby intervals.complement    Extract intervals _not_ represented by an interval file.shift         Adjust the position of intervals.subtract      Remove intervals based on overlaps b/w two files.

制作bed文件

使用bedtools提取序列，需要制作bed文件。格式如下所示：

我们可以直接使用awk命令进行提取对应的信息。我们使用Cucumber的gff注释文件提取。

cat Cucumber.CLv4.gff3 | awk '{if($3 == "gene") print $0}' | awk '{print $1"\t"$4"\t"$5"\t"$9"\t"$7}' | head

提取对应的列信息即可。

使用convert2bed或gff2bed结合起来提取信息。

cat Cucumber.CLv4.gff3 |awk '{if($3~/^gene$/)print }' > 01.gene.gff && convert2bed --input=gff --output=bed < 01.gene.gff > 02.gene.bed

获得如下信息

我们在此基础上加上awk的命令即可，同上。

cat Cucumber.CLv4.gff3 |awk '{if($3~/^gene$/)print }' > 01.gff && convert2bed --input=gff --output=bed < 01.gff > 02.bed && awk '{print $1"\t"$2"\t"$3"\t"$10"\t"$6}' <02.bed>03.bed

使用gff2bed软件结合。

awk '{if($3~/^gene$/)print}' Cucumber.CLv4.gff3  > 01.genes.gff && gff2bed <01.genes.gff> 02.genes.bed

使用bedtools getfasta提取序列。

bedtools getfasta -fi Cucumber.geome.fa -bed 02.gene.bed -fo cucumber.gene.fa -name -s

-name参数是必须加的，若是不加，你的cucumber.gene.fa文件中无基因名。

$ bedtools getfasta -hTool:    bedtools getfasta (aka fastaFromBed)
Version: v2.31.1
Summary: Extract DNA sequences from a fasta file based on feature coordinates.Usage:   bedtools getfasta [OPTIONS] -fi <fasta> -bed <bed/gff/vcf>Options: -fi		Input FASTA file-fo		Output file (opt., default is STDOUT-bed		BED/GFF/VCF file of ranges to extract from -fi-name		Use the name field and coordinates for the FASTA header-name+		(deprecated) Use the name field and coordinates for the FASTA header-nameOnly	Use the name field for the FASTA header-split		Given BED12 fmt., extract and concatenate the sequencesfrom the BED "blocks" (e.g., exons)-tab		Write output in TAB delimited format.-bedOut		Report extract sequences in a tab-delimited BED format instead of in FASTA format.- Default is FASTA format.-s		Force strandedness. If the feature occupies the antisense,strand, the sequence will be reverse complemented.- By default, strand information is ignored.-fullHeader	Use full fasta header.- By default, only the word before the first space or tab is used.-rna	The FASTA is RNA not DNA. Reverse complementation handled accordingly.

输出的结果基因ID如下所示。

>CsaV4_1G000004::chr1:1088370-1092905
>CsaV4_1G000005::chr1:1095847-1098019
>CsaV4_1G000003::chr1:1084077-1087157

使用sed命令进行批量处理：

sed 's/::.*//' input.fa > output.fa

若我们的教程对你有所帮助，请点赞+收藏+转发，大家的支持是我们更新的动力！！

2024已离你我而去，2025加油！！

2024年推文汇总 (点击后访问)

2023年推文汇总 (点击后访问)

2022年推文汇总 (点击后访问)

往期部分文章

1. 最全WGCNA教程（替换数据即可出全部结果与图形）

WGCNA分析代码六

推荐大家购买最新的教程，若是已经购买以前WGNCA教程的同学，可以在对应教程留言，即可获得最新的教程。（注：此教程也仅基于自己理解，不仅局限于此，难免有不恰当地方，请结合自己需求，进行改动。）

2. 精美图形绘制教程

精美图形绘制教程
《R语言绘图专栏–50+图形绘制教程》

3. 转录组分析教程

转录组上游分析教程[零基础]
一个转录组上游分析流程 | Hisat2-Stringtie
Samll RNA上游分析

4. 转录组下游分析

批量做差异分析及图形绘制 | 基于DESeq2差异分析
GO和KEGG富集分析
单基因GSEA富集分析
全基因集GSEA富集分析

BioinfoR生信筆記 ，注于分享生物信息学相关知识和R语言绘图教程。

查看全文

http://www.dtcms.com/wzjs/572467.html

服务器可以做几个网站视频直播网站建设费用

手机wap网站建站系统中小企业网络组网案例

网站代理备案表wordpress搭建公司网站

山西网站seo包括哪些内容

2017年做哪个网站致富卖摄影作品的网站

房地产的设计网站建设小红书体现的网络营销方式

做网站php的作用网站简单设计

网站倒计时代码wordpress文件删除

小程序怎么制作网站wordpress评论表情

旅游公司网站开发与实现外贸网站建设

网站建设找谁做h5页面制作平台有哪些

外包网站怎么做seo网站安全建设目的

wordpress 文章插件南宁seo网络推广

网站开发工具发展史四川建设银行手机银行下载官方网站下载安装

青创网站首页wordpress页面和文章

建设银行宁波分行网站dede网站制作

嘉兴建网站专业从事网站开发公司

上海网站建设公司哪家好网站改版提交

flashfxp上传网站模板公司主页网站开发

温州网站优化价格沈阳黄页查询电话

制作企业网站的问题创意设计公司名字大全

子页网站设计网站服务器和空间大小

昆山网站优化公司wordpress创建导航

wdlinux 默认网站长宁区网站建设网页

如何做自己的vip视频解析网站中介订制网站开发

公司网站模板源码中企动力全球邮企业邮箱

长沙外贸网站建设公司价格郴州网站运营公司

个人网站做百度推广wordpress登陆小工具

洛阳网站开发培训ie10网站后台无法编辑

长沙经开区建管站哪个网站可以专门做超链接

原文链接：如何使用bedtools、convert2bed、gff2bed提取基因序列

前言

软件安装

往期部分文章

相关文章：