HISAT2 Bowtie2 提取唯一比对 unique mapping reads

2023-03-25 1378阅读

温馨提示:这篇文章已超过554天没有更新,请注意相关的内容是否还可用!

HISAT2 Bowtie2 提取唯一比对 unique mapping readsHISAT2和Bowtie2是两种常用的比对软件,它们在RNA-seq分析中扮演着重要的角色。如果一个read只能与参考基因组上的一个位置相匹配,则称该read为unique mapping read。显然,唯一比对的reads更可靠,可以减少假阳性的影响。Bowtie2Bowtie2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。与HISAT2不同的是,Bowtie2还提供了--un-conc-gz参数,可以将未比对的reads输出到指定文件中。需要注意的是,与HISAT2类似,Bowtie2也不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。无论是使用HISAT2还是Bowtie2,都需要注意过滤掉discordant mapping、mixed mapping和unmapped的reads,以保证结果的可靠性。
HISAT2 Bowtie2 提取唯一比对 unique mapping reads

HISAT2 Bowtie2 提取唯一比对 unique mapping reads

HISAT2 Bowtie2 提取唯一比对 unique mapping reads
(图片来源网络,侵删)
HISAT2 Bowtie2 提取唯一比对 unique mapping reads
(图片来源网络,侵删)

HISAT2和Bowtie2是两种常用的比对软件,它们在RNA-seq分析中扮演着重要的角色。然而,在实际应用中,我们往往需要从大量的比对结果中筛选出唯一比对的reads,以便进行后续的差异表达分析等研究。

本文将介绍如何使用HISAT2和Bowtie2提取唯一比对的reads,并探讨其优缺点和适用范围。

首先,我们需要了解什么是unique mapping reads。当我们进行RNA-seq数据的比对时,会将reads与参考基因组进行比对。如果一个read只能与参考基因组上的一个位置相匹配,则称该read为unique mapping read。反之,如果一个read可以与参考基因组上多个位置相匹配,则称该read为non-unique mapping read。显然,唯一比对的reads更可靠,可以减少假阳性的影响。

接下来,我们将分别介绍HISAT2和Bowtie2如何提取唯一比对的reads。

HISAT2

HISAT2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。通过使用HISAT2,我们可以轻松地提取唯一比对的reads。

HISAT2提供了--no-discordant和--no-mixed两个参数,可以用于过滤掉discordant mapping和mixed mapping的reads。其中,discordant mapping指的是两个paired-end reads在参考基因组上的距离超出了预设的阈值,而mixed mapping则指一个read的一部分匹配到一个位置,另一部分匹配到另一个位置。

使用HISAT2提取唯一比对的reads的命令如下:

hisat2 -x genome_index -1 read1.fq -2 read2.fq --no-discordant --no-mixed | samtools view -bS -F 4 - > unique.bam

其中,-x指定参考基因组索引文件的路径,-1和-2指定paired-end reads的路径,--no-discordant和--no-mixed用于过滤discordant mapping和mixed mapping的reads,samtools view -bS -F 4用于过滤掉unmapped的reads,最后将结果输出到unique.bam文件中。

需要注意的是,HISAT2并不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。

Bowtie2

Bowtie2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。与HISAT2类似,Bowtie2也可以用于提取唯一比对的reads。

Bowtie2提供了--no-discordant和--no-mixed两个参数,可以用于过滤掉discordant mapping和mixed mapping的reads。与HISAT2不同的是,Bowtie2还提供了--un-conc-gz参数,可以将未比对的reads输出到指定文件中。

使用Bowtie2提取唯一比对的reads的命令如下:

bowtie2 -x genome_index -1 read1.fq -2 read2.fq --no-discordant --no-mixed --un-conc-gz unaligned.fq.gz | samtools view -bS -F 4 - > unique.bam

其中,-x指定参考基因组索引文件的路径,-1和-2指定paired-end reads的路径,--no-discordant和--no-mixed用于过滤discordant mapping和mixed mapping的reads,--un-conc-gz用于将未比对的reads输出到unaligned.fq.gz文件中,samtools view -bS -F 4用于过滤掉unmapped的reads,最后将结果输出到unique.bam文件中。

需要注意的是,与HISAT2类似,Bowtie2也不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。

总结

HISAT2和Bowtie2都是常用的RNA-seq比对软件,它们都可以用于提取唯一比对的reads。在实际应用中,我们需要根据数据特点和研究目的选择合适的比对软件和参数。无论是使用HISAT2还是Bowtie2,都需要注意过滤掉discordant mapping、mixed mapping和unmapped的reads,以保证结果的可靠性。

有云计算,存储需求就上慈云数据:点我进入领取200元优惠券
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]