HISAT2 Bowtie2 提取唯一比对 unique mapping reads
温馨提示:这篇文章已超过554天没有更新,请注意相关的内容是否还可用!
HISAT2 Bowtie2 提取唯一比对 unique mapping readsHISAT2和Bowtie2是两种常用的比对软件,它们在RNA-seq分析中扮演着重要的角色。如果一个read只能与参考基因组上的一个位置相匹配,则称该read为unique mapping read。显然,唯一比对的reads更可靠,可以减少假阳性的影响。Bowtie2Bowtie2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。与HISAT2不同的是,Bowtie2还提供了--un-conc-gz参数,可以将未比对的reads输出到指定文件中。需要注意的是,与HISAT2类似,Bowtie2也不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。无论是使用HISAT2还是Bowtie2,都需要注意过滤掉discordant mapping、mixed mapping和unmapped的reads,以保证结果的可靠性。HISAT2 Bowtie2 提取唯一比对 unique mapping reads
HISAT2和Bowtie2是两种常用的比对软件,它们在RNA-seq分析中扮演着重要的角色。然而,在实际应用中,我们往往需要从大量的比对结果中筛选出唯一比对的reads,以便进行后续的差异表达分析等研究。
本文将介绍如何使用HISAT2和Bowtie2提取唯一比对的reads,并探讨其优缺点和适用范围。
首先,我们需要了解什么是unique mapping reads。当我们进行RNA-seq数据的比对时,会将reads与参考基因组进行比对。如果一个read只能与参考基因组上的一个位置相匹配,则称该read为unique mapping read。反之,如果一个read可以与参考基因组上多个位置相匹配,则称该read为non-unique mapping read。显然,唯一比对的reads更可靠,可以减少假阳性的影响。
接下来,我们将分别介绍HISAT2和Bowtie2如何提取唯一比对的reads。
HISAT2
HISAT2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。通过使用HISAT2,我们可以轻松地提取唯一比对的reads。
HISAT2提供了--no-discordant和--no-mixed两个参数,可以用于过滤掉discordant mapping和mixed mapping的reads。其中,discordant mapping指的是两个paired-end reads在参考基因组上的距离超出了预设的阈值,而mixed mapping则指一个read的一部分匹配到一个位置,另一部分匹配到另一个位置。
使用HISAT2提取唯一比对的reads的命令如下:
hisat2 -x genome_index -1 read1.fq -2 read2.fq --no-discordant --no-mixed | samtools view -bS -F 4 - > unique.bam
其中,-x指定参考基因组索引文件的路径,-1和-2指定paired-end reads的路径,--no-discordant和--no-mixed用于过滤discordant mapping和mixed mapping的reads,samtools view -bS -F 4用于过滤掉unmapped的reads,最后将结果输出到unique.bam文件中。
需要注意的是,HISAT2并不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。
Bowtie2
Bowtie2是一款快速、准确的RNA-seq比对软件,具有高效的splice junction检测和处理功能。与HISAT2类似,Bowtie2也可以用于提取唯一比对的reads。
Bowtie2提供了--no-discordant和--no-mixed两个参数,可以用于过滤掉discordant mapping和mixed mapping的reads。与HISAT2不同的是,Bowtie2还提供了--un-conc-gz参数,可以将未比对的reads输出到指定文件中。
使用Bowtie2提取唯一比对的reads的命令如下:
bowtie2 -x genome_index -1 read1.fq -2 read2.fq --no-discordant --no-mixed --un-conc-gz unaligned.fq.gz | samtools view -bS -F 4 - > unique.bam
其中,-x指定参考基因组索引文件的路径,-1和-2指定paired-end reads的路径,--no-discordant和--no-mixed用于过滤discordant mapping和mixed mapping的reads,--un-conc-gz用于将未比对的reads输出到unaligned.fq.gz文件中,samtools view -bS -F 4用于过滤掉unmapped的reads,最后将结果输出到unique.bam文件中。
需要注意的是,与HISAT2类似,Bowtie2也不能保证所有的unique mapping reads都能被提取出来,因为有些reads可能会被标记为secondary或supplementary alignment,这些reads通常被认为不够可靠,因此被过滤掉了。
总结
HISAT2和Bowtie2都是常用的RNA-seq比对软件,它们都可以用于提取唯一比对的reads。在实际应用中,我们需要根据数据特点和研究目的选择合适的比对软件和参数。无论是使用HISAT2还是Bowtie2,都需要注意过滤掉discordant mapping、mixed mapping和unmapped的reads,以保证结果的可靠性。
有云计算,存储需求就上慈云数据:点我进入领取200元优惠券