STAR 命令参数解释
以这个为例子解释STAR参数含义
(图片来源网络,侵删)
STAR 命令参数解释
STAR \ --outFilterType BySJout \ --runThreadN 8 \ --outFilterMismatchNmax 2 \ --genomeDir \ --readFilesIn \ --outFileNamePrefix \ --outSAMtype BAM SortedByCoordinate \ --quantMode TranscriptomeSAM GeneCounts \ --outFilterMultimapNmax 1 \ --outFilterMatchNmin 16 \ --alignEndsType EndToEnd
-
--outFilterType BySJout:
- 过滤类型,BySJout 表示只输出通过Splice Junction过滤的reads。这对于检测新的剪接位点非常有用。
-
--runThreadN 8:
- 使用8个线程进行计算。多线程可以加速处理速度,特别是在多核处理器上。
-
--outFilterMismatchNmax 2:
- 每个read允许的最大错配数。如果一个read有超过2个错配,则不会被输出。这个参数控制比对的精确度。
-
--genomeDir :
- 指定参考基因组索引的目录。这里假设是hg19基因组的STAR索引。
-
--readFilesIn :
- 输入的FASTQ文件,包含待比对的reads。
-
--outFileNamePrefix :
- 输出文件的前缀。所有输出文件的名称都会以这个前缀开始。
-
--outSAMtype BAM SortedByCoordinate:
- 指定输出文件类型和排序方式。这里输出的文件格式为BAM,并按坐标排序。
-
--quantMode TranscriptomeSAM GeneCounts:
- TranscriptomeSAM:输出转录组的比对结果(适用于下游转录组分析工具)。
- GeneCounts:生成基因计数文件。
-
--outFilterMultimapNmax 1:
- 每个read允许的最大多比对数(multimapping)。设为1意味着只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。
-
--outFilterMatchNmin 16:
- 每个read的最小比对长度。如果一个read比对的长度小于16bp,则不会被输出。这个参数控制比对的质量。
-
--alignEndsType EndToEnd:
- 比对模式,EndToEnd 表示全长比对,要求read的两端都比对到参考基因组。
是否保留多比对(multimapping)
根据参数 --outFilterMultimapNmax 1,该设置表明只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。因此,该命令配置没有保留多比对的reads,只有唯一比对的reads会被保留和输出。
总结
- --outFilterMultimapNmax 1 参数设定为1,意味着不保留多比对的reads,只保留唯一比对的reads。
- 其他参数控制比对的精确度、输出格式和质量过滤标准。
通过这些设置,STAR将只输出那些唯一比对到参考基因组的位置、且质量符合要求的reads。
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。