科研绘图系列:R语言箱线图(boxplot)
介绍
使用 ggplot2 包画箱线图通常使用 geom_boxplot() 函数。箱线图(Boxplot)是一种用于展示一组数据分布特征的图形,它能够提供以下信息:
- 中位数:箱线图中的中位线表示数据的中位数。
- 四分位数:箱线图的箱子部分表示数据的四分位数范围,即25%和75%分位数,这可以展示数据的中间50%的分布情况。
- 异常值:箱线图通常会用点来表示异常值,即那些远离数据主体的值。
- 最小值和最大值:在某些箱线图中,除了四分位数之外,还会展示最小值和最大值(不包括异常值)。
- 数据的偏斜性:箱线图的形状可以揭示数据的偏斜性。如果箱子是对称的,那么数据可能接近正态分布;如果箱子倾斜,则数据可能偏斜。
箱线图非常适合用于比较不同组别的数据分布情况,例如,比较不同治疗方法的效果,或者不同群体的某个指标的分布。
在ggplot2 中,可以通过使用 geom_point() 来在箱线图上增加点,这些点可以代表分组中特定指标的出现率。
加载R包
knitr::opts_chunk$set(echo = T
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。