描述性统计是数据分析初阶必备
大部分统计学,一般四大部分
(图片来源网络,侵删)
第一部分:描述性统计
第二部分:概率与抽样
第三部分:假设检验
第四部分:统计模型
几乎所有的数据分析都从描述性统计开始。无论是商业、医学、工程还是社会科学,通过描述性统计获得对数据的初步理解和总结,有助于理解后续的统计推断和模型分析
这部分内容主要有
基础变量
连续变量:可以取任意值的变量,如温度、身高
定序变量:有明确顺序但间距不等的变量,如考试成绩(A、B、C)
分类变量:无顺序的分类,如性别、血型
描述集中程度
均值:所有数值的平均值
中位数:按顺序排列后的中间值
众数:出现频率最高的数值
描述离散程度
平均差:数据与均值的差的绝对值的平均数
方差:数据与均值的差的平方的平均数
标准差:方差的平方根,衡量数据的离散程度
描述数据分布形态
箱型图:显示数据的分布、中心和离散程度,包括最小值、第一四分位数、中位数、第三四分位数和最大值
数据图形展示
柱状图,显示不同类别的数量或频率
饼图,显示各部分在整体中的比例
折线图,显示数据的变化趋势
散点图,显示两个变量之间的关系
直方图,显示数据的频率分布
箱型图,显示数据的分布及离散情况
条形图,类似柱状图,条形水平排列
面积图,类似折线图,线下区域填充颜色
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。