描述性统计是数据分析初阶必备

07-17 448阅读

大部分统计学,一般四大部分

描述性统计是数据分析初阶必备
(图片来源网络,侵删)

第一部分:描述性统计

第二部分:概率与抽样

第三部分:假设检验

第四部分:统计模型

几乎所有的数据分析都从描述性统计开始。无论是商业、医学、工程还是社会科学,通过描述性统计获得对数据的初步理解和总结,有助于理解后续的统计推断和模型分析

这部分内容主要有

基础变量

连续变量:可以取任意值的变量,如温度、身高

定序变量:有明确顺序但间距不等的变量,如考试成绩(A、B、C)

分类变量:无顺序的分类,如性别、血型

描述集中程度

均值:所有数值的平均值

中位数:按顺序排列后的中间值

众数:出现频率最高的数值

描述离散程度

平均差:数据与均值的差的绝对值的平均数

方差:数据与均值的差的平方的平均数

标准差:方差的平方根,衡量数据的离散程度

描述数据分布形态

箱型图:显示数据的分布、中心和离散程度,包括最小值、第一四分位数、中位数、第三四分位数和最大值

数据图形展示

柱状图,显示不同类别的数量或频率

饼图,显示各部分在整体中的比例

折线图,显示数据的变化趋势

散点图,显示两个变量之间的关系

直方图,显示数据的频率分布

箱型图,显示数据的分布及离散情况

条形图,类似柱状图,条形水平排列

面积图,类似折线图,线下区域填充颜色

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]