皮尔逊相关系数及假设检验
一、看两者是否算相关要看两方面:显著水平以及相关系数
(1)显著水平,就是P值,这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般p值小于0.05就是显著了;如果小于0.01就更显著;例如p值=0.001,就是很高的显著水平了,只要显著,就可以下结论说:拒绝原假设无关,两组数据显著相关也说两者间确实有明显关系.通常需要p值小于0.1,最好小于0.05设甚至0.01,才可得出结论:两组数据有明显关系,如果p=0.5,远大于0.1,只能说明相关程度不明显甚至不相关.起码不是线性相关.
(2)相关系数,也就是Pearson Correlation(皮尔逊相关系数),通常也称为R值,在确认上面指标显著情况下,再来看这个指标,一般相关系数越高表明两者间关系越密切.
R>0 代表连个变量正相关,即一个变大另一个随之变大
————————————————
版权声明:本文为CSDN博主「xiaocong1990」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/xiaocong1990/article/details/71267144
二、显著性水平P值
讨论两变量是否相关必须讨论显著性水平,不谈P值之谈相关系数大小是无意义的,两者之间的相关关系可能只是偶然因素引起的,所以我们要对两个变量之间的相关关系的显著性水平进行判断;
采用假设检验的方法:
原假设H0: R=0 两变量之间不存在线性关联
备择假设H1: R不等于0,两变量之间存在线性关联
根据假设检验方法,在零假设成立的条件下,即假设两变量不存在相关性的前提下,计算出两变量不存在相关性的概率值(P值),如果这个P值很小,说明两变量不存在相关性的概率很小,我们就可以拒绝原假设,接受备择假设,那么这里我们就需要一个阈值
通常以5%为阈值(这里的阈值也称为显著水平),如果 p