R语言二元正态分布及双变量相关分析的示例分析
R语言二元正态分布及双变量相关分析的示例分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
公司主营业务:网站设计、成都网站制作、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联公司是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联公司推出辽阳县免费做网站回馈大家。
皮尔逊系数、斯皮尔曼系数、肯德尔系数,这是我们在双变量相关分析中经常使用的三大相关系数。皮尔逊系数使用时有一个基本条件,两变量应满足二元正态分布,否则建议选用斯皮尔曼相关系数。所以,两个连续数据相关分析前,我们有必要首先进行多元(二元)正态分布的检验。R语言中,我们可以使用mvnormtest包中的mshapiro.test函数完成。现在我想考察一下初始薪金和当前薪金间的相关性,
首先来做二元正态分布检验。
mydata <- t(employee[,6:7])
mshapiro.test函数的参数U要求是每行是变量,每列是个案,因此我们需要t函数做行列转置。
library(mvnormtest)
mshapiro.test(mydata)
Shapiro-Wilk normality testW = 0.70689, p-value < 2.2e-16多元正态分布的
原假设是服从正态分布,经过检验发现,p-value <0.001,显然有理由拒绝原假设,说明这两个变量数据不服从二元正态分布。此时皮尔逊相关系数是不合适的,那我们就
用斯皮尔曼系数来反映初始薪金和当前薪金的相关性。
cor.test(x=employee$salbegin,y=employee$salary,method = "spearman")
Spearman's rank correlation rho
data: employee[, 6] and employee[, 7]
S = 3090197, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.8258977
斯皮尔曼显著性检验 p-value <0.001,通过检验,说明存在相关性,有统计学意义。二者的相关程度如何呢?斯皮尔曼相关系数r=0.826,
说明当前薪金和起始薪金间存在较强的正向相关性。看完上述内容,你们掌握R语言二元正态分布及双变量相关分析的示例分析的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注创新互联行业资讯频道,感谢各位的阅读!
当前标题:R语言二元正态分布及双变量相关分析的示例分析
文章路径:
http://dzwzjz.com/article/gssgsj.html