哪里卖有三种颜色的月季树? 当前位置:首页>哪里卖有三种颜色的月季树?>正文

哪里卖有三种颜色的月季树?

发布时间:2019-04-23

原标题:R语言-主成分分析

1.PCA

使用场景:主成分分析是一种数据降维,可以将大量的相关变量转换成一组很少的不相关的变量,这些无关变量称为主成分

  步骤:

  1. 数据预处理(保证数据中没有缺失值)
  2. 选择因子模型(判断是PCA还是EFA)
  3. 判断要选择的主成分/因子数目
  4. 选择主成分
  5. 旋转主成分
  6. 解释结果
  7. 计算主成分或因子的得分

  案例:从USJudgeRatings数据集中有11个变量,如何去减化数据(单个主成分分析)

    1.使用碎石图确定需要提取的主成分个数

1 library(psych)
2 # 1.做出碎石图确定主成分的个数
3 fa.parallel(USJudgeRatings[,-1],fa="pc",n.iter = 100,show.legend = F,main = "Scree plot with parallel analysis")

  结论:在特征值大于1的的点附近,都表明保留1个主成分即可

  2.提取主成分

1 # 1.第一个参数是关系矩阵
2 # 2.nfactors指定主成分的个数
3 # 3.rotate指定旋转方法,默认varimax
4 # 4.scores表示是否需要计算主成分得分,默认不需要
5 pc <- principal(USJudgeRatings[,-1],nfactors = 1)
6 pc

  结论:第一主成分与每一个变量高度相关

  3.获取主成分得分

1 pc <- principal(USJudgeRatings[,-1],nfactors = 1,scores = T)
2 head(pc$scores)
3 cor(USJudgeRatings$CONT,pc$scores)

  4.获取相关系数

1 cor(USJudgeRatings$CONT,pc$scores)

  结论:律师和法官的私交和律师的评级没有关系

  案例2:减少女孩身体指标的主成分分析(多个主成分分析)

  1.判断个数

1 fa.parallel(Harman23.cor$cov,n.obs = 203,fa="pc",n.iter = 100,show.legend = F,
2             main = "Scree plot with parallel analysis")

  结论:有2个点在水平线1上,所以需要2个主成分

  2.主成分分析

pc2 <- principal(Harman23.cor$cov,nfactors = 2,rotate = "none")
pc2

  

  结论:需要对数据旋转作进一步分析

  3.主成分旋转(尽可能对成分去噪)

1 rc <- principal(Harman23.cor$cov,nfactors = 2,rotate = "varimax")
2 rc

  4.获取主成分的得分系数

1 round(unclass(rc$weights),2)

  

  结论:可以通过系数*数值来计算出主成分得分

2.EFA

使用场景:探索因子分析发掘数据下一组较少的,无法观测的变量来解释一组可观测变量的相关性

  案例:使用EFA对6个心理学测试来检测参与者的得分

  1.判断需要提取的因子数

1 covariances <- ability.cov$cov
2 correlations <- cov2cor(covariances)
3 fa.parallel(correlations,n.obs = 112,fa="both",n.iter=100,main = "Scree plots with parallel analysis")

  结论:需要提取2个因子,因为图形在拐点之上有2个分布

  2.提取公共因子

1 fa <- fa(correlations,nfactors = 2,rotate = "none",fm="pa")
2 fa

  结论:2个因子解释了6个心理学测试的60%方差,需要进一步旋转

1 fa.varimax <- fa(correlations,nfactors=2,rotate="varimax",fm="pa")
2 fa.varimax

  结论:阅读和词汇在第一个因子占比较大,画图,积木在第二个因子上成分较大,如果想进一步判断这个各因子是否相关,需要使用斜交旋转提取因子

1 fa.promax <- fa(correlations,nfactors=2,rotate="Promax",fm="pa")
2 fa.promax

  结论:相关性为0.57,相关性很大,如果相关性不大,使用正交旋转即可

  3.计算得分

 1 fsm <- function(oblique) {
 2   if (class(oblique)[2]=="fa" & is.null(oblique$Phi)) {
 3     warning("Object doesn"t look like oblique EFA")
 4   } else {
 5     P <- unclass(oblique$loading)
 6     F <- P %*% oblique$Phi
 7     colnames(F) <- c("PA1", "PA2")
 8     return(F)
 9   }
10 }
11 
12 fsm(fa.promax)

  5.正交旋转所得因子得分图

 

   结论:词汇和阅读在第一因子上载荷较大,图片,迷宫,积木在第二个因子上载荷较大,普通智力检测在二者的分布较为平均

  6.斜交旋转所生成的因子图

1 fa.diagram(fa.promax,simple = F)

  结论:显示了因子之间的关系,该图比上一张图更为准确

   

    

当前文章:http://www.nsmsa.com.cn/h0fam.html

发布时间:2019-04-23 03:43:10

2017年棕榈常用规格和价格_最新版 麦冬草耐旱吗? 2016年你一定不知的国内最大的紫玉兰树苗基地! 2017年2月17日最新白玉兰报价 华东花卉集中产区,中国红枫之乡,种植面积继续扩大 粗茎早熟禾是干什么用的? 艾草种子什么时候播种最好? 足球场草坪用狗牙根可以吗? 草花一个平方播种多少种子? 皇竹草真实产量多少吨一亩?

58017 65902 90147 45201 32964 35664 78854 59814 90474 83748 10799 51489 17621 60024 71583 36867 63734 75205 22618 27901 94785 34585 43253

责任编辑:宗陵建杜