主成分分析(PCA)---不断补充和更新
主成分分析:自己搜名词解释
分析流程:
分析流程按照引用2,3来,作图简单的也可以用,复杂的图可以用ggplot(见引用4)
生信主成分分析见5
简单的主成分分析实例:
#reference :https://tgmstat.wordpress.com/2013/11/28/computing-and-visualizing
#-pca-in-r/
data("iris") #加载数据,也可以读取自己的数据
name <- iris$Species #定义分类
newiris <- log(iris[,-(4:5)]) #取数据---这里用作主成分分析的只有纯数据
ir.pca <- prcomp(newiris,scale. = T,center = T) #prcomp函数进行主成分分析,prcom#和princomp之间的区别不是很大:http://bbs.pinggu.org/thread-710513-1-1.html
summary(ir.pca) #观测所占比重
print(ir.pca) #输出
plot(ir.pca,type="l") #简单的勾画出碎石图,大致继summary用图直观的看下主成分
predict(ir.pca,newdata = newiris) #进行预测,这一步也可按照引用处的根据最后两行数#据预测 ,但是这个有啥用呢?
library(devtools) #安装并加载画图
install_github("ggbiplot","vqv/ggbiplot")
library(ggbiplot)
g <- ggbiplot(ir.pca,obs.scale = 1,var.scale = 1,
groups = name,ellipse = T,circle = T)
g <- g+scale_color_discrete(name='')
g <- g + theme(legend.direction = "horizontal",
legend.position = "top")
g
引自:
1.多元统计分析及R语言建模-王斌会
2.http://blog.sina.com.cn/s/blog_4da7b8a90101kmss.html
3.http://www.ppvke.com/Blog/archives/30839
4.http://www.dxy.cn/bbs/topic/32183430
5.https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247483995&idx=1&sn=0a2b89be9d34558164699f95cfee0d34&chksm=9b4842e0ac3fcbf6d7b9bbf22b62c8cce8f5a9ae9b9e09c0851196a10bb803d56f6e3cdff5fc&scene=21#wechat_redirect
6.https://github.com/vqv/ggbiplot (这里的wine数据时rattle包里的)