library(ggplot2) library(reshape2)
今天实验的主要任务有:
其中缺失值已经在20180307的notebook中完成了,现在检验一下
tmlallnew <- read.csv("D:\\data\\thesis\\201610\\tmldata\\tmlallnew.csv",header = T) dim(tmlallnew)
table(tmlallnew$日期)
缺失值已经填补完了。
names(tmlallnew)
tmldzz <- tmlallnew[,c(1,2,3)] names(tmldzz)
tmlzz <- dcast(tmldzz,tmldzz$日期~tmldzz$时间序号) dim(tmlzz)
rownames(tmlzz) <- tmlzz[,1] tmlzz <- tmlzz[,2:289] dim(tmlzz)
这样就算基本完成了数据转置,但数值好像有点问题。10月7日最后一个数值异常的大。
通过观察图发现,可能以原始数据进行聚类效果不好,可以尝试应用LOESS后的值进行聚类。
下一步就是研究R语言内的聚类算法了,特别是时间序列聚类。
write.csv(tmlzz,"D:\\data\\thesis\\201610\\tmldata\\tmlzz.csv")
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.