R/MKMplot.R
In signatureSurvival: Signature Survival Analysis

Documented in MKMplot

MKMplot <-
function(data,mol,X, HR="hazard risk",time="month", status="status", 
         sml="hv",quant=c("No",-0.2,0.2),plotmethod="plot",adjx)	{

  ######################################################################################
  # This function perform multivariate (gene+age+sex) survival Meier-Kaplan curvers
	# data is survprotein object
	# gene is single or combined gene (in one column)
	# output is plot graphs
	#
	#######################################################################################
  
  HR<-tolower(HR)
if(HR=="hazard risk"||HR=="hazard_risk"){
  HR<-"hrisk"
}else{
  HR="hrate"
}
#	library(survival)
#	rm(list=ls(all=TRUE))
#    library(ISwR)
qt<-quant[1]
lw<-as.numeric(quant[2])
hg<-as.numeric(quant[3])

colnms<-tolower(colnames(data))
mth<-is.element(colnms,tolower(time))
sts<-is.element(colnms,tolower(status))
data$PFS = as.vector(data[,mth])
data$PFS= as.numeric(data[,mth])

data = data [!is.na (data[,"PFS"] ), ]
data$PFS= data$PFS
temp.PFS= data$PFS
#data$status
data = data [!is.na (data[,sts] ), ]
dim(data)
molename = names(data)

#pdf(file, width=12, height=12)
res1=c()
########################################################
pn=ncol(data)
#data$PFS [data$PFS > 6]=6
month<-data[,mth]
status<-data[,sts]
#age<-data$age
#sex<-data$sex
Y<-colnames(data)

if(!is.null(X)){
  if(length(X)==1){
    j<-is.element(Y,X)
    X1<-data[,j]
  }else if(length(X)==2){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
  }else if(length(X)==3){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
  }else if(length(X)==4){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
  }else if(length(X)==5){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
  }else if(length(X)==6){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
    j<-is.element(Y,X[6])
    X6<-data[,j]
  }else if(length(X)==7){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
    j<-is.element(Y,X[6])
    X6<-data[,j]
    j<-is.element(Y,X[7])
    X7<-data[,j]
  }else if(length(X)==8){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
    j<-is.element(Y,X[6])
    X6<-data[,j]
    j<-is.element(Y,X[7])
    X7<-data[,j]
    j<-is.element(Y,X[8])
    X8<-data[,j]
  }else if(length(X)==9){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
    j<-is.element(Y,X[6])
    X6<-data[,j]
    j<-is.element(Y,X[7])
    X7<-data[,j]
    j<-is.element(Y,X[8])
    X8<-data[,j]
    j<-is.element(Y,X[9])
    X9<-data[,j]
  }else if(length(X)==10){
    j<-is.element(Y,X[1])
    X1<-data[,j]
    j<-is.element(Y,X[2])
    X2<-data[,j]
    j<-is.element(Y,X[3])
    X3<-data[,j]
    j<-is.element(Y,X[4])
    X4<-data[,j]
    j<-is.element(Y,X[5])
    X5<-data[,j]
    j<-is.element(Y,X[6])
    X6<-data[,j]
    j<-is.element(Y,X[7])
    X7<-data[,j]
    j<-is.element(Y,X[8])
    X8<-data[,j]
    j<-is.element(Y,X[9])
    X9<-data[,j]
    j<-is.element(Y,X[10])
    X10<-data[,j]
  }
}else{
  stop("no co-variate factores input")
}

if(is.character(mol)){
  kind<-is.element(colnms,tolower(mol)) 
  ml<-which(kind==TRUE)
}else if(is.numeric(mol)){
  ml<-mol
}
#	for (mol in 7:pn) {
p.val1 =c()
#	mol=7
 # plt<-par(mfrow=c(3,3))
#	for (jj in seq(10,90,10)){
	molecule <- molename[ml]
#      print(molecule)
	if(length(X)==1){
	  data1 <- cbind(data[,ml], month,status,X1)
	}else if(length(X)==2){
	  data1 <- cbind(data[,ml], month,status,X1,X2)
	}else if(length(X)==3){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3)
	}else if(length(X)==4){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4)
	}else if(length(X)==5){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5)
	}else if(length(X)==6){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5,X6)
	}else if(length(X)==7){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5,X6,X7)
	}else if(length(X)==8){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5,X6,X7,X8)
	}else if(length(X)==9){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5,X6,X7,X8,X9)
	}else if(length(X)==10){
	  data1 <- cbind(data[,ml], month,status,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10)
	}
	
      colnames(data1)[1]<-molecule
      data1<-as.data.frame(data1)
   #   dat<-apply(data1,2,na.omit)
      dat1<-apply(data1,2,as.numeric)
      data1<-as.data.frame(dat1)
#print(head(data1))
#     data1 <- data[!is.na(data[,molecule]),c(molecule,"PFS", "status")]
	data1$Conc <- "Null"
#	cutoff = median(data1[,molecule], jj/100, na.rm=T )

      zv<-(data1[,molecule]-mean(data1[,molecule]))/sqrt(var(data1[,molecule]))

       cutoff = median(data1[,molecule])
       data1$zv<-zv
       if(qt=="yes"||qt=="Y"||qt=="YES"){
       data1$Conc[data1$zv>=quantile(zv, hg)] <- "High"
       data1$Conc[data1$zv<=quantile(zv, lw)] <- "Low"
       }else{
       data1$Conc[data1$zv<= lw]<-"Low"
	     data1$Conc[data1$zv>= hg]<-"High"
           }
#       data1$Conc [ data1[,molecule]>  cutoff]="High"
 # print(data1)
      data1<-subset(data1,data1$Conc!="Null")

#######

	## Creating the survival object
	msurv <- Surv(data1$month, data1$status)
	data1$PFS
	data1$status
	msurv
	##END

	data1$grp <-0
	#data1$grp [ data1$Conc == "Low"] = 0
	data1$grp [ data1$Conc == "High"] <- 1
	if(length(X)==1){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1, data = data1)
	}else if(length(X)==2){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2, data = data1)
	}else if(length(X)==3){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3, data = data1)
	}else if(length(X)==4){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4, data = data1)
	}else if(length(X)==5){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5, data = data1)
	}else if(length(X)==6){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5+X6, data = data1)
	}else if(length(X)==7){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5+X6+X7, data = data1)
	}else if(length(X)==8){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5+X6+X7+X8, data = data1)
	}else if(length(X)==9){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5+X6+X7+X8+X9, data = data1)
	}else if(length(X)==10){
	  hr = coxph(formula = Surv(month, status==1) ~  grp+X1+X2+X3+X4+X5+X6+X7+X8+X9+X10, data = data1)
	}

	res = c( molecule ,summary(hr)$conf.int[1:4], summary(hr)$sctest[3])
  #    print(summary(hr))
	##The Kaplan-Meier estimator
	mfit <- survfit(msurv ~1)
	options(survfit.print.mean = TRUE)
	mfit

	summary(mfit)
	#plot(mfit, conf.int = FALSE)
	###END

	######### Group Comparison
	mfit.byGroups <- survfit(Surv(month, status == 1) ~ Conc, data = data1)
	mfit.byGroups
#	print(summary(mfit.byGroups))
	if (plotmethod=="plot" ){

	plt<-plot(mfit.byGroups, conf.int = FALSE, lty=1, col=c("red","blue"), lwd=3.5, 
	          cex.axis=2.2,xlab=time,ylab="survival probability", cex.lab=1.8)
		box(lwd=1.8)
		low.n = sum(data1$Conc == "Low")
		high.n = sum(data1$Conc == "High")
		legend("bottomleft", c(paste ("Low(n=",low.n ,")" ), paste ("High(n=",high.n ,")" )), col=c("blue","red"),

		bty = "n", cex= 1.0, lty = 1, lwd=2.5)
		if(length(X)==1){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X),cex.main=2,font.main=1.8)
		}else if(length(X)==2){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2]),cex.main=1.5,font.main=1.8)
		}else if(length(X)==3){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2],",",X[3]),cex.main=1.5,font.main=1.8)
		}else if(length(X)==4){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2],",",X[3],",",X[4]),cex.main=1.5,font.main=1.8)
		}else if(length(X)==5){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5]),cex.main=1.5,font.main=1.8)
		}else if(length(X)==6){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5],",",X[6]),cex.main=1.5,font.main=1.8)
		}else if(length(X)>6){
		  title(paste("Gene",ml,":",molecule,"\ncovar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5],",",X[6],"..."),cex.main=1.5,font.main=1.8) 
		}
	#	mtext (jj)
#		p.val = as.numeric (summary(hr)$coeff[5])
		coeffs <- coef(summary(hr))
		row.names(coeffs)<-c(molecule,X)
#	print(coeffs)
	  p.val<-as.matrix(coeffs[1,5])
	  if(HR=="hrisk"){
		hr1 = as.numeric (summary(hr)$coeff[1,1])
	  }else{
	   hr1 = as.numeric (summary(hr)$coeff[1,2])  
	  }
#		text(max(PFS)-35,0.97, paste ("HR=", round(hr1,2)) , cex=1.5, adj=0)
	  text(max(month)-adjx,0.97, paste ("HR = ", round(hr1,3)) , cex=1.8, adj=0)
	  if(p.val<1e-05){
	    text(max(month)-adjx,0.89, paste ("p  < 0.00001") , cex=1.8, adj=0)
	  }else if((p.val<1e-03)&(p.val>=1e-05)){
	    text(max(month)-adjx,0.89, paste ("p  = ", round(p.val,5)) , cex=1.8, adj=0)
	  }else if((p.val<1e-02)&(p.val>=1e-03)){
	    text(max(month)-adjx,0.89, paste ("p  = ", round(p.val,4)) , cex=1.8, adj=0)   
	  }else{
	    text(max(month)-adjx,0.89, paste ("p  = ", round(p.val,3)) , cex=1.8, adj=0)  
	  }

		res1 = rbind(res1, res)

}else if(plotmethod=="ggsurvplot"){
  AA<-paste("Gene",ml,":",molecule)
  if(length(X)==1){
    BB<-paste("covar:",X)
  }else if(length(X)==2){
    BB<-paste("covar:",X[1],",",X[2])
  }else if(length(X)==3){
    BB<-paste("covar:",X[1],",",X[2],",",X[3])
  }else if(length(X)==4){
    BB<-paste("covar:",X[1],",",X[2],",",X[3],",",X[4])
  }else if(length(X)==5){
    BB<-paste("covar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5])
  }else if(length(X)==6){
    BB<-paste("covar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5],",",X[6])
  }else if(length(X)>6){
   BB<-paste("covar:",X[1],",",X[2],",",X[3],",",X[4],",",X[5],",",X[6],"...")
  } 
  
  
  plt <- ggsurvplot(mfit.byGroups, 
                    # survfit object with calculated statistics.
                    data = data1,             # data used to fit survival curves.
                    # risk.table = TRUE,       # show risk table.
                    pval = TRUE,             # show p-value of log-rank test.
                    pval.method = T,
                    # test.for.trend = T,
                    conf.int = FALSE,         # show confidence intervals for
                    # point estimates of survival curves.
                    title = paste(AA,BB,sep = "\n"),
                    font.title=10,
                    palette = c("red", "navyblue"),
                    xlim = c(0,max(month)),         # present narrower X axis, but not affect
                    # survival estimates.
                    xlab = time,   # customize X axis label.
                    #	  break.time.by = 20,     # break X axis in time intervals by 500.
                    ggtheme = theme_bw(), # Change ggplot2 theme
                    
                    risk.table = "abs_pct",
                    risk.table.y.text.col = T,# colour risk table text annotations.
                    risk.table.height = 0.25, # the height of the risk table
                    risk.table.y.text = FALSE,# show bars instead of names in text annotations
                    # in legend of risk table.
                    risk.table.fontsize = 2.5,
                    ncensor.plot = FALSE,      # plot the number of censored subjects at time t
                    #ncensor.plot.height = 0.25,
                    conf.int.style = "step",  # customize style of confidence intervals
                    surv.median.line = sml,  # add the median survival pointer.
                    legend.labs = c("High", "Low")    # change legend labels.	
                    
  )
}

#dev.off()
#write.csv(res1, file2, row.names=F)
return(plt)

}