R/han2pinyin.R

#' 汉字注音
#' @description 使用python3 宏包`pypinyin`给中文词语标注拼音
#' @author lgm
#' @param string 汉字词
#' @return pinyin vector
#' @export
#' @examples
#' han2pinyin('你好')
#' han2pinyin('参与浮力荷载实验')
#' demo= "珠江是华南一大河系,流经广州市,是中国第三长的河流,仅次于长江和黄河。珠江三角洲是中国最发达的地区之一,面积约 11000 平方公里。它在面积和人口方面也是世界上最大的城市聚集区。珠江三角洲九个最大城市共有 5700 多万人口。上世纪 70 年代末中国改革开放以来,珠江三角洲已成为中国和世界主要经济区域和制造中心之一。"
#' paste(han2pinyin(demo),collapse = " ")


han2pinyin <- function(string_cn){

	path <- file.path(system.file(package = "gmtools"),'han2pinyin.py')

	# for testing, please comment the line below
	#path <- "/Users/gabe/liguomin.dropbox/github@mycode/gmtools/inst/han2pinyin.py"

	cmd <- paste0('/anaconda3/bin/python ', path, ' "',string_cn,'"')
	trans <- system(command=cmd, intern = TRUE)

	tr = gsub("\\]","",gsub("[\\['']","",trans))
	trr = strsplit(tr,", ")[[1]]

	return(trr)

}
Gabegit/gmtools documentation built on May 6, 2019, 5:32 p.m.