README.md

title: "pacakge korspacing" author: "Keon-Woong Moon" date: "2017-10-12" output: rmarkdown::html_vignette vignette: > %\VignetteIndexEntry{korspacing} %\VignetteEngine{knitr::rmarkdown} %\VignetteEncoding{UTF-8}

korspacing 패키지의 korspacing()함수는 문장을 입력하면 띄어쓰기가 된 문장을 반환합니다.

패키지 설치

#install.packages("devtools")
devtools::install_github("cardiomoon/korspacing")

사용법: As an RStudio Add-in

패키지를 설치하면 RStudio Addin에 등록된다.

  1. R session 에서 띄어쓰기를 할 문장을 hightlight한다.
library(knitr)
include_graphics("https://raw.githubusercontent.com/cardiomoon/korspacing/master/man/figures/fig1.png")

plot of chunk unnamed-chunk-2 2. RStudio Addin 중 korspacing을 실행한다.

library(knitr)
include_graphics("https://raw.githubusercontent.com/cardiomoon/korspacing/master/man/figures/fig2.png")

plot of chunk unnamed-chunk-3 3. hightlight한 문장이 띄어쓰기가 된 문장으로 대체된다.

library(knitr)
include_graphics("https://raw.githubusercontent.com/cardiomoon/korspacing/master/man/figures/fig3.png")

plot of chunk unnamed-chunk-4

사용법

library(korspacing)

korspacing("아래와같은방식으로API를사용할수있으며,호출건수에대해서별도의제한은없으나,1회 호출에200글자로글자수를제한하고있다.")
[1] "아래와 같은 방식으로 API를 사용할 수 있으며, 호출 건수에 대해서 별도의 제한은 없으나, 1회 호출에 200글자로 글자수를 제한하고 있다. "

character vector에 적용

var1 = c("최근음성인식정확도가높아짐에따라",
                          "많은음성데이터가Text로변환되고분석되기시작했는데,",
"이를위해잘동작하는띄어쓰기엔진은거의필수적인게되어버렸다")

korspacing(var1)
[1] "최근 음성인식 정확도가 높아짐에 따라 "                             
[2] "많은 음성 데이터가 Text로 변환되고 분석되기 시작했는데, "          
[3] "이를 위해 잘 동작하는 띄어쓰기엔진은 거의 필수적인 게 되어 버렸다 "

data.frame에 적용

df <- data.frame(var1,stringsAsFactors = FALSE)
df$var2 <- korspacing(df$var1)
df
                                                      var1
1                         최근음성인식정확도가높아짐에따라
2        많은음성데이터가Text로변환되고분석되기시작했는데,
3 이를위해잘동작하는띄어쓰기엔진은거의필수적인게되어버렸다
                                                                var2
1                              최근 음성인식 정확도가 높아짐에 따라 
2           많은 음성 데이터가 Text로 변환되고 분석되기 시작했는데, 
3 이를 위해 잘 동작하는 띄어쓰기엔진은 거의 필수적인 게 되어 버렸다 

참고 자료

korspacing은 전희원님이 개발한 한글 자동 띄어쓰기 API를 쉽게 활용할 수 있도록 만든 패키지입니다. 박찬엽, 김영우님의 코드를 참고하여 함수를 작성했습니다.



cardiomoon/korspacing documentation built on May 28, 2019, 7:14 p.m.