Introduction

형태소 분석과 같은 통계적 언어분석 도구는 사전의 영향을 매우 많이 받는다. 사전에 수록된 정보는 매우 정확한 정보로 간주되기 때문에 이를 주변으로 구성되는 다양한 단어들에 대한 추론을 하는데 영향을 끼쳐 정확한 언어 분석을 하는데 매우 중요한 정보가 된다. 따라서 정확하고 방대한 양의 사전 데이터는 일반적으로 언어 분석에 많은 도움을 준다.

사전활용

KoNLP에서는 크게 세가지 혹은 다섯가지의 사전 데이터를 제공하고 있다.

명령어와의 매핑은 아래와 같다.

library(data.table)

sejong <- data.table(get_dictionary("sejong"))


haven-jeon/KoNLP documentation built on July 8, 2021, 12:26 a.m.