handle_uppercase: handle_uppercase

Description Usage Arguments Value Note

View source: R/input_funktioner.R

Description

Hvis et ord uppercase, med længde større en 1, ikke fremgår i ordbogen, men fremgår i ordbogen som lowercase, så rettes ordet til lowercase. Hvis ordet ikke fremgår i ordbogen, så tjekkes navneordbogen, hvis ordet heller ikke findes her, så bliver ordet markeret som den indsatte værdi for impute_value.

Usage

1
handle_uppercase(str_list, ord, navneordbog, impute_value)

Arguments

str_list

Liste med sætninger hvor hver sætning er splitter op i ord

ord

Ordbog som character vector

navneordbog

Navne som character vektor

impute_value

Værdier som skal imputes hvis uppercase ordet er ukendt

Value

str_list hvor uppercase er håndteret som ovenstående beskrivelse

Note

Ideen med at give ukendte uppercase ord sin egen klasse er, at disse ord har en anden karakteristik end almindelige ukendte ord. Tanken er, er disse ukendte uppercase ord typisk vil være forkortelser som eksempelvis GDPR eller FIFA. Længde større end 1 gør, at "I" ikke forvekles med "i".


Gulde91/KommaModel documentation built on Aug. 22, 2020, 9:42 p.m.