Description Usage Arguments Value Note
View source: R/input_funktioner.R
Hvis et ord uppercase, med længde større en 1, ikke fremgår i ordbogen, men
fremgår i ordbogen som lowercase, så rettes ordet til lowercase. Hvis ordet
ikke fremgår i ordbogen, så tjekkes navneordbogen, hvis ordet heller ikke
findes her, så bliver ordet markeret som den indsatte værdi for
impute_value
.
1 | handle_uppercase(str_list, ord, navneordbog, impute_value)
|
str_list |
Liste med sætninger hvor hver sætning er splitter op i ord |
ord |
Ordbog som character vector |
navneordbog |
Navne som character vektor |
impute_value |
Værdier som skal imputes hvis uppercase ordet er ukendt |
str_list
hvor uppercase er håndteret som ovenstående
beskrivelse
Ideen med at give ukendte uppercase ord sin egen klasse er, at disse ord har en anden karakteristik end almindelige ukendte ord. Tanken er, er disse ukendte uppercase ord typisk vil være forkortelser som eksempelvis GDPR eller FIFA. Længde større end 1 gør, at "I" ikke forvekles med "i".
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.