split_str_to_dataframe: split_str_to_dataframe

Description Usage Arguments Value

View source: R/input_funktioner.R

Description

Funktionen opdeler i sætninger og tager delimiteren med. Her betinges på at delimiteren skal være efterfulgt af mindst ét white space eller linjeskifte \n samt at det er efterfulgt af et stort startbogstav eller tal. Dette for at undgå, at en sætning ikke bliver splittet på en forkortelse.

Usage

1
split_str_to_dataframe(string, abbreviation = NULL)

Arguments

string

Input streng

abbreviation

Forkortelser som fx. "mr.", som efterfølges af et stort start bogstav. Det parses ind i regex expression, så sætningen ikke opdeles på disse forkortelser. For hver input forkortelse indsættes et white space før forkortelsen, således at et afsluttende ord i en sætning som tilfældigvis ender på forkortelsen, ikke bliver opdelt. Ligeledes indsættes et ^ (regex anchor), således at sætningen ikke splittes, selvom forkortelsen er i starten af sætningen.

Value

En data.frame med en varible, hvor hver række indeholder en sætning.


Gulde91/KommaModel documentation built on Aug. 22, 2020, 9:42 p.m.