doWrdCld: Funzione per la costruzione delle Wordcloud

Description Usage Arguments Value Examples

View source: R/doWrdCld.R

Description

Questa funzione crea la wordcloud partendo dal vettore dei testi e ritorna il data.frame con le frequenze delle parole o il data.frame della TermDocumentMatrix o entrambi in una lista; è inoltre possibile definire il criterio di ponderazione.

Usage

1
2
3
4
doWrdCld(x = NULL, stopw = NULL, col = "black", scale = c(4, 0.5),
  maxw = 100, min.freq = 10, lang = "italian", stem = F,
  weight = c("tf", "tfidf", "binary"), plot = TRUE, out = c("tdm",
  "freq", "both"))

Arguments

x

Vettore di testi (i tweet ripuliti).

stopw

Vettore con le stopwords definite dall'utente.

col

Vettore con i colori.

scale

Proporzioni delle parole nella wordcloud.

maxw

Numero massimo di parole da riportare nella wordcloud.

lang

Lingua rispetto a cui rimuovere le stopwords (default "italian")

stem

Valore logico che indica se fare o meno lo stemming, se TRUE procede allo stemming rispetto alla lingua specificata in lang

weight

Tipo di ponderazione dei dati, valori: tf = frequenza dei termini; tfidf = Term Frequency, Inverse Document Frequency; binary = binaria.

plot

Logico, se TRUE viene visualizzata la nuvola di parole.

out

Tipologia di output della funzione, valori: tdm = data frame con TermDocumentMatrix; freq = data frame con frequenza parole; both = list con tdm e freq.

Value

La wordcloud e il data.frame con le frequenze delle parole o il data.frame della TermDocumentMatrix o entrambi in una lista.

Examples

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
## Not run: 

tw_amala <- search_tweets(
q = "inter", n = 5000, type = "recent", include_rts = T, lang="it"
)

tw_amala$clean <- cleanTxt(tw_amala$text)

doWrdCld(
 tw_amala$clean,
 stopw = c("inter", "milan", "milano"),
 col = "cyan",
 maxw = 200,
 min.freq = 15,
 plot = TRUE
)


## End(Not run)

PaoloDalena/banchedatiz documentation built on Jan. 2, 2021, 9:15 a.m.