urlExtract: Estrazione di regular expression (e quindi users, hashtag) e...

Description Usage Arguments Value Author(s) Examples

View source: R/urlExtract.R

Description

patternExtract estrae i pattern contenuti in in testo. urlExtract estrae e converte gli shorturl contenuti in testo in url. shorturl2url sostituisce gli shorturl contenuti in testo in url.

Usage

1
urlExtract(testo, id = names(testo))

Arguments

testo

Vettore (eventualmente con nomi) di testi contenenti shorturl.

id

se testo e' un vettore con nomi, questi vengono presi come id. In caso contrario, gli id sono numeri progressivi da 1 a length(testo)

pattern

stringa di testo da cercare ed estrarre. "@\w+" (default) estrae i riferimenti ad uno user nei tweets. "#\w+" estrae gli hashtag.

Value

patternExtract restituisce un data.frame con colonne:id, pattern

urlExtract restituisce un data.frame con colonne:id, shorturl e url

Author(s)

Dario Solari, Livio Finos

Examples

1
2
3
4
5
6
7
 ## Not run: 
 testo=c("Influenza Vaccination | ONS - Oncology Nursing Society http://t.co/924sRKGBU9 See All http://t.co/dbtPJRMl00,See All http://t.co/dbtPJRMl00")
 shorturl2url(testo,id=names(testo))
urls=urlExtract(testo)
patternExtract(c("@luca @paolo: buon giorno!", "@matteo: a te!"), pattern="@\w+")

## End(Not run)

livioivil/TextWiller documentation built on Nov. 30, 2020, 3:17 a.m.