Description Usage Arguments Details Value Author(s) Examples
View source: R/classificaUtenti.R
Associa i nomi in names ai valori indicati da un vocabolario. ad esempio
vocabolarioNomiPropri assegna il genere e data(vocabolarioLuoghi)
l'area geografica (vedi esempio)
1 2 3 4 5 6 7 8 |
names |
vettore di nomi |
vocabolario |
|
scan_interno |
flag, se vero la funzione effettua anche la parte di
scanning interno ( |
vocab_interno |
è il vocabolario su cui viene effettuato (eventualmente) lo scanning interno (di default, se previsto, è pari a tutti i nomi di vocabolario di lunghezza >=5 caratteri) |
how_class |
gestisce la classificazione in casi "ambigui", cioè in cui per un nome vengano ritrovati più match; sono state pensati tre casi: "modeFirst" (default), in cui viene preso la categoria modale tra le riconosciute e, nel caso di multimodalità, il primo in ordine tra i match; "first" che classifica con il primo match nella stringa e "last" con l'ultimo |
cat_interna |
(default=NULL) permette di identificare una (o più categorie) della classificazione per cui vengono tenuti nello scanning interno tutti i termini di vocabolario e non solo quelli con più di 5 caratteri |
Per il data(vocabolarioLuoghi)
abbiamo escluso i paesi Re (800
abitanti, Nord-ovest) e Lu (1200 abitanti, Nord-ovest) perche' in conflitto
con le sigle delle province.
(update 05-09-2016) Ponendo particolare attenzione alla detection dei nomi propri,
si è pensato di introdurre nella funzione tre diversi "tentativi" di classificazione.
Mentre nei primi due, con diverse accortezze, si cercano parole suddivise da spazi, nel
terzo ed ultimo step si prova a ricercare le stringhe di caratteri anche internamente alle parole,
grazie alla funzione grepl
. Alcuni parametri, descritti successivamente, regolano
questa parte della classificazione.
Restituisce un named vector con elementi dalla colonna
categoria
del data.frame vocabolario
. Per
vocabolario=vocabolarioNomiPropri
le modalita' sono
c('masc','femm','ente')
.
Mattia Uttini, Livio Finos, Andrea Mamprin, Dario Solari
1 2 3 4 5 6 | ## Not run: data(vocabolarioNomiPropri)
## Not run: str(vocabolarioNomiPropri)
classificaUtenti(c('livio','alessandra','alessandraRossi', 'mariobianchi'),
scan_interno=TRUE)
data(vocabolarioLuoghi)
classificaUtenti(c('Bosa','Pordenone, Italy'), vocabolarioLuoghi)
|
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.