Description Usage Arguments Details Value Author(s) Examples
View source: R/classificaUtenti.R
Associa i nomi in names ai valori indicati da un vocabolario. ad esempio
vocabolarioNomiPropri assegna il genere e data(vocabolarioLuoghi)
l'area geografica (vedi esempio)
1 2 3 4 5 6 7 8 |
names |
vettore di nomi |
vocabolario |
|
scan_interno |
flag, se vero la funzione effettua anche la parte di
scanning interno ( |
vocab_interno |
è il vocabolario su cui viene effettuato (eventualmente) lo scanning interno (di default, se previsto, è pari a tutti i nomi di vocabolario di lunghezza >=5 caratteri) |
how_class |
gestisce la classificazione in casi "ambigui", cioè in cui per un nome vengano ritrovati più match; sono state pensati tre casi: "modeFirst" (default), in cui viene preso la categoria modale tra le riconosciute e, nel caso di multimodalità, il primo in ordine tra i match; "first" che classifica con il primo match nella stringa e "last" con l'ultimo |
cat_interna |
(default=NULL) permette di identificare una (o più categorie) della classificazione per cui vengono tenuti nello scanning interno tutti i termini di vocabolario e non solo quelli con più di 5 caratteri |
Per il data(vocabolarioLuoghi) abbiamo escluso i paesi Re (800
abitanti, Nord-ovest) e Lu (1200 abitanti, Nord-ovest) perche' in conflitto
con le sigle delle province.
(update 05-09-2016) Ponendo particolare attenzione alla detection dei nomi propri,
si è pensato di introdurre nella funzione tre diversi "tentativi" di classificazione.
Mentre nei primi due, con diverse accortezze, si cercano parole suddivise da spazi, nel
terzo ed ultimo step si prova a ricercare le stringhe di caratteri anche internamente alle parole,
grazie alla funzione grepl. Alcuni parametri, descritti successivamente, regolano
questa parte della classificazione.
Restituisce un named vector con elementi dalla colonna
categoria del data.frame vocabolario. Per
vocabolario=vocabolarioNomiPropri le modalita' sono
c('masc','femm','ente').
Mattia Uttini, Livio Finos, Andrea Mamprin, Dario Solari
1 2 3 4 5 6 | ## Not run: data(vocabolarioNomiPropri)
## Not run: str(vocabolarioNomiPropri)
classificaUtenti(c('livio','alessandra','alessandraRossi', 'mariobianchi'),
scan_interno=TRUE)
data(vocabolarioLuoghi)
classificaUtenti(c('Bosa','Pordenone, Italy'), vocabolarioLuoghi)
|
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.