matchtools: Tools For Matching Firms From Different Datasets

# address dictionary of replacement words
library(readr)
library(dplyr)
address_dictionary <- read_csv('data-raw/address-lexicon.csv') %>% select(-`LEXICON:`)
names(address_dictionary) <- c('word', 'standard', 'type', 'other')

address_dictionary <- address_dictionary %>%
  mutate_at(.vars = c('word', 'standard'), .funs = 'iconv', to = "ASCII//TRANSLIT") %>%
  mutate_at(.vars = c('word', 'standard'), .funs = 'remove_punct') %>%
  mutate_at(.vars = c('word', 'standard'), .funs = 'remove_articles') %>%
  mutate_at(.vars = c('word', 'standard'), .funs = 'tolower') %>%
  filter(word != standard & !type %in% c('PROV', 'PLACEN') & standard != 'CANADA') %>%
  distinct(word, standard)

write_csv(address_dictionary, 'data-raw/address_dictionary.csv')
devtools::use_data(address_dictionary, overwrite = TRUE)

tweed1e/matchtools documentation built on May 29, 2019, 10:51 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

tweed1e/matchtools
Tools For Matching Firms From Different Datasets

data-raw/address_dictionary.R
In tweed1e/matchtools: Tools For Matching Firms From Different Datasets

R Package Documentation

Browse R Packages

We want your feedback!

tweed1e/matchtools Tools For Matching Firms From Different Datasets

data-raw/address_dictionary.R In tweed1e/matchtools: Tools For Matching Firms From Different Datasets

R Package Documentation

Browse R Packages

We want your feedback!

tweed1e/matchtools
Tools For Matching Firms From Different Datasets

data-raw/address_dictionary.R
In tweed1e/matchtools: Tools For Matching Firms From Different Datasets