data-raw/palavras.R

# Palavras mais frequentes no portugu\u00EAs Brasileiro
# https://www.academia.org.br/sites/default/files/relacao_das_palavras_mais_frequentes.pdf
# Vetor de verbos mais frequentes
verbos_frequentes <- c(
  "ser",
  "dizer",
  "ter",
  "ir",
  "estar",
  "fazer",
  "haver",
  "poder",
  "ver",
  "dar",
  "saber",
  "vir",
  "querer",
  "parecer",
  "falar",
  "ficar",
  "ouvir",
  "achar",
  "deixar",
  "sair",
  "chegar",
  "passar",
  "pedir",
  "ler",
  "acabar"
)

# Vetor de substantivos mais frequentes
substantivos_frequentes <- c(
  "coisa",
  "casa",
  "tempo",
  "vez",
  "olho",
  "dia",
  "homem",
  "mo\u00E7o",
  "mo\u00E7a",
  "senhor",
  "senhora",
  "ano",
  "m\u00E3o",
  "palavra",
  "filho",
  "filha",
  "noite",
  "carta",
  "amigo",
  "amiga",
  "bem",
  "rua",
  "vida",
  "hora",
  "cora\u00E7\u00E3o",
  "pai",
  "pessoa",
  "mulher",
  "amor",
  "verdade",
  "ideia",
  "m\u00E3e",
  "marido",
  "esp\u00EDrito",
  "vi\u00FAvo",
  "vi\u00FAva",
  "alma",
  "fim",
  "cabe\u00E7a",
  "nome",
  "porta",
  "p\u00E9",
  "raz\u00E3o",
  "parte",
  "modo"
)

# Vetor de adjetivos mais frequentes
adjetivos_frequentes <- c(
  "bom",
  "grande",
  "melhor",
  "pr\u00F3prio",
  "velho",
  "certo",
  "\u00FAltimo",
  "longo",
  "novo",
  "\u00FAnico",
  "antigo",
  "belo",
  "seguinte",
  "preciso",
  "meio",
  "natural",
  "maior",
  "triste",
  "bonito",
  "s\u00F3",
  "simples",
  "mau",
  "verdadeiro",
  "alegre",
  "pol\u00EDtico",
  "alto",
  "p\u00FAblico",
  "grave",
  "vivo",
  "cheio",
  "feliz",
  "poss\u00EDvel",
  "raro",
  "claro",
  "necess\u00E1rio",
  "pequeno",
  "igual",
  "fino",
  "imposs\u00EDvel",
  "pobre"
)

# Lista criada com o ChatGPT:
palavras_frequentes <- c(
  "a",
  "o",
  "e",
  "de",
  "do",
  "da",
  "em",
  "um",
  "para",
  "\u00E9",
  "com",
  "n\u00E3o",
  "uma",
  "os",
  "no",
  "se",
  "na",
  "por",
  "mais",
  "as",
  "dos",
  "como",
  "mas",
  "foi",
  "ao",
  "ele",
  "das",
  "tem",
  "\u00E0",
  "seu",
  "sua",
  "ou",
  "ser",
  "quando",
  "muito",
  "h\u00E1",
  "nos",
  "j\u00E1",
  "est\u00E1",
  "eu",
  "tamb\u00E9m",
  "s\u00F3",
  "pelo",
  "pela",
  "at\u00E9",
  "isso",
  "ela",
  "entre",
  "depois",
  "sem",
  "mesmo",
  "aos",
  "seus",
  "quem",
  "nas",
  "me",
  "esse",
  "eles",
  "est\u00E3o",
  "voc\u00EA",
  "tinha",
  "foram",
  "essa",
  "num",
  "nem",
  "suas",
  "meu",
  "\u00E0s",
  "minha",
  "t\u00EAm",
  "numa",
  "pelos",
  "elas",
  "havia",
  "seja",
  "qual",
  "ser\u00E1",
  "n\u00F3s",
  "tenho",
  "lhe",
  "deles",
  "essas",
  "esses",
  "pelas",
  "este",
  "fosse",
  "dele",
  "tu",
  "te",
  "voc\u00EAs",
  "vos",
  "lhes",
  "meus",
  "minhas",
  "teu",
  "tua",
  "teus",
  "tuas",
  "nosso",
  "nossa",
  "nossos",
  "nossas",
  "homem",
  "mulher",
  "tempo",
  "dia",
  "noite",
  "ano",
  "vida",
  "casa",
  "mundo",
  "pa\u00EDs",
  "cidade",
  "pessoa",
  "homens",
  "mulheres",
  "dias",
  "noites",
  "anos",
  "vidas",
  "casas",
  "mundos",
  "pa\u00EDses",
  "cidades",
  "pessoas",
  "vez",
  "vezes",
  "parte",
  "partes",
  "forma",
  "formas",
  "coisa",
  "coisas",
  "n\u00FAmero",
  "n\u00FAmeros",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos",
  "homem",
  "homens",
  "vida",
  "vidas",
  "homem",
  "homens",
  "tempo",
  "tempos",
  "pai",
  "pais",
  "m\u00E3e",
  "m\u00E3es",
  "filho",
  "filhos",
  "filha",
  "filhas",
  "irm\u00E3o",
  "irm\u00E3os",
  "irm\u00E3",
  "irm\u00E3s",
  "marido",
  "maridos",
  "esposa",
  "esposas",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "casa",
  "casas",
  "coisa",
  "coisas",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos",
  "homem",
  "homens",
  "vida",
  "vidas",
  "homem",
  "homens",
  "tempo",
  "tempos",
  "pai",
  "pais",
  "m\u00E3e",
  "m\u00E3es",
  "filho",
  "filhos",
  "filha",
  "filhas",
  "irm\u00E3o",
  "irm\u00E3os",
  "irm\u00E3",
  "irm\u00E3s",
  "marido",
  "maridos",
  "esposa",
  "esposas",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "casa",
  "casas",
  "coisa",
  "coisas",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos",
  "homem",
  "homens",
  "vida",
  "vidas",
  "homem",
  "homens",
  "tempo",
  "tempos",
  "pai",
  "pais",
  "m\u00E3e",
  "m\u00E3es",
  "filho",
  "filhos",
  "filha",
  "filhas",
  "irm\u00E3o",
  "irm\u00E3os",
  "irm\u00E3",
  "irm\u00E3s",
  "marido",
  "maridos",
  "esposa",
  "esposas",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "casa",
  "casas",
  "coisa",
  "coisas",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos",
  "homem",
  "homens",
  "vida",
  "vidas",
  "homem",
  "homens",
  "tempo",
  "tempos",
  "pai",
  "pais",
  "m\u00E3e",
  "m\u00E3es",
  "filho",
  "filhos",
  "filha",
  "filhas",
  "irm\u00E3o",
  "irm\u00E3os",
  "irm\u00E3",
  "irm\u00E3s",
  "marido",
  "maridos",
  "esposa",
  "esposas",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "casa",
  "casas",
  "coisa",
  "coisas",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos",
  "homem",
  "homens",
  "vida",
  "vidas",
  "homem",
  "homens",
  "tempo",
  "tempos",
  "pai",
  "pais",
  "m\u00E3e",
  "m\u00E3es",
  "filho",
  "filhos",
  "filha",
  "filhas",
  "irm\u00E3o",
  "irm\u00E3os",
  "irm\u00E3",
  "irm\u00E3s",
  "marido",
  "maridos",
  "esposa",
  "esposas",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "casa",
  "casas",
  "coisa",
  "coisas",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "homem",
  "homens",
  "mulher",
  "mulheres",
  "vida",
  "vidas",
  "tempo",
  "tempos",
  "mundo",
  "mundos",
  "pa\u00EDs",
  "pa\u00EDses",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "m\u00E3o",
  "m\u00E3os",
  "olho",
  "olhos",
  "crian\u00E7a",
  "crian\u00E7as",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "m\u00E3o",
  "m\u00E3os",
  "fim",
  "fins",
  "homem",
  "mulher",
  "gente",
  "vez",
  "vezes",
  "cabe\u00E7a",
  "cabe\u00E7as",
  "trabalho",
  "trabalhos",
  "amigo",
  "amigos",
  "amiga",
  "amigas",
  "ano",
  "anos",
  "fim",
  "fins",
  "cora\u00E7\u00E3o",
  "cora\u00E7\u00F5es",
  "tempo",
  "tempos",
  "parte",
  "partes",
  "lugar",
  "lugares",
  "coisa",
  "coisas",
  "caso",
  "casos",
  "ponto",
  "pontos",
  "mundo",
  "mundos",
  "palavra",
  "palavras",
  "senhor",
  "senhores",
  "senhora",
  "senhoras",
  "momento",
  "momentos",
  "nome",
  "nomes",
  "pessoa",
  "pessoas",
  "trabalho",
  "trabalhos",
  "olho",
  "olhos",
  "gente",
  "noite",
  "noites",
  "dia",
  "dias",
  "m\u00E3o",
  "m\u00E3os",
  "pa\u00EDs",
  "pa\u00EDses",
  "caso",
  "casos"
)


palavras <- unique(
  c(
    verbos_frequentes,
    substantivos_frequentes,
    adjetivos_frequentes,
    palavras_frequentes
  )
)

usethis::use_data(palavras, overwrite = TRUE)
cienciadedatos/dados documentation built on Aug. 10, 2024, 9:26 p.m.