rdb_read: Leitura de arquivos grandes (Big Files)

Description Usage Arguments Details Examples

View source: R/extras_rdb.R

Description

Esta função é um ensemble que junta muitas funções otimizadas de pacotes especiais do R. Entre eles, readr, data.table, vroom e rio.

Usage

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
rdb_read(
  file,
  type = "fread",
  delim = NULL,
  dec = NULL,
  try_append = TRUE,
  sep = NULL,
  quote = "\"",
  escape_backslash = FALSE,
  escape_double = TRUE,
  col_names = TRUE,
  col_select = NULL,
  col_types = NULL,
  encoding = NULL,
  na = c("", "NA"),
  comment = "",
  trim_ws = FALSE,
  skip = 0,
  n_max = Inf,
  guess_max = min(1000, n_max),
  altrep = TRUE,
  progress = NULL,
  skip_empty_rows = TRUE,
  ...
)

Arguments

file

Vetor ou lista de strings com nomes de arquivos a serem importados da maioria das extensoes. Arquivos copactados em .gz e .bgz

type

Nome do mecanisco de leitura. Podendo sem um em "fread","readr","vroom" ou "rio". Veja os detalhes abaixo para mais detalhes.

delim

Delimitador de colunas, se não souber deixe NULL. Pode ser, ",", ";", "|" e outros conforme seu arquivo.

dec

Deparador decimal.

try_append

Se TRUE (padrão) tenta apendar (empilhar) os dados. Se FALSE retorna lista de tabelas, uma para cada arquivo importado.

sep

Agrupador de campos para formatação de números

quote

Regex para quotation. Serve para não confundir com aspas que delimita strings.

escape_backslash

Utilizar contrabarra para saltar Caractéres especiais

escape_double

Se TRUE o valor '""' representará um unico \"

col_names

TRUE, FALSE, um vetor de nomes ou números que serao tratados como índices para selecionar colunas

col_select

Vetor de nomes ou índices a selecionar.

col_types

Se NULL trabalha com os padroes do pacote readr. Se data.table, utiliza os padroes da funão fread

encoding

Encoding do arquivo. Como padrão pega as configurações do Sistema Operacional

na

Tipo de valor para substituir NA

comment

Caractére a ser tratado como comentario. padrão e hashtag

trim_ws

Limpar espacos em branco a direita e esquerda das colunas

skip

número de linhas a saltar na leitura dos dados

n_max

número de linhas que quer extrair. Se Inf retorna o maximo de linhas

guess_max

Total de linhas por partes lidas (chunksize)

altrep

Controle dos tipos de dados na leitura por vroom

progress

Mostrar progresso da leitura dos dados

skip_empty_rows

Ignorar linhas vazias

...

Outros argumentos de funções quando trabalhando com o pacote import

Details

Para obter detalhes completos destas funções e seus argumentos consulte a documentacao original dos seus desenvolvedores conforme lista abaixo:

Examples

1
2
3
4
5
6
7
8
9
## Not run: 
library("csmon")
f2 <- list.files(pattern = "1-c000.csv.gz$", full.names = TRUE)
a <- rdb_read(file = f2, type = "fread")
b <- rdb_read(file = f2, type = "readr", delim = ",", col_names = FALSE)
d <- rdb_read(file = f2, type = "vroom", delim = ",", col_names = FALSE)
e <- rdb_read(file = "/teste_02.xls", type = "rio", sheet = 1, range = "a3:j23")

## End(Not run)

evandeilton/rdb documentation built on June 14, 2020, 2:08 p.m.