textlearnR:

Celebrity-Faceoff Dataset

taken from jlacko github

The underlying dataset consits of 9,000 tweets, collected on 2019-02-02 via rtweet. It consists of 1,500 tweets each from

Hadley Wickham,
Wes McKinney,
François Chollet,
Kim Kardashian,
Kourtney Kardashian,
Khloe Kardashian

From each account 1,200 tweets (80%) are included in training dataset and 300 (20%) in verification set.

pacman::p_load(tidyverse)

tweets <- read_csv("train_tweets.csv") %>% 
  mutate(split = "train") %>% 
  bind_rows(read_csv("test_tweets.csv")) %>% 
  glimpse

## Parsed with column specification:
## cols(
##   id = col_double(),
##   name = col_character(),
##   created = col_datetime(format = ""),
##   text = col_character()
## )
## Parsed with column specification:
## cols(
##   id = col_double(),
##   name = col_character(),
##   created = col_datetime(format = ""),
##   text = col_character()
## )

## Observations: 9,000
## Variables: 5
## $ id      <dbl> 1.091806e+18, 1.091806e+18, 1.091798e+18, 1.091776e+18, …
## $ name    <chr> "hadleywickham", "hadleywickham", "KimKardashian", "hadl…
## $ created <dttm> 2019-02-02 21:11:49, 2019-02-02 21:09:52, 2019-02-02 20…
## $ text    <chr> "@dvaughan32 Fails to mention that code can only ever ex…
## $ split   <chr> "train", "train", "train", "train", "train", "train", "t…

tweets %>% count(split)

## # A tibble: 2 x 2
##   split     n
##   <chr> <int>
## 1 train  7200
## 2 <NA>   1800

#save(tweets, file = "tweets.Rdata")

systats/textlearnR documentation built on May 6, 2019, 8:31 p.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

systats/textlearnR

data/celebrity_faceoff/Readme.md
In systats/textlearnR:

Celebrity-Faceoff Dataset

R Package Documentation

Browse R Packages

We want your feedback!

systats/textlearnR

data/celebrity_faceoff/Readme.md In systats/textlearnR:

Celebrity-Faceoff Dataset

R Package Documentation

Browse R Packages

We want your feedback!

data/celebrity_faceoff/Readme.md
In systats/textlearnR: