textstat_summary: Summarize documents as syntactic and lexical feature counts
In quanteda.textstats: Textual Statistics for the Quantitative Analysis of Textual Data

textstat_summary

R Documentation

Summarize documents as syntactic and lexical feature counts

Description

Count syntactic and lexical features of documents such as tokens, types, sentences, and character categories.

Usage

textstat_summary(x, ...)

Arguments

`x`	corpus to be summarized
`...`	additional arguments passed through to dfm()

Details

Count the total number of characters, tokens and sentences as well as special tokens such as numbers, punctuation marks, symbols, tags and emojis.

chars = number of characters; equal to nchar()
sents = number of sentences; equal ntoken(tokens(x), what = "sentence")
tokens = number of tokens; equal to ntoken()
types = number of unique tokens; equal to ntype()
puncts = number of punctuation marks (⁠^\p{P}+$⁠)
numbers = number of numeric tokens (⁠^\p{Sc}{0,1}\p{N}+([.,]*\p{N})*\p{Sc}{0,1}$⁠)
symbols = number of symbols (⁠^\p{S}$⁠)
tags = number of tags; sum of pattern_username and pattern_hashtag in quanteda::quanteda_options()
emojis = number of emojis (⁠^\p{Emoji_Presentation}+$⁠)

Examples

if (Sys.info()["sysname"] != "SunOS") {
library("quanteda")
corp <- data_corpus_inaugural[1:5]
textstat_summary(corp)
toks <- tokens(corp)
textstat_summary(toks)
dfmat <- dfm(toks)
textstat_summary(dfmat)
}

quanteda.textstats documentation built on Sept. 11, 2024, 6:39 p.m.

quanteda.textstats index

Package overview README.md

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

quanteda.textstats
Textual Statistics for the Quantitative Analysis of Textual Data

textstat_summary: Summarize documents as syntactic and lexical feature counts
In quanteda.textstats: Textual Statistics for the Quantitative Analysis of Textual Data

Summarize documents as syntactic and lexical feature counts

Description

Usage

Arguments

Details

Examples

Related to textstat_summary in quanteda.textstats...

R Package Documentation

Browse R Packages

We want your feedback!

quanteda.textstats Textual Statistics for the Quantitative Analysis of Textual Data

textstat_summary: Summarize documents as syntactic and lexical feature counts In quanteda.textstats: Textual Statistics for the Quantitative Analysis of Textual Data

Summarize documents as syntactic and lexical feature counts

Description

Usage

Arguments

Details

Examples

Related to textstat_summary in quanteda.textstats...

R Package Documentation

Browse R Packages

We want your feedback!

quanteda.textstats
Textual Statistics for the Quantitative Analysis of Textual Data

textstat_summary: Summarize documents as syntactic and lexical feature counts
In quanteda.textstats: Textual Statistics for the Quantitative Analysis of Textual Data