TextAnalyzer: Text Analyzer
In VectrixDB: Lightweight Vector Database with Embedded Machine Learning Models

TextAnalyzer

R Documentation

Text Analyzer

Description

Text analyzer for search indexing

Provides text processing pipelines:

Tokenization
Lowercasing
Stopword removal
Stemming
Synonym expansion

Public fields

lowercase: Convert to lowercase
remove_stopwords: Remove stopwords
stopwords: Set of stopwords
stemmer: Stemmer object
synonyms: Synonym dictionary
min_token_length: Minimum token length
max_token_length: Maximum token length
token_pattern: Regex pattern for tokens

Methods

Method `new()`

Create a new TextAnalyzer

Usage

TextAnalyzer$new(
  lowercase = TRUE,
  remove_stopwords = FALSE,
  stopwords = NULL,
  use_stemmer = FALSE,
  synonyms = NULL,
  min_token_length = 1,
  max_token_length = 100,
  token_pattern = "[a-zA-Z0-9]+"
)

Arguments

lowercase: Lowercase text (default: TRUE)
remove_stopwords: Remove stopwords (default: FALSE)
stopwords: Custom stopwords (default: ENGLISH_STOPWORDS)
use_stemmer: Use stemming (default: FALSE)
synonyms: Named list of synonyms
min_token_length: Min length (default: 1)
max_token_length: Max length (default: 100)
token_pattern: Regex pattern

Method `analyze()`

Analyze text and return tokens

Usage

TextAnalyzer$analyze(text)

Arguments

text: Input text

Returns

Character vector of tokens

Method `analyze_query()`

Analyze a query string

Usage

TextAnalyzer$analyze_query(query)

Arguments

query: Query text

Returns

Character vector of tokens

Method `clone()`

The objects of this class are cloneable with this method.

Usage

TextAnalyzer$clone(deep = FALSE)

Arguments

deep: Whether to make a deep clone.

Examples

## Not run: 
analyzer <- TextAnalyzer$english()
tokens <- analyzer$analyze("The quick brown foxes are jumping")
# c("quick", "brown", "fox", "jump")

## End(Not run)

VectrixDB documentation built on Feb. 20, 2026, 5:09 p.m.

VectrixDB index

Package overview README.md

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

VectrixDB
Lightweight Vector Database with Embedded Machine Learning Models

TextAnalyzer: Text Analyzer
In VectrixDB: Lightweight Vector Database with Embedded Machine Learning Models

Text Analyzer

Description

Public fields

Methods

Public methods

Method `new()`

Usage

Arguments

Method `analyze()`

Usage

Arguments

Returns

Method `analyze_query()`

Usage

Arguments

Returns

Method `clone()`

Usage

Arguments

Examples

Related to TextAnalyzer in VectrixDB...

R Package Documentation

Browse R Packages

We want your feedback!

VectrixDB Lightweight Vector Database with Embedded Machine Learning Models

TextAnalyzer: Text Analyzer In VectrixDB: Lightweight Vector Database with Embedded Machine Learning Models

Text Analyzer

Description

Public fields

Methods

Public methods

Method new()

Usage

Arguments

Method analyze()

Usage

Arguments

Returns

Method analyze_query()

Usage

Arguments

Returns

Method clone()

Usage

Arguments

Examples

Related to TextAnalyzer in VectrixDB...

R Package Documentation

Browse R Packages

We want your feedback!

VectrixDB
Lightweight Vector Database with Embedded Machine Learning Models

TextAnalyzer: Text Analyzer
In VectrixDB: Lightweight Vector Database with Embedded Machine Learning Models

Method `new()`

Method `analyze()`

Method `analyze_query()`

Method `clone()`