Files in llamaR
Interface for Large Language Models via 'llama.cpp'

configure

MD5

NEWS.md README.md

NAMESPACE

DESCRIPTION

LICENSE

configure.win

cleanup

R/hf.R R/llama.R R/llamaR-package.R R/chat.R R/embed.R R/serve.R

src/llama-vocab.h

src/llama-cparams.h

src/Makevars.win

src/unicode-data.h

src/llama-kv-cache-iswa.h

src/llama-adapter.h

src/llama-model-loader.cpp

src/llama-memory-hybrid.h

src/llama-model.cpp

src/llama-grammar.h

src/llama-sampling.h

src/llama.cpp

src/llama-memory-hybrid.cpp

src/llama-model.h

src/llama-impl.cpp

src/llama-kv-cache-iswa.cpp

src/llama-chat.h

src/unicode.cpp

src/llama-model-loader.h

src/llama-hparams.h

src/llama-quant.cpp

src/llama-sampling.cpp

src/llama-memory-recurrent.cpp

src/llama-cpp.h

src/llama-memory.cpp

src/llama-kv-cells.h

src/r_llama_interface.cpp

src/llama-impl.h

src/llama-memory-recurrent.h

src/unicode.h

src/llama-graph.cpp

src/llama-grammar.cpp

src/llama-chat.cpp

src/llama-vocab.cpp

src/llama.h

src/llama-memory-hybrid-iswa.h

src/llama-memory.h

src/llama-model-saver.h

src/Makevars.win.in

src/llama-batch.cpp

src/llama-cparams.cpp

src/Makevars.in

src/llama-mmap.cpp

src/llama-kv-cache.h

src/llama-context.h

src/unicode-data.cpp

src/llama-kv-cache.cpp

src/llama-context.cpp

src/llama-io.cpp

src/r_llama_compat.h

src/llama-model-saver.cpp

src/llama-io.h

src/llama-arch.cpp

src/llama-adapter.cpp

src/llama-quant.h

src/llama-mmap.h

src/llama-memory-hybrid-iswa.cpp

src/llama-hparams.cpp

src/llama-arch.h

src/llama-batch.h

src/llama-graph.h

src/models/seed-oss.cpp

src/models/rwkv7-base.cpp

src/models/qwen3vl-moe.cpp

src/models/chameleon.cpp

src/models/rnd1.cpp

src/models/exaone-moe.cpp

src/models/hunyuan-moe.cpp

src/models/deepseek2.cpp

src/models/gemma-embedding.cpp

src/models/cohere2-iswa.cpp

src/models/nemotron-h.cpp

src/models/dream.cpp

src/models/t5-enc.cpp

src/models/rwkv6.cpp

src/models/qwen3moe.cpp

src/models/deepseek.cpp

src/models/llama.cpp

src/models/modern-bert.cpp

src/models/models.h

src/models/dots1.cpp

src/models/mimo2-iswa.cpp

src/models/falcon-h1.cpp

src/models/glm4-moe.cpp

src/models/wavtokenizer-dec.cpp

src/models/gemma.cpp

src/models/jamba.cpp

src/models/neo-bert.cpp

src/models/rwkv6-base.cpp

src/models/phi2.cpp

src/models/xverse.cpp

src/models/qwen3next.cpp

src/models/bitnet.cpp

src/models/openelm.cpp

src/models/minimax-m2.cpp

src/models/olmo.cpp

src/models/mpt.cpp

src/models/qwen2.cpp

src/models/llama-iswa.cpp

src/models/phi3.cpp

src/models/gemma2-iswa.cpp

src/models/qwen.cpp

src/models/arwkv7.cpp

src/models/codeshell.cpp

src/models/jais.cpp

src/models/grovemoe.cpp

src/models/rwkv7.cpp

src/models/llada.cpp

src/models/plamo.cpp

src/models/ernie4-5.cpp

src/models/smollm3.cpp

src/models/nemotron.cpp

src/models/bailingmoe.cpp

src/models/starcoder2.cpp

src/models/exaone.cpp

src/models/stablelm.cpp

src/models/refact.cpp

src/models/qwen2vl.cpp

src/models/cogvlm.cpp

src/models/qwen3.cpp

src/models/orion.cpp

src/models/gpt2.cpp

src/models/apertus.cpp

src/models/qwen2moe.cpp

src/models/lfm2.cpp

src/models/olmoe.cpp

src/models/granite-hybrid.cpp

src/models/olmo2.cpp

src/models/falcon.cpp

src/models/bloom.cpp

src/models/grok.cpp

src/models/dbrx.cpp

src/models/baichuan.cpp

src/models/bailingmoe2.cpp

src/models/ernie4-5-moe.cpp

src/models/exaone4.cpp

src/models/gemma3n-iswa.cpp

src/models/afmoe.cpp

src/models/gemma3.cpp

src/models/pangu-embedded.cpp

src/models/plm.cpp

src/models/rwkv6qwen2.cpp

src/models/plamo3.cpp

src/models/glm4.cpp

src/models/maincoder.cpp

src/models/chatglm.cpp

src/models/gptneox.cpp

src/models/command-r.cpp

src/models/arcee.cpp

src/models/llada-moe.cpp

src/models/mamba.cpp

src/models/starcoder.cpp

src/models/internlm2.cpp

src/models/granite.cpp

src/models/smallthinker.cpp

src/models/plamo2.cpp

src/models/qwen3vl.cpp

src/models/openai-moe-iswa.cpp

src/models/graph-context-mamba.cpp

src/models/t5-dec.cpp

src/models/hunyuan-dense.cpp

src/models/minicpm3.cpp

src/models/bert.cpp

src/models/arctic.cpp

src/models/mistral3.cpp

src/models/deci.cpp

inst/doc/chat-and-agents.html

inst/doc/chat-and-agents.Rmd

inst/doc/getting-started.html

inst/doc/getting-started.Rmd

inst/examples/opencode.json

inst/examples/chat.R inst/examples/serve_openai.R inst/scripts/example_advanced.R inst/scripts/diag_graph_reuse.R inst/scripts/bench_batch.R inst/scripts/diag_splits.R inst/scripts/profile_vs_llamacpp.R inst/scripts/benchmark_compare.R inst/scripts/diag_offload_profile.R inst/scripts/benchmark.R

inst/scripts/profile_vs_llamacpp.sh

inst/scripts/profile_gpu.R inst/scripts/test_batch.R inst/scripts/test.R

build/vignette.rds

llamaR documentation built on May 28, 2026, 1:06 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

llamaR
Interface for Large Language Models via 'llama.cpp'

Files in llamaR
Interface for Large Language Models via 'llama.cpp'

R Package Documentation

Browse R Packages

We want your feedback!

llamaR Interface for Large Language Models via 'llama.cpp'

Files in llamaR Interface for Large Language Models via 'llama.cpp'

R Package Documentation

Browse R Packages

We want your feedback!

llamaR
Interface for Large Language Models via 'llama.cpp'

Files in llamaR
Interface for Large Language Models via 'llama.cpp'