validatie.basis: Validatie van het basismodel

View source: R/validatie_basis.R

validatie.basisR Documentation

Validatie van het basismodel

Description

Functie die alle nodige validaties uitvoert op het opgegeven (volledige) model en een overzicht geeft van de afwijkende metingen en slechte curves (zodat de gebruiker deze kan valideren).

De functie roept meerdere hulpfuncties op:

  • rmse.basis()

  • afwijkendeMetingen()

  • afwijkendeCurves()

  • validatierapport()

Voorafgaand aan het uitvoeren van deze laatste functie worden eerst de slechtste modellen opgelijst (op basis van RMSE, afwijkende metingen en afwijkende curves).

Usage

validatie.basis(
  Basismodel,
  AantalDomHogeRMSE = 20,
  ExtraCurvesRapport = NULL,
  GoedgekeurdeAfwijkendeCurves = NULL,
  Bestandsnaam = "Default",
  TypeRapport = "Dynamisch",
  PathWD = getwd()
)

Arguments

Basismodel

Model per boomsoort zoals teruggegeven door de functie fit.basis(): tibble met de velden BMS (boomsoort) en Model (lme-object met het gefit mixed model voor die boomsoort).

AantalDomHogeRMSE

Standaard worden de 20 domeinen met de hoogste RMSE geselecteerd en voor elk van deze domeinen worden minstens 10 afwijkende metingen geselecteerd. AantalDomHogeRMSE laat toe om dit aantal van 20 domeinen aan te passen.

ExtraCurvesRapport

Optie om een lijst met extra boomsoort-domeincombinaties op te geven waardoor de curve getoond moet worden in het validatierapport. Deze moeten opgegeven worden als een dataframe met velden DOMEIN_ID en BMS, met benamingen die overeenkomen met deze in de opgegeven dataset.

GoedgekeurdeAfwijkendeCurves

Optie om goedgekeurde afwijkende curves niet meer te tonen in het validatierapport zolang er geen extra metingen toegevoegd zijn voor de boomsoort-domeincombinatie (om als gebruiker enkel de te keuren curves in het rapport over te houden). De goedgekeurde en dus te negeren curves moeten opgegeven worden in een dataframe met velden DOMEIN_ID, BMS en nBomenTerugTonen, met nBomenTerugTonen het aantal bomen (nBomenInterval) in de boomsoort-domeincombinatie vanaf wanneer de curve terug getoond moet worden. (In dit geval wordt de curve uiteraard enkel terug getoond als ze nog steeds afwijkend is.)

Bestandsnaam

Een naam voor het validatierapport (.html-bestand) dat gegenereerd wordt, bestaande uit een string die eindigt op .html

TypeRapport

Default is "Dynamisch", waarbij de figuren in het .html-bestand kunnen worden aangepast (meetgegevens weergeven door muis erover te bewegen (inclusief ID als deze in de dataset meegegeven is), items uit legende wegklikken, grafiek inzoomen,...). Een andere optie is "Statisch", waarbij de figuren vast zijn.

PathWD

Het path van de working directory, dus het path waarin het validatierapport opgeslagen moet worden (default wordt het in de op dat moment actieve working directory opgeslagen).

Value

De functie genereert een validatierapport (.html-bestand) in de working directory met informatie en grafieken van de te controleren modellen. De afwijkende metingen en curvedelen zijn in rood aangeduid; boven de curve is het probleem ook woordelijk beschreven (zie ?validatierapport of vignet voor meer informatie).

De functie geeft een dataframe terug met de te controleren metingen, met behalve de informatie uit de databank een aantal berekende waarden:

  • H_D_finaal: een geschatte hoogte voor de omtrekklasse volgens het domeinmodel (dus specifiek voor de boomsoort-domeincombinatie)

  • H_VL_finaal: een geschatte hoogte voor de omtrek volgens het Vlaams model (dus voor het overkoepelend boomsoort-model)

  • rmseD: de foutenschatting voor het domeinmodel

  • HogeRmse: TRUE als het domeinmodel een hoge RMSE heeft, anders NA


inbo/dhcurve documentation built on April 6, 2023, 5:17 a.m.