inst/help/RegressionLogistic_nl.md

Logistische Regressie

Met logistische regressie kan men een lineaire relatie tussen een of meer verklarende variabele(n) (predictoren) en een categorische afhankelijke (respons) variabele.

Assumpties

Invoer

Invoerveld:

Model

Statistieken

Grafieken

Uitvoer

Logistische regressie

Samenvatting model: - Model: De verschillende hypothesen die worden vergeleken. - afwijking: -2 x log-likelihood. - AIC: Vergelijk modellen met het Akaike Informatie Criterium. - BIC: vergelijk modellen met het Bayesiaanse Informatie Criterium. - vg: Vrijheidsgraden. - X2: Chi-kwadraat. - p: De p-waarde. - Determinatiecoëfficient waarde (de proportie van de variantie die wordt verklaard door het model). Er zijn drie pseudo R^2 waarden beschikbaar in JASP: - McFadden: berekend als 1 min de ratio van de log-likelihoods van het gespecificeerde model en het nul-model. Als het gespecificeerde model beter op de data past dan het nul-model, dan is McFadden's R2 in de buurt van 1. Als het nul-model ongeveer evengoed op de data past als het gespecificeerde model, dan is McFadden's R2 in de buurt van 0. - Cox & Snell: berekend als 1 min de ratio van de log-likelihoods van het gespecificeerde model en het nul-model, waarbij de ratio verheven wordt tot de macht 2/n (steekproefgrootte). Hogere waarden geven aan dat het gespecificeerde model relatief beter op de data past dan het nul-model. De Cox & Snell index heeft echter als limiet 1 min de likelihood van het nul-model, verheven tot de macht 2/n, en kan zelfs onder ideale omstandigheden niet hoger zijn dan 0.75. - Nagelkerke: dit is een correctie op de methode van Cox & Snell, zodat het als limiet 1 heeft. Deze index wordt berekend als de Cox & Snell R2, gedeeld door 1 min de likelihood van het nul-model verheven tot de macht 2/n. Waarden in de buurt van 1 geven aan dat het gespecificeerde model beter op de data past dan het nul-model. - Tjur: berekend als de absolute waarde van het verschil tussen de gemiddelde voorspelde waarde voor alle gevallen waar de afhankelijke variabele gelijk is aan 0, en de gemiddelde voorspelde waarde voor alle gevallen waar de afhankelijke variabele gelijk is aan 1. In tegenstelling tot de andere pseudo R2 indices, is Tjur's R2 niet relatief aan het nul-model.

Coëfficiënten - Schatting: Regressiecoëfficiënten. - (Robuuste) standaardfout: Standaardfout van de regressiecoëfficiënten. - Gestandaardiseerd: Gestandaardiseerde regressiecoëfficiënten. - Odds ratio: De belangrijkste waarden in de coëfficiënten tabel. Door een continue predictor geeft een odds ratio > 1 een positieve relatie aan terwijl <1 een negatieve relatie aanduidt. - z: De z-waarde. - Wald toets: De Wald toets wordt gebruikt om de statistische significantie van elk coëfficiënt te evalueren. - Wald statistiek: z^2. - vg: Vrijheidsgraden. - p: De p-waarde. - VS-MPR: Vovk-Sellke maximum p-ratio. - % BI: Het betrouwbaarheidsinterval (odds-ratio schaal). Standaard is 95%. - Onder: De ondergrens van het betrouwbaarheidsinterval. - Boven: De bovengrens van het betrouwbaarheidsinterval.

Bootstrap Coëfficiënten. - Schatting: ge-bootstrapte regressiecoëfficiënten. - Bias: Schatting van de bias. - Standaardfout: Standaardfout van de ge-bootstrapte regressiecoëfficiënten.

Multicollineariteitsdiagnostiek: - Tolerantie: Inverse van de Variantie-inflatiefactor (VIF). - VIF: Variance Inflation Factor; grote waarden wijzen op multicollineariteit. Berekend als VIF = det(R11) * det(R22) / det(R), waarbij R de covariantiematrix is van de regressiecoëfficiënten (exclusief intercept), R11 een submatrix is van R van de voorspeller waarvoor VIF wordt berekend, en R22 een submatrix is van R van de overige voorspellers (Fox & Monette, 1992; Fox, 2016).

Vertaald met www.DeepL.com/Translator (gratis versie)

Stapsgewijze Diagnostieken: - Gevalsnummer: Identificatie van het geval. - Geobserveerd: De geobserveerde waarde van de uitkomst. - Voorspeld: De voorspelde waarde. - Voorspelde groep: De voorspelde afhankelijke waarde van de uitkomst. - Residu: Het verschil tussen de geobserveerde en voorspelde waarde. - Gestandaardiseerd residu. - Cook's afstand: De waarde van Cook's afstand. - % BI: Het ge-bootsttrapte betrouwbaarheid interval voor de ongestandaardiseerde coëfficiënten. Standaard is 95%. - Onder: De ondergrens van het betrouwbaarheid interval. - Boven: De bovengrens van het betrouwbaarheid interval.

Factor beschrijvingende statistieken: - De eerste kolom geeft alle niveaus van de factor. - N: Het aantal observaties per niveau van de factor.

Prestatie statistieken

Confusion Matrix: - De confusion matrix geeft aan hoe goed het model de uitkomsten voorspelt. In de diagonaal staan de waarnemingen die het model correct identificeerde. Daarbuiten de waarnemingen waar het model een verkeerde uitkomst voorspelde.

Prestatie Matrix: - Alle geselecteerde prestatiestatistieken en hun waarden staan in deze tabel.

Geschatte grafieken

De conditionele schattings grafieken geven de kans weer op de afhankelijke variabele voor alle niveaus van de covariaat gegeven de referentie over alle andere factoren. Als een continue covariaat wordt toegevoegd wordt er een grijze waas rond de lijn aangebracht die een 95% betrouwbaarheid interval aangeeft.

Residu grafieken

Voorspeld - residu grafiek.

Voorspeller - residu grafiek voor predictor.

Gekwadrateerde Pearson residuen grafiek. - De verwachte waarde van de gekwadrateerde residuen in 1, aangegeven met een stippellijn. De rode lijn geeft de smoother aan door de residuen (= bewegend gemiddelde). Als de rode lijn vooral dichtbij de 1 is kan het worden geconcludeerd dat het model niet aan overdispersie leidt. Enige afwijking rond de staarten valt te verwachten.

Referenties

R Packages



jasp-stats/Regression documentation built on July 15, 2024, 7:04 a.m.