Missing values: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
No edit summary
Line 1: Line 1:
{{auteurs|
|mainauthor= [[user:Nan van Geloven|ir. N van Geloven]]
|coauthor= 
}}
==Kan een GLM missende waarden aan? ==
==Kan een GLM missende waarden aan? ==



Revision as of 16:15, 12 January 2010

Auteur ir. N van Geloven
Co-Auteur
auteurschap op deze site

Kan een GLM missende waarden aan?

Ik wil een general linear model (GLM) gebruiken op een database. Ik heb begrepen dat als je missing values hebt, je deze analyse niet kan uitvoeren en je daarom de data moet imputeren. Klopt dit?

Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patienten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patienten de data compleet zijn. Als dit een aanzienlijk deel is kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een mixed model in geval van herhaalde metingen).

Van hoeveel % van mijn patienten moet de data compleet zijn om imputeren te rechtvaardigen?

Helaas is er niet direct een percentage te noemen dat imputeren nog valide maakt. Zie de referenties onder aan deze pagina voor informatie over de (on)mogelijkheden van imputeren

Welk programma kan ik het beste gebruiken om mijn missende data te imputeren?

In SPSS is er mogelijkheid voor het gebruiken van simple imputation methodes (ga naar Analyze -> Missing Value Analysis). De aanvulling 'SPSS Missing Values add-on' biedt ook multiple imputation aan (in het standaard pakket opgenomen in SPSS 17). Het verschil tussen simple en multiple imputation is kortweg: bij simple imputeer je de data 1 maal op 1 manier en gebruik je de verkregen dataset in je analyse. Bij multiple imputation imputeer je meerdere malen en kijk je hoe gevoelig de uitkomsten van je analyse zijn voor de verschillende gebruikte imputatietechnieken.

Verder hebben pakketten als Stata, S-Plus, SAS en R (bijvoorbeeld aregImpute package Hmisc) allen routines voor multiple imputatie.

Referenties


Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.

Terug naar KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse.