Missing values: Difference between revisions
Line 17: | Line 17: | ||
*[http://www.uvm.edu/~dhowell/StatPages/More_Stuff/Missing_Data/Missing.html Treatment of missing data, website van David C. Howell] | *[http://www.uvm.edu/~dhowell/StatPages/More_Stuff/Missing_Data/Missing.html Treatment of missing data, website van David C. Howell] | ||
*[http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6T84-4KCRSC1-8-1&_cdi=5076&_user=1299343&_orig=search&_coverDate=10%2F31%2F2006&_sk=999409989&view=c&wchp=dGLzVtb-zSkzS&md5=f30f281fede3881394f88ec244a01dda&ie=/sdarticle.pdf Review: A gentle introduction to imputation of missing values, Donders A. Rogier T. et al., Journal of Clinical Epidemiology 59 (2006) 1087-1091] | *[http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6T84-4KCRSC1-8-1&_cdi=5076&_user=1299343&_orig=search&_coverDate=10%2F31%2F2006&_sk=999409989&view=c&wchp=dGLzVtb-zSkzS&md5=f30f281fede3881394f88ec244a01dda&ie=/sdarticle.pdf Review: A gentle introduction to imputation of missing values, Donders A. Rogier T. et al., Journal of Clinical Epidemiology 59 (2006) 1087-1091] | ||
*[ | *[http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6T84-47W911G-4-8&_cdi=5076&_user=1299343&_orig=search&_coverDate=01%2F31%2F2003&_sk=999439998&view=c&wchp=dGLzVtb-zSkzV&md5=fe4eb4f0f8aeb67b4cd39880a617f398&ie=/sdarticle.pdf Developing a prognostic model in the presence of missing data: an ovarian cancer case study, Clark T.A. et al., Journal of Clinical Epidemiology 56 (2003) 28–37] | ||
*[http://multiple-imputation.com http://multiple-imputation.com] Duidelijke uitleg over wat multiple imputation inhoudt. | *[http://multiple-imputation.com http://multiple-imputation.com] Duidelijke uitleg over wat multiple imputation inhoudt. |
Revision as of 12:35, 12 August 2009
Kan een GLM missende waarden aan?
Ik wil een general linear model (GLM) gebruiken op een database. Ik heb begrepen dat als je missing values hebt, je deze analyse niet kan uitvoeren en je daarom de data moet imputeren. Klopt dit?
Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patienten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patienten de data compleet zijn. Als dit een aanzienlijk deel is kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een mixed model in geval van herhaalde metingen).
Van hoeveel % van mijn patienten moet de data compleet zijn om imputeren te rechtvaardigen?
Helaas is er niet direct een percentage te noemen dat imputeren nog valide maakt. Zie de referenties onder aan deze pagina voor informatie over de (on)mogelijkheden van imputeren
Welk programma kan ik het beste gebruiken om mijn missende data te imputeren?
In SPSS is er mogelijkheid voor het gebruiken van simple imputation methodes (ga naar Analyze -> Missing Value Analysis). De aanvulling 'SPSS Missing Values add-on' biedt ook multiple imputation aan (in het standaard pakket opgenomen in SPSS 17). Het verschil tussen simple en multiple imputation is kortweg: bij simple imputeer je de data 1 maal op 1 manier en gebruik je de verkregen dataset in je analyse. Bij multiple imputation imputeer je meerdere malen en kijk je hoe gevoelig de uitkomsten van je analyse zijn voor de verschillende gebruikte imputatietechnieken.
Verder hebben pakketten als Stata, S-Plus, SAS en R (bijvoorbeeld aregImpute package Hmisc) allen routines voor multiple imputatie.
Referenties
- http://multiple-imputation.com Duidelijke uitleg over wat multiple imputation inhoudt.
Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.
Terug naar KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse.