Wikistatistiek - User contributions [en]

Multivariabele regressie voorlopig

2025-04-23T15:36:48Z

M Wolvers: /* Ik heb backwards selection gebruikt - hoe interpreteer ik mijn resultaten? */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland en Nan van Geloven
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#overfitting | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. Luijken et al. <cite>[Luijken2023]</cite> bespreken aan de hand van pharmacologisch onderzoek waarom het formuleren van een estimand lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

== Hoe kies ik welke variabelen ik meeneem in mijn multivariabele model? ==

''Ik heb 90 patiënten waarbij ik baseline parameters heb verzameld (9 lab parameters en 13 klinische parameters). Met een non-parameterische test heb ik gevonden dat 1 lab parameter en enkele klinische parameters verschillend zijn tussen beide uitkomst groepen (=diagnose wel/niet na 2 jaar). Nu wilde ik kijken welke parameters het beste voorspellend zijn voor uitkomst. Ik heb backward logistische regressie gedaan met de parameters die eerder een significant verschil lieten zien, maar ik weet niet zeker of dit de beste keuze is. Mogelijk moet het anders of moeten er meer parameters in of moeten parameters gecombineerd worden?

Je vraag verdient wat aanscherping, grofweg gaat het om de volgende afweging: Wil je een model maken waarmee je bij nieuwe patiënten zo goed mogelijk kunt '''voorspellen''' of patiënten na 2 jaar een diagnose krijgen, of wil je van elk van de gemeten baselineparameters kijken of ze '''verklaren''' of mensen na 2 jaar een diagnose hebben?

== Ik heb backwards selection gebruikt - hoe interpreteer ik mijn resultaten? ==

''Ik ben bezig met een onderzoek naar welke variabelen van invloed zijn op een tumorbiopsie-uitkomst (wel of geen diagnose). Hiervoor heb ik een aantal parameters (bijv. tumorgrootte, lokatie van de tumor, in welke mate de tumor uitstulpt etc) genomen waarvan ik verwacht dat ze van invloed zijn. Ik heb er een backward multiple regressie op los gelaten en krijg hier ook wel resultaten uit, maar weet niet zo goed hoe ik die moet interpreteren.

Als ik het goed begrijp gebruik je observationele data om een reeks verklarende onderzoeksvragen te beantwoorden. Datagedreven selectie leent zich daar in principe niet voor, je wilt in dat geval zélf - voor elk van de te onderzoeken parameters - bepalen hoe je ''minimal sufficient adjustment set'' eruit ziet.

== Hoe kan ik het best mijn variabelen selecteren, dmv handmatige selectie of met een automatische procedure? ==

''Er zijn verschillende methode voor het doen van een multivariabele regressie. Ik wil een backwards selectiestrategie aanhouden. Wat is aan te raden? Een handmatig procedure met enter selection, waar bij je handmatig de variabele met de hoogste p-waarde verwijdert tot er een set variabelen overblijft die allemaal significant zijn, of een automatische backward procedure?

Dat hangt totaal af van het doel dat je ermee voor ogen hebt. Houd er rekening mee dat datagedreven selectiemethodes in principe niet goed samengaan met inferentie, met andere woorden dat je na een dergeljke procedure weinig meer kunt met p-waarden en standaardfouten.

== Hoe rapporteer ik de resultaten van mijn multivariabele model? ==

''Voor een vragenlijstonderzoek betreffende kwaliteit van leven heb ik in de analyse lineaire regressie gedaan met forward selection. In het uiteindelijke model zijn er variabelen met een niet-significante p-waarde. Als je een tabel maakt van de variabelen in het uiteindelijke model, zouden jullie die dan sorteren op grootte van de beta, op significantie van de p-waarde of op grootte van de verklaarde variantie? Of zouden jullie gewoon de output van SPSS overnemen?

P-waarden en standaardfouten zijn - bot gezegd - waardeloos na een dergelijke automatische selectieprocedure <cite>[Babyak2004]</cite>. Mocht je toch de beta's willen rapporteren: Er zijn geen vaste regels voor de volgorde waarin je variabelen in een tabel zet. Er zou bijvoorbeeld hiërarchie in de variabelen kunnen zitten, of chronologische volgorde (bijvoorbeeld eerst leeftijd en geslacht en pas later de invloed van roken oid). Het is wel helder om alle variabelen van je uiteindelijke model (dus ook niet significante) te laten zien, dan kan een lezer zien naast welke andere voorspellers de variabelen beoordeeld zijn.

== Hoe zorg ik voor een heldere en gebruiksvriendelijke presentatie van mijn multivariabele model? ==

Dit artikel van Sullivan et al. <cite>[Sullivan2004]</cite> kan je daarbij wellicht helpen. Daarin wordt getoond hoe je de resultaten van je regressiemodel kunt vertalen in risicoscores.

== Hoe selecteer ik mbv univariabele regressiefactoren voor in een multivariabele regressie? ==

''Wij analyseren de verschillen in uitkomst (success rate) tussen twee operaties. We hebben eerst een aantal factoren los getest op invloed op success rate. Daarna de significante factoren overgebracht naar een multivariabele logistische regressie. Is dit een goede methodiek?

Bij dergelijke 'univariabele preselectie' is het methodologisch te prefereren om niet alleen variabelen die significant zijn in de univariabele analyse door te schuiven naar multivariabele, maar daarbij een meer coulante p-waarde aan te houden (bijv variabelen met univariabele p<0.20 of zelfs p<0.50 (Steyerberg volgens Babyak)).

== Hoe kies ik welke variabelen ik in mijn model moet meenemen? ==

''Ik heb een databestand met een heleboel variabelen. Ik ben op zoek naar een zo eenvoudig mogelijk (en dus makkelijk toepasbaar) voorspellend model. Hoe kies ik welke variabelen ik in mijn model moet meenemen?''

Steyerberg heeft voor het maken van voorspellende modellen een zeer nuttige en open access handleiding geschreven.

== Er is overlap tussen twee van onze voorspellers, mogen deze samen in een multivariabel model? ==

''We zijn op zoek naar voorspellende factoren voor het optreden van hepatitis A. We hebben verschillende factoren univariaat getoetst (leeftijd, geslacht, comorbiditeit, etc). Nu vonden we in de univariate analyse dat "man" vs. "vrouw" positief geassocieerd was met de uitkomstmaat en dat "comorbiditeit" negatief geassocieerd was (getoetst met een [[Chi-kwadraat toets]]). In de groep "zonder comborbiditeit" zitten veel mannen en in de groep "met comorbiditeit" zitten veel vrouwen, er is dus enige overlap in de groepen. Is het mogelijk om beide voorspellende factoren in een multivariabele logistische regressie te stoppen, of moeten wij daarvoor eerst bv. de mate van overlap toetsen omdat het model anders instabiel wordt?

Je onderzoeksvraag verdient mogelijk nog wat aanscherping. Zie [[Multivariabele_regressie_voorlopig#Let_op:_Vaak_is_verklaren_wel_degelijk_het_doel! | deze paragraaf]]. Het volgende antwoord gaat ervan uit dat het gaat om het maken van een prognostisch model voor het optreden van Hepatitis A.

Indien de overlap tussen twee voorspellers hoog is, dan zal het model zoals je zegt inderdaad instabiel worden. Dat wordt het probleem van collineariteit genoemd. Wanneer het model instabiel wordt, zul je dat zien aan zeer grote standaardfouten van de regressiecoefficienten.

== Hoe moet ik corrigeren voor baseline waardes? ==

''Wij doen een onderzoek naar het voorspellers van fysiek functioneren na totale heup prothesen. Onze uitkomst maat van fysiek functioneren, HOOS (Hip disability and Osteoarthristis Outcome Score), drukt de functie uit op een schaal van 0-100 gemeten op de baseline en na 2 jaar. De volgende regressies met als voorspeller leeftijd en als afhankelijke variabele de HOOS zijn gedaan.

*''1: uitkomst HOOS absolute uitkomst op 2 jaar, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503
*''2: uitkomst HOOS verschil score tussen 2 jaar en baseline, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503
*''3. uitkomst HOOS verschil score tussen 2 jaar en baseline, predictor leeftijd (ongecorrigeerd), p-waarde voor leeftijd: 0.048

''Zoals u ziet is er een verschil in significantie afhankelijk van de correctie voor baseline. Welke uitkomst moet ik gebruiken?

Je onderzoeksvraag verdient mogelijk nog wat aanscherping. Zie [[Multivariabele_regressie_voorlopig#Let_op:_Vaak_is_verklaren_wel_degelijk_het_doel! | deze paragraaf]].
*Het gebruik van de term voorspellers, lijkt te duiden op het zo goed mogelijk willen 'voorspellen' van fysiek functioneren na totale heupprothese.
*De term 'correctie', en het interpreteren van de p-waarden, duidt echter op een 'verklarende' onderzoeksvraag. Het antwoord hieronder leunt dan ook op deze laatste interpretatie van je onderzoeksdoel.

Een waarschijnlijke verklaring van jouw uitkomsten is dat de correlatie tussen leeftijd en HOOS score op baseline de schijnbare significantie in model 3 veroorzaakt. In het algemeen is het aan te raden de baseline score als covariaat mee te geven in het model, zie ook de [https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-adjustment-baseline-covariates-clinical-trials EMA Guideline on adjustment for baseline covariates], paragraaf 4.2.6, daar staat ook de te verwachten overeenstemming van model 1 en 2 genoemd.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
#Luijken2023 pmid=36946319

#Peduzzi1996 [http://dx.doi.org/10.1016/S0895-4356(96)00236-3 Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR. A simulation study of the number of events per variable in logistic regression analysis. ''J Clin Epidemiol''. 1996 Dec;49(12):1373-9.]
#Harrel Regression Modeling Strategies with Applications to Linear Models, Logistic Regression and Survival Analysis. Frank E. Harrell, Jun, Springer-Verlag, New York, 2001. No. of pages: 568. ISBN 0-387-95232-2.
#Sullivan2004 pmid=15122742
</biblio>

== Aanvullende bronnen ==

*[https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-adjustment-baseline-covariates-clinical-trials Guideline on adjustment for baseline covariates in clinical trials]
*[https://www.ema.europa.eu/en/investigation-subgroups-confirmatory-clinical-trials-scientific-guideline Guideline on the investigation of subgroups in confirmatory clinical trials]
*[http://www.ncbi.nlm.nih.gov/pubmed/21030068 Everything You Always Wanted to Know About Evaluating Prediction Models (But Were Too Afraid to Ask)] Andrew J. Vickers and Angel M. Cronin, Urology Volume 76, Issue 6, December 2010, Pages 1298-1301.

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T15:31:12Z

M Wolvers:

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland en Nan van Geloven
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#overfitting | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. Luijken et al. <cite>[Luijken2023]</cite> bespreken aan de hand van pharmacologisch onderzoek waarom het formuleren van een estimand lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

== Hoe kies ik welke variabelen ik meeneem in mijn multivariabele model? ==

''Ik heb 90 patiënten waarbij ik baseline parameters heb verzameld (9 lab parameters en 13 klinische parameters). Met een non-parameterische test heb ik gevonden dat 1 lab parameter en enkele klinische parameters verschillend zijn tussen beide uitkomst groepen (=diagnose wel/niet na 2 jaar). Nu wilde ik kijken welke parameters het beste voorspellend zijn voor uitkomst. Ik heb backward logistische regressie gedaan met de parameters die eerder een significant verschil lieten zien, maar ik weet niet zeker of dit de beste keuze is. Mogelijk moet het anders of moeten er meer parameters in of moeten parameters gecombineerd worden?

Je vraag verdient wat aanscherping, grofweg gaat het om de volgende afweging: Wil je een model maken waarmee je bij nieuwe patiënten zo goed mogelijk kunt '''voorspellen''' of patiënten na 2 jaar een diagnose krijgen, of wil je van elk van de gemeten baselineparameters kijken of ze '''verklaren''' of mensen na 2 jaar een diagnose hebben?

== Ik heb backwards selection gebruikt - hoe interpreteer ik mijn resultaten? ==

''Ik ben bezig met een onderzoek naar welke variabelen van invloed zijn op een tumorbiopsie-uitkomst (wel of geen diagnose). Hiervoor heb ik een aantal parameters (bijv. tumorgrootte, lokatie van de tumor, in welke mate de tumor uitstulpt etc) genomen waarvan ik verwacht dat ze van invloed zijn. Ik heb er een backward multiple regressie op los gelaten en krijg hier ook wel resultaten uit, maar weet niet zo goed hoe ik die moet interpreteren.

Als ik het goed begrijp gebruik je observationele data om een reeks verklarende onderzoeksvragen te beantwoorden. Datagedreven selectie leent zich daar in principe niet voor, je wilt in dat geval zélf - voor elk van de te onderzoeken parameters - bepalen hoe je ''minimal adjustment set'' eruit ziet.

== Hoe kan ik het best mijn variabelen selecteren, dmv handmatige selectie of met een automatische procedure? ==

''Er zijn verschillende methode voor het doen van een multivariabele regressie. Ik wil een backwards selectiestrategie aanhouden. Wat is aan te raden? Een handmatig procedure met enter selection, waar bij je handmatig de variabele met de hoogste p-waarde verwijdert tot er een set variabelen overblijft die allemaal significant zijn, of een automatische backward procedure?

Dat hangt totaal af van het doel dat je ermee voor ogen hebt. Houd er rekening mee dat datagedreven selectiemethodes in principe niet goed samengaan met inferentie, met andere woorden dat je na een dergeljke procedure weinig meer kunt met p-waarden en standaardfouten.

== Hoe rapporteer ik de resultaten van mijn multivariabele model? ==

''Voor een vragenlijstonderzoek betreffende kwaliteit van leven heb ik in de analyse lineaire regressie gedaan met forward selection. In het uiteindelijke model zijn er variabelen met een niet-significante p-waarde. Als je een tabel maakt van de variabelen in het uiteindelijke model, zouden jullie die dan sorteren op grootte van de beta, op significantie van de p-waarde of op grootte van de verklaarde variantie? Of zouden jullie gewoon de output van SPSS overnemen?

P-waarden en standaardfouten zijn - bot gezegd - waardeloos na een dergelijke automatische selectieprocedure <cite>[Babyak2004]</cite>. Mocht je toch de beta's willen rapporteren: Er zijn geen vaste regels voor de volgorde waarin je variabelen in een tabel zet. Er zou bijvoorbeeld hiërarchie in de variabelen kunnen zitten, of chronologische volgorde (bijvoorbeeld eerst leeftijd en geslacht en pas later de invloed van roken oid). Het is wel helder om alle variabelen van je uiteindelijke model (dus ook niet significante) te laten zien, dan kan een lezer zien naast welke andere voorspellers de variabelen beoordeeld zijn.

== Hoe zorg ik voor een heldere en gebruiksvriendelijke presentatie van mijn multivariabele model? ==

Dit artikel van Sullivan et al. <cite>[Sullivan2004]</cite> kan je daarbij wellicht helpen. Daarin wordt getoond hoe je de resultaten van je regressiemodel kunt vertalen in risicoscores.

== Hoe selecteer ik mbv univariabele regressiefactoren voor in een multivariabele regressie? ==

''Wij analyseren de verschillen in uitkomst (success rate) tussen twee operaties. We hebben eerst een aantal factoren los getest op invloed op success rate. Daarna de significante factoren overgebracht naar een multivariabele logistische regressie. Is dit een goede methodiek?

Bij dergelijke 'univariabele preselectie' is het methodologisch te prefereren om niet alleen variabelen die significant zijn in de univariabele analyse door te schuiven naar multivariabele, maar daarbij een meer coulante p-waarde aan te houden (bijv variabelen met univariabele p<0.20 of zelfs p<0.50 (Steyerberg volgens Babyak)).

== Hoe kies ik welke variabelen ik in mijn model moet meenemen? ==

''Ik heb een databestand met een heleboel variabelen. Ik ben op zoek naar een zo eenvoudig mogelijk (en dus makkelijk toepasbaar) voorspellend model. Hoe kies ik welke variabelen ik in mijn model moet meenemen?''

Steyerberg heeft voor het maken van voorspellende modellen een zeer nuttige en open access handleiding geschreven.

== Er is overlap tussen twee van onze voorspellers, mogen deze samen in een multivariabel model? ==

''We zijn op zoek naar voorspellende factoren voor het optreden van hepatitis A. We hebben verschillende factoren univariaat getoetst (leeftijd, geslacht, comorbiditeit, etc). Nu vonden we in de univariate analyse dat "man" vs. "vrouw" positief geassocieerd was met de uitkomstmaat en dat "comorbiditeit" negatief geassocieerd was (getoetst met een [[Chi-kwadraat toets]]). In de groep "zonder comborbiditeit" zitten veel mannen en in de groep "met comorbiditeit" zitten veel vrouwen, er is dus enige overlap in de groepen. Is het mogelijk om beide voorspellende factoren in een multivariabele logistische regressie te stoppen, of moeten wij daarvoor eerst bv. de mate van overlap toetsen omdat het model anders instabiel wordt?

Je onderzoeksvraag verdient mogelijk nog wat aanscherping. Zie [[Multivariabele_regressie_voorlopig#Let_op:_Vaak_is_verklaren_wel_degelijk_het_doel! | deze paragraaf]]. Het volgende antwoord gaat ervan uit dat het gaat om het maken van een prognostisch model voor het optreden van Hepatitis A.

Indien de overlap tussen twee voorspellers hoog is, dan zal het model zoals je zegt inderdaad instabiel worden. Dat wordt het probleem van collineariteit genoemd. Wanneer het model instabiel wordt, zul je dat zien aan zeer grote standaardfouten van de regressiecoefficienten.

== Hoe moet ik corrigeren voor baseline waardes? ==

''Wij doen een onderzoek naar het voorspellers van fysiek functioneren na totale heup prothesen. Onze uitkomst maat van fysiek functioneren, HOOS (Hip disability and Osteoarthristis Outcome Score), drukt de functie uit op een schaal van 0-100 gemeten op de baseline en na 2 jaar. De volgende regressies met als voorspeller leeftijd en als afhankelijke variabele de HOOS zijn gedaan.

*''1: uitkomst HOOS absolute uitkomst op 2 jaar, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503
*''2: uitkomst HOOS verschil score tussen 2 jaar en baseline, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503
*''3. uitkomst HOOS verschil score tussen 2 jaar en baseline, predictor leeftijd (ongecorrigeerd), p-waarde voor leeftijd: 0.048

''Zoals u ziet is er een verschil in significantie afhankelijk van de correctie voor baseline. Welke uitkomst moet ik gebruiken?

Je onderzoeksvraag verdient mogelijk nog wat aanscherping. Zie [[Multivariabele_regressie_voorlopig#Let_op:_Vaak_is_verklaren_wel_degelijk_het_doel! | deze paragraaf]].
*Het gebruik van de term voorspellers, lijkt te duiden op het zo goed mogelijk willen 'voorspellen' van fysiek functioneren na totale heupprothese.
*De term 'correctie', en het interpreteren van de p-waarden, duidt echter op een 'verklarende' onderzoeksvraag. Het antwoord hieronder leunt dan ook op deze laatste interpretatie van je onderzoeksdoel.

Een waarschijnlijke verklaring van jouw uitkomsten is dat de correlatie tussen leeftijd en HOOS score op baseline de schijnbare significantie in model 3 veroorzaakt. In het algemeen is het aan te raden de baseline score als covariaat mee te geven in het model, zie ook de [https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-adjustment-baseline-covariates-clinical-trials EMA Guideline on adjustment for baseline covariates], paragraaf 4.2.6, daar staat ook de te verwachten overeenstemming van model 1 en 2 genoemd.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
#Luijken2023 pmid=36946319

#Peduzzi1996 [http://dx.doi.org/10.1016/S0895-4356(96)00236-3 Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR. A simulation study of the number of events per variable in logistic regression analysis. ''J Clin Epidemiol''. 1996 Dec;49(12):1373-9.]
#Harrel Regression Modeling Strategies with Applications to Linear Models, Logistic Regression and Survival Analysis. Frank E. Harrell, Jun, Springer-Verlag, New York, 2001. No. of pages: 568. ISBN 0-387-95232-2.
#Sullivan2004 pmid=15122742
</biblio>

== Aanvullende bronnen ==

*[https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-adjustment-baseline-covariates-clinical-trials Guideline on adjustment for baseline covariates in clinical trials]
*[https://www.ema.europa.eu/en/investigation-subgroups-confirmatory-clinical-trials-scientific-guideline Guideline on the investigation of subgroups in confirmatory clinical trials]
*[http://www.ncbi.nlm.nih.gov/pubmed/21030068 Everything You Always Wanted to Know About Evaluating Prediction Models (But Were Too Afraid to Ask)] Andrew J. Vickers and Angel M. Cronin, Urology Volume 76, Issue 6, December 2010, Pages 1298-1301.

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:26:48Z

M Wolvers: /* Referenties */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#overfitting | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. Luijken et al. <cite>[Luijken2023]</cite> bespreken aan de hand van pharmacologisch onderzoek waarom het formuleren van een estimand lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
#Luijken2023 pmid=36946319
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:26:10Z

M Wolvers: /* Observationeel onderzoek */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#overfitting | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. Luijken et al. <cite>[Luijken2023]</cite> bespreken aan de hand van pharmacologisch onderzoek waarom het formuleren van een estimand lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:22:11Z

M Wolvers: /* Voorspellen */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#overfitting | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:20:46Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een ''sufficient adjustment set'' opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, ''inverse propensity score weighting'' (IPSW) of ''inverse probability of treatment weights'' (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van ''directed acyclic graphs'' (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:19:57Z

M Wolvers: /* Table 2 fallacy */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde ''Table 2 fallacy'' <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:18:24Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.
# of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:18:07Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

# of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T14:17:50Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

# een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

## of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T13:40:41Z

M Wolvers: /* Wat is overfitting en waarom is dat een probleem? */

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Een modernere datagedreven selectie van predictoren in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Maar let op: datagedreven selectie en inferentie (dus het gebruiken of interpreteren van standaardfouten en p-waarden) gaan in principe niet goed samen <cite>[Babyak2004]</cite>. Bovendien heeft de typische toepassing van "traditionele" stepwise regressiemethoden talrijke eigen problemen <cite>[Babyak2004][Livingston2010]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T13:12:01Z

M Wolvers:

{{auteurs|
|mainauthor= [[user: M Wolvers | dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Veelgestelde vragen =
==Wat is overfitting en waarom is dat een probleem? ==

Overfitting is een fenomeen waarbij ruis in de trainingsdata gemodelleerd wordt en dus wordt toegeschreven aan de covariaten. Daarmee verliest het model de generaliseerbaarheid. Dit gebeurt wanneer er teveel parameters geschat worden ten opzichte van het aantal datapunten waarmee deze berekend worden. De geschatte beta’s zijn groter dan in de populatie en de p-waarden en standaardfouten worden onderschat. Dit effect verergert wanneer stapsgewijze selectiemethoden worden gebruikt. [https://doi.org/10.1097/01.psy.0000127692.23278.a9 Babyak] geeft een goed leesbare uitleg van dit probleem.

Overfitting is een potentieel probleem voor alle toepassingen van multivariabele regressie, zeker in het geval van biomedische/klinische, vaak spaarzame data. Hier dient dan ook in het ontwerp van de studie rekening mee te worden gehouden.

Bij een verklarende onderzoeksvraag is het selecteren van covariabelen een methodologische kwestie die al in de ontwerpfase opgelost moet worden. Het alternatief, datagedreven selecteren, zou er immers voor kunnen zorgen dat (een deel van) de – hopelijk zorgvuldig geselecteerde <cite>[Greenland1999]</cite> – minimal sufficient adjustment set zou worden weggeselecteerd en de interpretatie van de gevonden associatie substantieel verandert (bias krijgt). Overfitting kan dan alleen voorkomen worden door daar in het bepalen van de [[powercalculatie | steekproefgrootte]] rekening mee te houden.

Bij voorspellend onderzoek is het datagedreven selecteren van variabelen wel degelijk een acceptabele manier om overfitting te voorkomen. Hoewel stapsgewijze selectietechnieken (stepwise forward selection, backward elimination) jarenlang zijn gedoceerd in epidemiologisch en statistisch onderwijs, en deze nog steeds worden gebruikt én gepubliceerd, is duidelijk dat die leiden tot bias (in dit geval onderschatting) van p-waarden en standaardfouten en menen veel statistici dat deze methodes daarom vermeden zouden moeten worden <cite>[McNeish2015][Babyak2004][Livingston2010]</cite>.

Een modernere aanpak voor het beperken van overfitting in het geval van voorspellend onderzoek is regularisatie <cite>[McNeish2015][Friedrich2022]</cite>. Daarbij worden bij het fitten van het model complexere modellen numeriek gestraft, wat resulteert in een nuttiger, beter generaliseerbaar model. Als je meer parameters/predictoren dan observaties hebt (hoogdimensionele data), zoek dan vooral methodologische hulp.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
#Livingston2010 Livingston E, Cao J, Dimick JB. Tread Carefully With Stepwise Regression. Arch Surg. 2010;145(11):1039–1040. [https://doi.org/10.1001/archsurg.2010.240 doi:10.1001/archsurg.2010.240]
#McNeish2015 McNeish, D. (2015). Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences. Multivariate Behavioral Research, 50(5), 471–484. [https://doi.org/10.1080/00273171.2015.1036965 DOI:10.1080/00273171.2015.1036965]
#Friedrich2022 pmid=36384320
#Babyak2004 pmid=15184705
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:44:49Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs). [https://cran.r-project.org/web/packages/ggdag/vignettes/intro-to-dags.html Deze introductie] in R en [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions deze gratis online cursus] zijn mogelijk nuttige startpunten.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:40:51Z

M Wolvers: /* Referenties */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
#Goetghebeur2020 Goetghebeur, E., le Cessie, S., De Stavola, B., Moodie, E. E. M., & Waernbaum, I. (2020). Formulating causal questions and principled statistical answers. Statistics in Medicine, 39(30), 4922–4948. [https://doi.org/10.1002/sim.8741 DOI:10.1002/sim.8741]
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:39:32Z

M Wolvers: /* Observationeel onderzoek */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016][Goetghebeur2020]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:31:39Z

M Wolvers: /* Multivariabele regressie voor efficiëntie of om te corrigeren van confounding */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:23:18Z

M Wolvers: /* Experimenteel onderzoek */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie/interventie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:19:38Z

M Wolvers: /* Let op: Vaak is verklaren wel degelijk het doel! */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen<cite>[Hernan2018]</cite>. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:17:41Z

M Wolvers: /* Table 2 fallacy */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

==== Table 2 fallacy ====
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:17:21Z

M Wolvers: /* Table 2 fallacy */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

== Table 2 fallacy ==
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:16:48Z

M Wolvers: /* Multivariabele regressie om te corrigeren voor confounding */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel <cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:15:13Z

M Wolvers: /* Referenties */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932
#Greenland1999 pmid=9888278
#Hernan2016 pmid=26994063
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:14:52Z

M Wolvers: /* Observationeel onderzoek */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd <cite>[Carlin2024]</cite>. [https://onlinelibrary.wiley.com/doi/full/10.1002/pds.5620 In dit paper] wordt aan de hand van pharmacologisch onderzoek besproken waarom dat lastig kan zijn, maar essentieel is.

Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren <cite>[Hernan2016]</cite>. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932]
#Greenland1999 pmid=9888278
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:11:35Z

M Wolvers: /* Multivariabele regressie voor efficiëntie of om te corrigeren van confounding */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten.

Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd </cite>[Carlin2024]<cite>. Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren [https://pubmed.ncbi.nlm.nih.gov/26994063/ Hernán en Robins 2016]. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932]
#Greenland1999 pmid=9888278
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:06:10Z

M Wolvers: /* Voorspellen */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[multivariabele_regressie_voorlopig#Table_2_fallacy | Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet validatie.

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] is relevant om te noemen in deze context.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd </cite>[Carlin2024]<cite>. Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren [https://pubmed.ncbi.nlm.nih.gov/26994063/ Hernán en Robins 2016]. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932]
#Greenland1999 pmid=9888278
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:02:46Z

M Wolvers: /* Let op: Vaak is verklaren wel degelijk het doel! */

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet [[validatie]].

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook is de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] hier relevant.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd </cite>[Carlin2024]<cite>. Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren [https://pubmed.ncbi.nlm.nih.gov/26994063/ Hernán en Robins 2016]. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

== Let op: Vaak is verklaren wel degelijk het doel! ==
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932]
#Greenland1999 pmid=9888278
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T12:01:48Z

M Wolvers:

{{auteurs|
|mainauthor= [[user:M Wolvers|dr. M.D.J. Wolvers]]
|coauthor= Jeroen Hoogland
}}

=Wat is multivariabele regressie? =

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van [https://en.wikipedia.org/wiki/Generalized_linear_model generalized linear models]. Dit omvat naast [[lineaire regressie]] ook [[Logistische_regressie| logistische]] en [[multinomiale logistische regressie]]. Daarnaast is [[Survival_analyse#Cox-regressie| Cox regressie]] een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met [[Herhaalde metingen | onafhankelijke observaties]].

=Waarvoor kun je multivariabele regressie gebruiken?=

Een statistische analyse kan grofweg drie doelen dienen <cite>[Shmueli2010][Hernan2019][Carlin2024]</cite>: [[Multivariabele_regressie_voorlopig#Beschrijven | beschrijven]], [[Multivariabele_regressie_voorlopig#Voorspellen| voorspellen]] of [[Multivariabele_regressie_voorlopig#Verklaren| verklaren]]. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

== Beschrijven ==

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld <cite>[Hernan2018]</cite>. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Een louter associatieve analyse heeft namelijk geen correctie voor confounding nodig <cite>[Hernan2018]</cite>.

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse <cite>[Hamaker2020]</cite>. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

== Voorspellen ==

Het tweede doel is voorspellen; ook wel predictie of prognostisch onderzoek genoemd. Het doel is dan om zo goed mogelijk een uitkomst te voorspellen, bijvoorbeeld om een model te ontwikkelen voor het voorspellen van 5-jaars overleving bij een diagnose van borstkanker <cite>[Note1]</cite>.

Meestal is een dergelijke uitkomst in de toekomst gelegen, maar soms, zoals vaak het geval is bij [[diagnostisch onderzoek]], is deze uitkomst op (ongeveer) hetzelfde moment gemeten. Dit gebeurt bijvoorbeeld wanneer de uitkomst te invasief, duur of onpraktisch is om op grote schaal te meten <cite>[Hamaker2020]</cite>.

Multivariabele regressie is een nuttig en veelgebruikt gereedschap in dergelijk onderzoek. Bij deze vorm van onderzoek worden predictoren gekozen op basis van expertise, maar kan het nuttig zijn om statistische technieken te gebruiken voor het selecteren van predictoren of concurrerende modellen. Daarover [[multivariabele_regressie_voorlopig#modelselectie | hieronder]] meer.

Anders dan vaak gedacht, hoeft een statistisch model niet veel te lijken op ‘de echte wereld' <cite>[Shmueli2010]</cite> om nauwkeurige voorspellingen op te leveren. Bovendien: de individuele parameters van het model hebben geen betekenisvolle interpretatie (zie ook: [[Table 2 fallacy]]), deze zijn bij voorspellend onderzoek ondergeschikt aan de mate waarin het uiteindelijke model in staat is om nauwkeurige voorspellingen in (nieuwe) cases te generen.

Voor een waardevol, klinisch bruikbaar predictiemodel is het bouwen en rapporteren ervan alleen dus ook niet genoeg. Je wilt dan tenminste ook analyseren hoe goed het model in staat is om nieuwe gevallen te voorspellen. Dat proces heet [[validatie]].

Het boek [https://link.springer.com/book/10.1007/978-3-030-16399-0 Clinical Prediction Models] van Steyerberg of de hiervoor genoemde [https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1001381 methodologische reeks] zijn nuttige startpunten indien je geïnteresseerd bent in het uitvoeren van prognostisch onderzoek. Ook is de [https://doi.org/10.1136/bmj-2023-078378 TRIPOD guideline] hier relevant.

== Verklaren ==
Het derde en laatste onderzoeksdoel is verklaren. In een meer statistische context worden hiervoor ook de termen causale inferentie of counterfactual prediction gebruikt. Dit doel kan op zeer verschillende manieren nagestreefd worden.

=== Experimenteel onderzoek ===
De meest gebruikte vorm van verklarend onderzoek is experimenteel onderzoek, met de [[Randomiseren | randomized controlled trial (rct)]] als lichtend voorbeeld. Bij een perfect uitgevoerde rct, waarbij je door de randomisatie aannemelijk kunt maken dat eventuele verschillen enkel veroorzaakt kunnen worden door de allocatie, is het gebruik van multivariabele analyse niet nodig om een valide resultaat te verkrijgen.

==== Multivariabele regressie voor efficiëntie of om te corrigeren van confounding ====
Bij experimenteel onderzoek kán het echter wel degelijk nuttig of nodig zijn om gebruik te maken van multivariabele regressie. Wanneer je gebruik hebt gemaakt van gestratificeerde randomisatie bijvoorbeeld, is het gewenst om de stratificatiefactor als covariaat te includeren in de primaire analyse [https://www.ema.europa.eu/en/adjustment-baseline-covariates-clinical-trials-scientific-guideline EMA guideline on covariate adjustment]. De selectie van covariaten volgt dan in principe uit het studieontwerp. Er is dan sprake van forced entry van deze covariaten. Wanneer covariaten worden gebruikt voor efficiëntie of correctie van confounding, wordt datagedreven of automatische selectie van covariaten of concurrerende modellen sterk afgeraden.

=== Observationeel onderzoek ===
Niet altijd is het ethisch of haalbaar om causale vragen a.d.h.v. de gouden standaard, rct’s, te beantwoorden. Dit kan ook worden bewerkstelligd met observationeel onderzoek, zij het met limitaties, te weten een veel grotere set aan (onverifieerbare) aannamen. Een schoolvoorbeeld van zo een vraag is “veroorzaakt roken longkanker?”.
Bij observationeel onderzoek is de onderzoeksvraag en/of de [https://en.wikipedia.org/wiki/Estimand estimand] vaak niet helder geformuleerd </cite>[Carlin2024]<cite>. Om tot een concrete onderzoeksvraag en estimand te komen, kan het nuttig zijn om een hypothetische target trial te formuleren [https://pubmed.ncbi.nlm.nih.gov/26994063/ Hernán en Robins 2016]. Vanuit daar valt vaak te redeneren welke zaken - gegeven de praktische en ethische restricties - relevante hinder leveren voor het betrouwbaar schatten van het belangwekkende effect/de estimand.

==== Multivariabele regressie om te corrigeren voor confounding ====
Een multivariabel regressiemodel is een gereedschap dat kan worden gebruikt voor het corrigeren van confounding en selection bias. Er zijn meerdere manieren waarop dit gerealiseerd kan worden, zoals

1. een sufficient adjustment set opnemen als covariaten in een multivariabel regressiemodel </cite>[Greenland1999]</cite>.

2. of, in meerdere stappen, inverse propensity score weighting (IPSW) of inverse probability of treatment weights (IPTW) gebruiken. Daarbij wordt multivariabele regressiemodel gebruikt om een weging mee te geven aan observaties (meestal: patiënten) in de uiteindelijke analyse <cite>[Chesnaye2021]</cite>.
In beide scenario’s is een aanpak te prefereren waarbij van tevoren in een statistisch analyseplan voor elke onderzoeksvraag is vastgesteld en beargumenteerd hoe elke variabelen word gebruikt om een zo relevant mogelijk schatting van de estimand op te leveren. Het is raadzaam om bij het vaststellen van de set van confounders gebruik te maken van directed acyclic graphs (DAGs) [An Introduction to Directed Acyclic Graphs (r-project.org)]. [https://www.edx.org/learn/data-analysis/harvard-university-causal-diagrams-draw-your-assumptions-before-your-conclusions Deze gratis online cursus] is een nuttig startpunt.

=== Table 2 fallacy ===
Een ander aandachtspunt bij het gebruik van multivariabele modellen in deze context is de zogenaamde Table 2 fallacy <cite>[Westreich2013]</cite>; het presenteren van de geschatte regressiecoëfficiënten van een multivariabel model met de implicatie dat dit praktische, klinisch interpreteerbare kwantiteiten zijn. Het kán zo zijn dat (een deel van) de gemodelleerde associaties heel toevallig afdoende gecorrigeerd zijn voor confounding en dus kwantificaties van (relevante) causale effecten zijn, maar dit is niet zomaar te verwachten: in principe hebben de coëfficiënten allemaal géén causale interpretatie, met als enige uitzondering de coëfficiënt die hoort bij een goed uitgedachte causale estimand.

=== Let op: Vaak is verklaren wel degelijk het doel! ===
Geregeld worden onderzoeksvragen die eigenlijk gaan over oorzaak-gevolgrelaties gepresenteerd als een beschrijvende of voorspellende onderzoeksvraag door het vermijden van causale termen. Dit gebeurt bij observationeel onderzoek, maar ook bij post-hoc analyses of secundaire onderzoeksvragen van experimenteel onderzoek. Denk aan formuleringen als: “wat zijn de belangrijkste voorspellers van …” (<cite>[Carlin2024]</cite>), terwijl in principe gezocht wordt naar factoren die het (gezien het causale effect op een relevante uitkomstmaat) waard zijn om op te interveniëren. Door causale terminologie te vermijden wordt uit het oog verloren wat er eigenlijk nodig is om het (onderliggende, causale) doel te bereiken. Daarmee wordt het lastig gemaakt om de methoden en conclusies te kunnen evalueren <cite>[Hernan2018]</cite>.

= Referenties =
<biblio>
#Carlin2024 Carlin, J. B., & Moreno-Betancur, M. (2024). On the uses and abuses of regression models: A call for reform of statistical practice and teaching. arXiv. [https://doi.org/10.48550/arXiv.2309.06668 DOI:10.48550/arXiv.2309.06668]
#Hamaker2020 pmid=33186867
#Hernan2019 Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 32:1, 42-49, [https://doi.org/10.1080/09332480.2019.1579578 DOI:10.1080/09332480.2019.1579578]
#Hernan2018 pmid=29565659
#Shmueli2010 Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. [https://doi.org/10.1214/10-STS330 DOI:10.1214/10-STS330]
#Note1 Voorbeeld uit: Steyerberg, E. W., Moons, K. G. M., van der Windt, D. A., Hayden, J. A., Perel, P., Schroter, S., Riley, R. D., Hemingway, H., & Altman, D. G. (2013). Prognosis Research Strategy (PROGRESS) 3: Prognostic Model Research. PLOS Medicine, 10(2), e1001381. [https://doi.org/10.1371/journal.pmed.1001381 DOI:10.1371/journal.pmed.1001381]
#Westreich2013 Daniel Westreich, Sander Greenland, The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients, American Journal of Epidemiology, Volume 177, Issue 4, 15 February 2013, Pages 292–298, [https://doi.org/10.1093/aje/kws412 DOI:10.1093/aje/kws412]
#Chesnaye2021 pmid=35035932]
#Greenland1999 pmid=9888278
</biblio>

= Verder lezen =
De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s [[Herhaalde metingen | herhaalde metingen]] of [[mixed effects modellen]] je in dat geval verder.

{{onderschrift}}

Multivariabele regressie voorlopig

2025-04-23T11:36:01Z

M Wolvers:

Multivariabele regressie voorlopig

2025-04-23T11:22:38Z

M Wolvers: /* Referenties */

Multivariabele regressie voorlopig

2025-04-23T11:17:41Z

M Wolvers: /* Voorspellen */

Multivariabele regressie voorlopig

2025-04-23T11:10:37Z

M Wolvers: /* Waarvoor kun je multivariabele regressie gebruiken? */

Multivariabele regressie voorlopig

2025-04-23T10:56:57Z

M Wolvers:

Multivariabele regressie voorlopig

2025-04-23T10:23:17Z

M Wolvers: /* Beschrijven */

Multivariabele regressie voorlopig

2025-04-09T08:56:18Z

M Wolvers: Created page with "{{auteurs| |mainauthor= dr. M.D.J. Wolvers |coauthor= Jeroen Hoogland }} =Wat is multivariabele regressie? = Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de famil..."

Friedman toets

2024-12-11T16:07:15Z

M Wolvers: /* Waar vind ik de Friedman-toets in SPSS? */

{{auteurs|
|mainauthor= [[user:Nan van Geloven|ir. N. van Geloven]]
|coauthor=
}}
De Friedman toets is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen meer dan twee [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]] groepen.

== Wanneer gebruik ik de Friedman-toets? ==

Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-)continue variabele verschillen, kun je de Friedman toets gebruiken. Bijvoorbeeld als je wilt testen of de resultaten van 4 herhaalde metingen van een patiënt van elkaar verschillen.

Het is een eenvoudige toets voor het analyseren van [[herhaalde metingen]], en vormt daarmee een goed alternatief voor bijvoorbeeld een [[Herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]] of [[Herhaalde metingen#linear mixed model|linear mixed model]] analyse.

Voorbeeld van het gebruik van de Friedman-toets:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
! colspan="6" align="left"|Table 2. Procedural characteristics
|-
|align="left" |Variable*
|align="center"|measurement 1
|align="center"|measurement 2
|align="center"|measurement 3
|align="center"|measurement 4
|align="center"|p-value**
|-
|glucose
|align="center" | 5.0 [4.7;5.7]
|align="center" | 5.2 [4.4;5.8]
|align="center" | 4.9 [4.5;5.4]
|align="center" | 5.4 [4.9;5.8]
|align="center" | 0.56

|-
|colspan="6" rowspan="2"| *Variables are denoted as median [min;max]. **Group differences were tested with the Friedman test.
|}

== Hoe analyseer ik mijn patiënten waarbij ik op 12 tijdspunten glucosewaarden heb gemeten? ==

''Voor een kleine studie hebben we op 12 tijdspunten glucosewaarden afgenomen bij 9 patiënten die we nu willen analyseren. Ik probeer dit te doen met de GLM - repeated measurements-procedure in SPSS (repeated measurements ANOVA). Is dit juist en zo niet: welke test is de meeste geschikte?

Als je alleen geïnteresseerd bent in of de glucosewaarden verschillen over de tijdstippen, is de GLM-aanpak niet noodzakelijk. Mede gezien het kleine aantal patiënten zou je bijvoorbeeld ook een Friedman-toets kunnen doen. Dit is een niet-parametrische test die (net als bijvoorbeeld de Mann-Whitney U-test) gebaseerd is op de ranks van de data. Ik citeer uit de help-functie van SPSS:

"The nonparametric tests for multiple related samples are useful alternatives to a repeated measures analysis of variance. They are especially appropriate for small samples and can be used with nominal or ordinal test variables."

De test kijkt of de glucosewaarden op de verschillende tijdstippen significant van elkaar verschillen (dus niet uit dezelfde verdeling komen). De test zegt niets over waar de verschillen zitten en ook niet over of de waardes stijgen of dalen in de tijd.

== Waar vind ik de Friedman-toets in SPSS?==

Je vindt deze test onder Analyze -> Nonparametric Tests -> Legacy Dialogs -> K Related Samples. De data in de SPSS datafile moet per patiënt gegroepeerd staan, als volgt:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
|patiënt
|gluc1
|gluc2
|gluc3
|....
|gluc12
|-
|1
| 4.5
| 4.7
| 4.6
| ...
| 4.4
|-
|2
| 4.9
| 4.6
| 5.2
| ...
| 4.6
|-
|}

Je kunt de test ook vinden via Analyze -> Nonparametric Tests -> Related Samples. Het voordeel van deze aanvliegroute is dat SPSS hier ook een posthoc-analyse aanbiedt waarbij je bij een bemerkt verschil in de overall Friedman-test kunt inzoomen naar tussen welke metingen (groepen) de verschillen optreden. Daar hanteert SPSS de Dunn-Bonferroni-aanpassing voor [[multiple testing]]. Meer uitleg vind je [https://www.sheffield.ac.uk/media/35112/download?attachment hier].

== De Friedman-toets werkt niet bij ontbrekende data. Wat nu? ==
Het is meestal niet aan te raden om de Friedman-toets te gebruiken als een deel van de data ontbreken. Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-) continue variabele verschillen en er sprake is van ontbrekende waarden, kun je de Skillings–Mack-toets gebruiken <cite> [Chatfield2009] </cite>. Voorwaarde is wel dat de data met behulp van een incomplete block design zijn verzameld of [[Missing_values | missing completely at random]] zijn. Je kunt de waarde van de Skillings–Mack-toets berekenen met de ''skilmack'' command in Stata en de ''Skillings.Mack'' package in R. Deze toets is vooralsnog niet geïmplementeerd in SPSS (versies 28 en lager).

== Referenties ==
<biblio>
#Chatfield2009 Chatfield M, Mander A. [http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2761045/ The Skillings–Mack test (Friedman test when there are missing data) ]. ''Stata J''. 2009 April 1; 9(2): 299–305.
</biblio>

<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.

Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
<div>

Friedman toets

2024-12-11T16:06:52Z

M Wolvers: Undo revision 3744 by M Wolvers (talk)

{{auteurs|
|mainauthor= [[user:Nan van Geloven|ir. N. van Geloven]]
|coauthor=
}}
De Friedman toets is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen meer dan twee [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]] groepen.

== Wanneer gebruik ik de Friedman-toets? ==

Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-)continue variabele verschillen, kun je de Friedman toets gebruiken. Bijvoorbeeld als je wilt testen of de resultaten van 4 herhaalde metingen van een patiënt van elkaar verschillen.

Het is een eenvoudige toets voor het analyseren van [[herhaalde metingen]], en vormt daarmee een goed alternatief voor bijvoorbeeld een [[Herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]] of [[Herhaalde metingen#linear mixed model|linear mixed model]] analyse.

Voorbeeld van het gebruik van de Friedman-toets:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
! colspan="6" align="left"|Table 2. Procedural characteristics
|-
|align="left" |Variable*
|align="center"|measurement 1
|align="center"|measurement 2
|align="center"|measurement 3
|align="center"|measurement 4
|align="center"|p-value**
|-
|glucose
|align="center" | 5.0 [4.7;5.7]
|align="center" | 5.2 [4.4;5.8]
|align="center" | 4.9 [4.5;5.4]
|align="center" | 5.4 [4.9;5.8]
|align="center" | 0.56

|-
|colspan="6" rowspan="2"| *Variables are denoted as median [min;max]. **Group differences were tested with the Friedman test.
|}

== Hoe analyseer ik mijn patiënten waarbij ik op 12 tijdspunten glucosewaarden heb gemeten? ==

''Voor een kleine studie hebben we op 12 tijdspunten glucosewaarden afgenomen bij 9 patiënten die we nu willen analyseren. Ik probeer dit te doen met de GLM - repeated measurements-procedure in SPSS (repeated measurements ANOVA). Is dit juist en zo niet: welke test is de meeste geschikte?

Als je alleen geïnteresseerd bent in of de glucosewaarden verschillen over de tijdstippen, is de GLM-aanpak niet noodzakelijk. Mede gezien het kleine aantal patiënten zou je bijvoorbeeld ook een Friedman-toets kunnen doen. Dit is een niet-parametrische test die (net als bijvoorbeeld de Mann-Whitney U-test) gebaseerd is op de ranks van de data. Ik citeer uit de help-functie van SPSS:

"The nonparametric tests for multiple related samples are useful alternatives to a repeated measures analysis of variance. They are especially appropriate for small samples and can be used with nominal or ordinal test variables."

De test kijkt of de glucosewaarden op de verschillende tijdstippen significant van elkaar verschillen (dus niet uit dezelfde verdeling komen). De test zegt niets over waar de verschillen zitten en ook niet over of de waardes stijgen of dalen in de tijd.

== Waar vind ik de Friedman-toets in SPSS?==

Je vindt deze test onder Analyze -> Nonparametric Tests -> Legacy Dialogs -> K Related Samples. De data in de SPSS datafile moet per patiënt gegroepeerd staan, als volgt:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
|patiënt
|gluc1
|gluc2
|gluc3
|....
|gluc12
|-
|1
| 4.5
| 4.7
| 4.6
| ...
| 4.4
|-
|2
| 4.9
| 4.6
| 5.2
| ...
| 4.6
|-
|}

Je kunt de test ook vinden via Analyze -> Nonparametric Tests -> Related Samples. Het voordeel van deze aanvliegroute is dat SPSS hier ook een posthoc-analyse aanbiedt waarbij je bij een bemerkt verschil in de overall Friedman-test kunt inzoomen naar tussen welke metingen (groepen) de verschillen optreden. Daar hanteert SPSS de Dunn-Bonferroni-aanpassing voor [[multiple testing]]. Meer uitleg vind je [https://www.sheffield.ac.uk/polopoly_fs/1.714575!/file/stcp-marshall-FriedmanS.pdf hier].

== De Friedman-toets werkt niet bij ontbrekende data. Wat nu? ==
Het is meestal niet aan te raden om de Friedman-toets te gebruiken als een deel van de data ontbreken. Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-) continue variabele verschillen en er sprake is van ontbrekende waarden, kun je de Skillings–Mack-toets gebruiken <cite> [Chatfield2009] </cite>. Voorwaarde is wel dat de data met behulp van een incomplete block design zijn verzameld of [[Missing_values | missing completely at random]] zijn. Je kunt de waarde van de Skillings–Mack-toets berekenen met de ''skilmack'' command in Stata en de ''Skillings.Mack'' package in R. Deze toets is vooralsnog niet geïmplementeerd in SPSS (versies 28 en lager).

== Referenties ==
<biblio>
#Chatfield2009 Chatfield M, Mander A. [http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2761045/ The Skillings–Mack test (Friedman test when there are missing data) ]. ''Stata J''. 2009 April 1; 9(2): 299–305.
</biblio>

<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.

Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
<div>

Friedman toets

2024-12-11T16:02:08Z

M Wolvers: /* Waar vind ik de Friedman-toets in SPSS? */ broken link verwijderd

{{auteurs|
|mainauthor= [[user:Nan van Geloven|ir. N. van Geloven]]
|coauthor=
}}
De Friedman toets is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen meer dan twee [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]] groepen.

== Wanneer gebruik ik de Friedman-toets? ==

Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-)continue variabele verschillen, kun je de Friedman toets gebruiken. Bijvoorbeeld als je wilt testen of de resultaten van 4 herhaalde metingen van een patiënt van elkaar verschillen.

Het is een eenvoudige toets voor het analyseren van [[herhaalde metingen]], en vormt daarmee een goed alternatief voor bijvoorbeeld een [[Herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]] of [[Herhaalde metingen#linear mixed model|linear mixed model]] analyse.

Voorbeeld van het gebruik van de Friedman-toets:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
! colspan="6" align="left"|Table 2. Procedural characteristics
|-
|align="left" |Variable*
|align="center"|measurement 1
|align="center"|measurement 2
|align="center"|measurement 3
|align="center"|measurement 4
|align="center"|p-value**
|-
|glucose
|align="center" | 5.0 [4.7;5.7]
|align="center" | 5.2 [4.4;5.8]
|align="center" | 4.9 [4.5;5.4]
|align="center" | 5.4 [4.9;5.8]
|align="center" | 0.56

|-
|colspan="6" rowspan="2"| *Variables are denoted as median [min;max]. **Group differences were tested with the Friedman test.
|}

== Hoe analyseer ik mijn patiënten waarbij ik op 12 tijdspunten glucosewaarden heb gemeten? ==

''Voor een kleine studie hebben we op 12 tijdspunten glucosewaarden afgenomen bij 9 patiënten die we nu willen analyseren. Ik probeer dit te doen met de GLM - repeated measurements-procedure in SPSS (repeated measurements ANOVA). Is dit juist en zo niet: welke test is de meeste geschikte?

Als je alleen geïnteresseerd bent in of de glucosewaarden verschillen over de tijdstippen, is de GLM-aanpak niet noodzakelijk. Mede gezien het kleine aantal patiënten zou je bijvoorbeeld ook een Friedman-toets kunnen doen. Dit is een niet-parametrische test die (net als bijvoorbeeld de Mann-Whitney U-test) gebaseerd is op de ranks van de data. Ik citeer uit de help-functie van SPSS:

"The nonparametric tests for multiple related samples are useful alternatives to a repeated measures analysis of variance. They are especially appropriate for small samples and can be used with nominal or ordinal test variables."

De test kijkt of de glucosewaarden op de verschillende tijdstippen significant van elkaar verschillen (dus niet uit dezelfde verdeling komen). De test zegt niets over waar de verschillen zitten en ook niet over of de waardes stijgen of dalen in de tijd.

== Waar vind ik de Friedman-toets in SPSS?==

Je vindt deze test onder Analyze -> Nonparametric Tests -> Legacy Dialogs -> K Related Samples. De data in de SPSS datafile moet per patiënt gegroepeerd staan, als volgt:

{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
|patiënt
|gluc1
|gluc2
|gluc3
|....
|gluc12
|-
|1
| 4.5
| 4.7
| 4.6
| ...
| 4.4
|-
|2
| 4.9
| 4.6
| 5.2
| ...
| 4.6
|-
|}

Je kunt de test ook vinden via Analyze -> Nonparametric Tests -> Related Samples. Het voordeel van deze aanvliegroute is dat SPSS hier ook een posthoc-analyse aanbiedt waarbij je bij een bemerkt verschil in de overall Friedman-test kunt inzoomen naar tussen welke metingen (groepen) de verschillen optreden. Daar hanteert SPSS de Dunn-Bonferroni-aanpassing voor [[multiple testing]].

== De Friedman-toets werkt niet bij ontbrekende data. Wat nu? ==
Het is meestal niet aan te raden om de Friedman-toets te gebruiken als een deel van de data ontbreken. Als je wilt toetsen of de waardes van een meer dan twee maal gemeten, gepaarde, (semi-) continue variabele verschillen en er sprake is van ontbrekende waarden, kun je de Skillings–Mack-toets gebruiken <cite> [Chatfield2009] </cite>. Voorwaarde is wel dat de data met behulp van een incomplete block design zijn verzameld of [[Missing_values | missing completely at random]] zijn. Je kunt de waarde van de Skillings–Mack-toets berekenen met de ''skilmack'' command in Stata en de ''Skillings.Mack'' package in R. Deze toets is vooralsnog niet geïmplementeerd in SPSS (versies 28 en lager).

== Referenties ==
<biblio>
#Chatfield2009 Chatfield M, Mander A. [http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2761045/ The Skillings–Mack test (Friedman test when there are missing data) ]. ''Stata J''. 2009 April 1; 9(2): 299–305.
</biblio>

<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.

Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
<div>

Betrouwbaarheidsinterval

2024-12-11T15:19:35Z

M Wolvers: /* Mogelijk ook interessant op deze wiki */

{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]
|coauthor=
}}
Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt. Formeel zegt het interval iets over welke waardes verwacht worden als een experiment meerdere keren herhaald zou worden. Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.

==Wanneer gebruik ik een betrouwbaarheidsinterval?==
Je kunt een betrouwbaarheidsinterval gebruiken bij iedere schatting die je maakt. Bijvoorbeeld: als ik van een groep patienten het gemiddelde gewicht gemeten heb, dan kan ik het gemiddelde gewicht van de hele patientpopulatie schatten middels door het gemiddelde van mijn steekproef te nemen en de zekerheid van deze schatting aangeven met een betrouwbaarheidsinterval.

Vaak wordt er in het medisch onderzoek een betrouwbaarheidsinterval gegeven rondom de schatting van een bepaald effect (of een bepaald verschil tussen groepen). Bijvoorbeeld: "women receiving treatment were less likely to report severe pain (risk ratio 0.41, 95% confidence interval 0.32 to 0.55)".

==Welke betrouwbaarheidsintervallen horen er bij de toetsen die ik gedaan heb?==
''In mijn onderzoek voer ik een Chi-square test, Mann-Whitney test en een Kaplan-Meier analyse uit om twee groepen met elkaar te vergelijken. In de eerste versie van mijn artikel had ik de p-waarden gerapporteerd. Omdat we slechts een beperkt aantal deelnemers hebben stelde één van mijn co-auteurs voor om ipv de p-waarde het 95%-betrouwbaarheidsinterval te rapporteren. Naar mijn idee kan ik dit interval bij bovengenoemde testen in SPSS echter niet uit de analyses krijgen. Klopt dit? Hebben jullie ideeën over hoe ik de intervallen wel kan verkrijgen?

Een 95% betrouwbaarheidsinterval kun je berekenen rondom een ‘[[effect maten|effect maat]]’. Voor ieder van de genoemde vergelijkingen zou je dan moeten gaan kiezen welke effectmaat je wilt rapporteren en daarbij het betrouwbaarheidsinterval uitrekenen.

- Bij een [[Chi-kwadraat toets]] (het vergelijken van proporties) kun je denken aan een [[Associatiematen_2x2_tabel|risk difference, risk ratio of odds ratio]]. De laatste 2 kun je inclusief betrouwbaarheidsinterval opvragen in de crosstabs procedure van SPSS (vink ‘risk’ aan, let wel goed op welke groep als referentie gekozen wordt). Een risk difference wordt volgens mij niet aangeboden in de crosstabs procedure. Je zou die bijv kunnen verkrijgen via de ‘two by two table’ calculator op de [http://www.openepi.com OpenEpi website] .

- bij een [[Mann-Whitney U toets]] kun je denken aan het rapporteren van de betrouwbaarheidsintervallen rondom de twee medianen van beide groepen en een geschat verschil tussen de medianen + betrouwbaarheidsinterval. Volgens mij geeft SPSS voor die laatste geen optie.

- [[Survival analyse|Kaplan Meier analyse]]: indien je daar alleen een (of meerdere) survival curves mee plot, dan ligt het voor de hand dat je een 95% betrouwbaarheidsinterval rondom het geschatte survival (of event) percentage rapporteert. SPSS geeft dat voor bijv mean en median survival (indien deze beide berekend kunnen worden). Voor de curve zelf geeft SPSS niet een betrouwbaarheidsinterval. Dit zou je eventueel kunnen berekenen met [[Statistische software#R|R]], functie survfit. Wellicht ben je meer geintersseerd in een schatting van het verschil in termen van ratio tussen 2 curves op een bepaald punt. Dat zou je eventueel zelf mbv de standaard errors die SPSS geeft + een delta methode aanpassing kunnen berekenen.

==Hoe bereken ik het betrouwbaarheidsinterval rondom een relatief risico behorend bij een gepaarde (McNemar) vergelijking?==

''Onze gematchte dichotome uitkomstmaat hebben we vergeleken met gepaarde testen ([[McNemar toets]]), waar een aantal hele mooie p-waarden uitkomen. Om deze bevindingen echter nog iets meer kracht bij te zetten, zouden we hier ook graag een [[Associatiematen_2x2_tabel#Relatief_risico|relatief risico]] met betrouwbaarheidsinterval bij weer willen geven. Als je echter op de 'gewone' manier deze relatieve risico's berekent, past de conclusie over significantie op basis van het betrouwbaarheidsinterval niet altijd bij de p-waarde uit de McNemar toets. Zo kan het betrouwbaarheidsinterval de 1 bevatten, maar wel een P van <0.05 of andersom. Dit verschil is waarschijnlijk te verklaren doordat dit relatief risico met betrouwbaarheidsinterval geen rekening houdt met het feit dat het om gepaarde data gaat. Mijn vraag is dan ook of er een mogelijkheid is om het relatieve risico met betrouwbaarheidsinterval over gepaarde data te berekenen, zodanig dat we zowel dit betrouwbaarheidsinterval als de p-waarde uit de McNemar-toets samen in een tabel weer kunnen geven.

Na een kleine zoektocht kom ik hiervoor op de volgende [http://www.ncbi.nlm.nih.gov/pubmed/16345058 methode van Bonett en Price].
Op deze [https://www.researchgate.net/publication/305073462_Excel_spreadsheet_to_calculate_Bonett-Price_confidence_interval_for_a_ratio_of_paired_proportions_or_of_sizes_of_overlapping_groups website] staat een uitwerking hiervan in de vorm van een Excel-calculator aangeboden. Let erop dat er in de calculator van de volgende datastructuur wordt uitgegaan:
{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
|
|
|colspan="2" align="center"|Cases (of gepaarde groep 1)
|-
|align="left" |
|align="center"|
|width="120" align="center"|positief
|width="120" align="center"|negatief
|-
|rowspan="2" align="center"|Controls (of gepaarde groep 2)
|align="center" | positief
|align="center" | a
|align="center" | b
|-
|align="center" | negatief
|align="center" | c
|align="center" | d
|-
|}

==Hoe bereken ik een betrouwbaarheidsinterval behorend bij een verschil tussen twee medianen?==

''Achtergrond: we verrichten een randomized cross-over studie waarbij twee interventies worden vergeleken. Bij normaal verdeelde data geef ik per interventie:

''Mean + SD, + een paired difference, een SD van de paired difference, en een 95%CI van de paired difference

''Een aantal (secondaire) uitkomstmaten zijn niet normaal verdeeld. Ik geef hierbij nu per interventie:

''Median + IQR, + paired difference en een IQR van de paired difference.

''Ik zou graag tevens een betrouwbaarheidsinterval geven van deze niet normaal verdeelde data. Is dat mogelijk?

Ja dat kan. Ik begrijp dat je een betrouwbaarheidsinterval wilt berekenen bij het gepaarde verschil. Je zou hiervoor de Hodges-Lehmann procedure kunnen gebruiken. In [[statistische_software#SPSS|SPSS]] 28 kun je een dergelijk betrouwbaarheidsinterval opvragen onder Analyze -> Nonparametric Tests -> Related Samples.

Let wel op welk verschil je precies schat. Déze Hodges-Lehmann procedure schat het mediane verschil (= de mediaan van alle gepaarde verschillen). Dit is niet hetzelfde als het verschil tussen de twee medianen per interventiegroep.

==Mogelijk ook interessant op deze wiki==
[[Proporties#Hoe_bepaal_ik_een_betrouwbaarheidsinterval_voor_een_proportie_in_SPSS? | Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie?]]

[[Associatiematen_2x2_tabel#Hoe_kan_ik_in_SPSS_het_betrouwbaarheidsinterval_van_een_odds_ratio_krijgen_als_ik_enkel_een_kruistabel_heb? | Hoe bereken ik het betrouwbaarheidsinterval van een odds ratio?]]

==Referenties ==

*Douglas G. Altman, David Machin, Trevor N. Bryant, Martin J. Gardner, Statistics with confidence, BMJ books.
*[http://www.bmj.com/cgi/reprint/331/7521/903 Douglas G. Altman, J Martin Bland, Statistical Notes, Standard deviations and standard errors, BMJ 2005;331:903]
*[http://www.openepi.com OpenEpi] Dean AG, Sullivan KM, Soe MM. OpenEpi: Open Source Epidemiologic Statistics for Public Health, Version 2.3.1. www.OpenEpi.com, updated 2011/23/06, accessed 2011/11/28.
*[http://www.ncbi.nlm.nih.gov/pubmed/16345058 Bonett DG, Price RM. Confidence intervals for a ratio of binomial proportions based on paired data. Stat Med. 2006 Sep 15;25(17):3039-47.]

{{onderschrift}}

Betrouwbaarheidsinterval

2024-12-11T15:17:47Z

M Wolvers: /* Hoe bereken ik een betrouwbaarheidsinterval behorend bij een verschil tussen twee medianen? */

{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]
|coauthor=
}}
Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt. Formeel zegt het interval iets over welke waardes verwacht worden als een experiment meerdere keren herhaald zou worden. Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.

==Wanneer gebruik ik een betrouwbaarheidsinterval?==
Je kunt een betrouwbaarheidsinterval gebruiken bij iedere schatting die je maakt. Bijvoorbeeld: als ik van een groep patienten het gemiddelde gewicht gemeten heb, dan kan ik het gemiddelde gewicht van de hele patientpopulatie schatten middels door het gemiddelde van mijn steekproef te nemen en de zekerheid van deze schatting aangeven met een betrouwbaarheidsinterval.

Vaak wordt er in het medisch onderzoek een betrouwbaarheidsinterval gegeven rondom de schatting van een bepaald effect (of een bepaald verschil tussen groepen). Bijvoorbeeld: "women receiving treatment were less likely to report severe pain (risk ratio 0.41, 95% confidence interval 0.32 to 0.55)".

==Welke betrouwbaarheidsintervallen horen er bij de toetsen die ik gedaan heb?==
''In mijn onderzoek voer ik een Chi-square test, Mann-Whitney test en een Kaplan-Meier analyse uit om twee groepen met elkaar te vergelijken. In de eerste versie van mijn artikel had ik de p-waarden gerapporteerd. Omdat we slechts een beperkt aantal deelnemers hebben stelde één van mijn co-auteurs voor om ipv de p-waarde het 95%-betrouwbaarheidsinterval te rapporteren. Naar mijn idee kan ik dit interval bij bovengenoemde testen in SPSS echter niet uit de analyses krijgen. Klopt dit? Hebben jullie ideeën over hoe ik de intervallen wel kan verkrijgen?

Een 95% betrouwbaarheidsinterval kun je berekenen rondom een ‘[[effect maten|effect maat]]’. Voor ieder van de genoemde vergelijkingen zou je dan moeten gaan kiezen welke effectmaat je wilt rapporteren en daarbij het betrouwbaarheidsinterval uitrekenen.

- Bij een [[Chi-kwadraat toets]] (het vergelijken van proporties) kun je denken aan een [[Associatiematen_2x2_tabel|risk difference, risk ratio of odds ratio]]. De laatste 2 kun je inclusief betrouwbaarheidsinterval opvragen in de crosstabs procedure van SPSS (vink ‘risk’ aan, let wel goed op welke groep als referentie gekozen wordt). Een risk difference wordt volgens mij niet aangeboden in de crosstabs procedure. Je zou die bijv kunnen verkrijgen via de ‘two by two table’ calculator op de [http://www.openepi.com OpenEpi website] .

- bij een [[Mann-Whitney U toets]] kun je denken aan het rapporteren van de betrouwbaarheidsintervallen rondom de twee medianen van beide groepen en een geschat verschil tussen de medianen + betrouwbaarheidsinterval. Volgens mij geeft SPSS voor die laatste geen optie.

- [[Survival analyse|Kaplan Meier analyse]]: indien je daar alleen een (of meerdere) survival curves mee plot, dan ligt het voor de hand dat je een 95% betrouwbaarheidsinterval rondom het geschatte survival (of event) percentage rapporteert. SPSS geeft dat voor bijv mean en median survival (indien deze beide berekend kunnen worden). Voor de curve zelf geeft SPSS niet een betrouwbaarheidsinterval. Dit zou je eventueel kunnen berekenen met [[Statistische software#R|R]], functie survfit. Wellicht ben je meer geintersseerd in een schatting van het verschil in termen van ratio tussen 2 curves op een bepaald punt. Dat zou je eventueel zelf mbv de standaard errors die SPSS geeft + een delta methode aanpassing kunnen berekenen.

==Hoe bereken ik het betrouwbaarheidsinterval rondom een relatief risico behorend bij een gepaarde (McNemar) vergelijking?==

''Onze gematchte dichotome uitkomstmaat hebben we vergeleken met gepaarde testen ([[McNemar toets]]), waar een aantal hele mooie p-waarden uitkomen. Om deze bevindingen echter nog iets meer kracht bij te zetten, zouden we hier ook graag een [[Associatiematen_2x2_tabel#Relatief_risico|relatief risico]] met betrouwbaarheidsinterval bij weer willen geven. Als je echter op de 'gewone' manier deze relatieve risico's berekent, past de conclusie over significantie op basis van het betrouwbaarheidsinterval niet altijd bij de p-waarde uit de McNemar toets. Zo kan het betrouwbaarheidsinterval de 1 bevatten, maar wel een P van <0.05 of andersom. Dit verschil is waarschijnlijk te verklaren doordat dit relatief risico met betrouwbaarheidsinterval geen rekening houdt met het feit dat het om gepaarde data gaat. Mijn vraag is dan ook of er een mogelijkheid is om het relatieve risico met betrouwbaarheidsinterval over gepaarde data te berekenen, zodanig dat we zowel dit betrouwbaarheidsinterval als de p-waarde uit de McNemar-toets samen in een tabel weer kunnen geven.

Na een kleine zoektocht kom ik hiervoor op de volgende [http://www.ncbi.nlm.nih.gov/pubmed/16345058 methode van Bonett en Price].
Op deze [https://www.researchgate.net/publication/305073462_Excel_spreadsheet_to_calculate_Bonett-Price_confidence_interval_for_a_ratio_of_paired_proportions_or_of_sizes_of_overlapping_groups website] staat een uitwerking hiervan in de vorm van een Excel-calculator aangeboden. Let erop dat er in de calculator van de volgende datastructuur wordt uitgegaan:
{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
|
|
|colspan="2" align="center"|Cases (of gepaarde groep 1)
|-
|align="left" |
|align="center"|
|width="120" align="center"|positief
|width="120" align="center"|negatief
|-
|rowspan="2" align="center"|Controls (of gepaarde groep 2)
|align="center" | positief
|align="center" | a
|align="center" | b
|-
|align="center" | negatief
|align="center" | c
|align="center" | d
|-
|}

==Hoe bereken ik een betrouwbaarheidsinterval behorend bij een verschil tussen twee medianen?==

''Achtergrond: we verrichten een randomized cross-over studie waarbij twee interventies worden vergeleken. Bij normaal verdeelde data geef ik per interventie:

''Mean + SD, + een paired difference, een SD van de paired difference, en een 95%CI van de paired difference

''Een aantal (secondaire) uitkomstmaten zijn niet normaal verdeeld. Ik geef hierbij nu per interventie:

''Median + IQR, + paired difference en een IQR van de paired difference.

''Ik zou graag tevens een betrouwbaarheidsinterval geven van deze niet normaal verdeelde data. Is dat mogelijk?

Ja dat kan. Ik begrijp dat je een betrouwbaarheidsinterval wilt berekenen bij het gepaarde verschil. Je zou hiervoor de Hodges-Lehmann procedure kunnen gebruiken. In [[statistische_software#SPSS|SPSS]] 28 kun je een dergelijk betrouwbaarheidsinterval opvragen onder Analyze -> Nonparametric Tests -> Related Samples.

Let wel op welk verschil je precies schat. Déze Hodges-Lehmann procedure schat het mediane verschil (= de mediaan van alle gepaarde verschillen). Dit is niet hetzelfde als het verschil tussen de twee medianen per interventiegroep.

==Mogelijk ook interessant op deze wiki==
[[Proporties#Hoe_bepaal_ik_een_betrouwbaarheidsinterval_voor_een_proportie_in_SPSS? | Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie?]]

==Referenties ==

*Douglas G. Altman, David Machin, Trevor N. Bryant, Martin J. Gardner, Statistics with confidence, BMJ books.
*[http://www.bmj.com/cgi/reprint/331/7521/903 Douglas G. Altman, J Martin Bland, Statistical Notes, Standard deviations and standard errors, BMJ 2005;331:903]
*[http://www.openepi.com OpenEpi] Dean AG, Sullivan KM, Soe MM. OpenEpi: Open Source Epidemiologic Statistics for Public Health, Version 2.3.1. www.OpenEpi.com, updated 2011/23/06, accessed 2011/11/28.
*[http://www.ncbi.nlm.nih.gov/pubmed/16345058 Bonett DG, Price RM. Confidence intervals for a ratio of binomial proportions based on paired data. Stat Med. 2006 Sep 15;25(17):3039-47.]

{{onderschrift}}

Proporties

2024-12-11T15:06:57Z

M Wolvers: /* Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? */

''Aan dit onderwerp wordt nog gewerkt. [[meeschrijven|Bijdragen]] aan de wiki? Mail naar edsconsult@amsterdamumc.nl.''

= Proporties en percentages =

= Statistische tests voor proporties =

==Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie in SPSS? ==

In SPSS kun je heel simpel een betrouwbaarheidsinterval voor een proportie bepalen via Analyze -> Descriptives -> Proportion Confidence Intervals. Je hebt daar géén data file (.sav) voor nodig en vult direct de geobserveerde aantallen in. Je krijgt dan de betrouwbaarheidsinterval voor een binomiale verdeling (Jeffrey's betrouwbaarheidsinterval, in het R-pakket binom “Bayesian” genoemd).

Via syntax is deze functie nog rijker. Je kunt daarmee ook twee geobserveerde proporties vergelijken, bijvoorbeeld met de volgende SPSS-syntax:
PROPOR NUM=15 10 DENOM=450 500
/LEVEL ALPHA=.05.

De volgende SPSS-syntax laat alle mogelijkheden zien van de functie PROPOR inclusief voorbeelden:
PROPOR
/HELP.

==Ik wil graag een ander type betrouwbaarheidsinterval rapporteren. Hoe kan ik die berekenen? ==

Met het [https://cran.r-project.org/web/packages/binom/binom.pdf binom]-package in R kun je veel verschillende typen betrouwbaarheidsintervallen bepalen.

Mocht je nog geen/weinig ervaring hebben met R, dan helpt deze R-code je waarschijnlijk afdoende op weg:

install.packages(“binom”)
require(binom)
X = 5 # teller; getal wijzigen in het aantal <successen/zieken/keer kop in een coin toss>
N = 45 # noemer; getal wijzigen in het aantal <patiënten die behandeld zijn/mensen die onderzocht zijn/keer dat een muntje is opgegooid>
binom.confint(X, N, conf.level = 0.95)
help(binom)

== Z-test voor proporties ==

De z-test voor proporties is een parametrische toets voor binaire/dichotome variabelen, waarmee je een geobserveerde proportie in jouw steekproef kunt vergelijken met/toetsen tegen een vooraf gespecificeerde proportie (de nulhypothese).

Voor extreme proporties (richting nul of één) of voor kleine steekproeven is deze test echter niet geschikt.

Proporties

2024-12-11T15:05:41Z

M Wolvers: /* Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? */

''Aan dit onderwerp wordt nog gewerkt. [[meeschrijven|Bijdragen]] aan de wiki? Mail naar edsconsult@amsterdamumc.nl.''

= Proporties en percentages =

= Statistische tests voor proporties =

==Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie in SPSS? ==

In SPSS kun je heel simpel een betrouwbaarheidsinterval voor een proportie bepalen via Analyze -> Descriptives -> Proportion Confidence Intervals. Je hebt daar géén data file (.sav) voor nodig en vult direct de geobserveerde aantallen in. Je krijgt dan de betrouwbaarheidsinterval voor een binomiale verdeling (Jeffrey's betrouwbaarheidsinterval, in het R-pakket binom “Bayesian” genoemd).

Via syntax is deze functie nog rijker. Je kunt daarmee ook twee geobserveerde proporties vergelijken, bijvoorbeeld met de volgende SPSS-syntax:
PROPOR NUM=15 10 DENOM=450 500
/LEVEL ALPHA=.05.

De volgende SPSS-syntax laat alle mogelijkheden zien van de functie PROPOR inclusief voorbeelden:
PROPOR
/HELP.

==Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? ==

Met het [https://cran.r-project.org/web/packages/binom/binom.pdf binom]-package in R kun je veel verschillende typen betrouwbaarheidsintervallen bepalen.

Mocht je nog geen/weinig ervaring hebben met R, dan helpt deze R-code je waarschijnlijk afdoende op weg:

install.packages(“binom”)
require(binom)
X = 5 # teller; getal wijzigen in het aantal <successen/zieken/keer kop in een coin toss>
N = 45 # noemer; getal wijzigen in het aantal <patiënten die behandeld zijn/mensen die onderzocht zijn/keer dat een muntje is opgegooid>
binom.confint(X, N, conf.level = 0.95)
help(binom)

== Z-test voor proporties ==

De z-test voor proporties is een parametrische toets voor binaire/dichotome variabelen, waarmee je een geobserveerde proportie in jouw steekproef kunt vergelijken met/toetsen tegen een vooraf gespecificeerde proportie (de nulhypothese).

Voor extreme proporties (richting nul of één) of voor kleine steekproeven is deze test echter niet geschikt.

Proporties

2024-12-11T15:04:12Z

M Wolvers: /* Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? */

''Aan dit onderwerp wordt nog gewerkt. [[meeschrijven|Bijdragen]] aan de wiki? Mail naar edsconsult@amsterdamumc.nl.''

= Proporties en percentages =

= Statistische tests voor proporties =

==Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie in SPSS? ==

In SPSS kun je heel simpel een betrouwbaarheidsinterval voor een proportie bepalen via Analyze -> Descriptives -> Proportion Confidence Intervals. Je hebt daar géén data file (.sav) voor nodig en vult direct de geobserveerde aantallen in. Je krijgt dan de betrouwbaarheidsinterval voor een binomiale verdeling (Jeffrey's betrouwbaarheidsinterval, in het R-pakket binom “Bayesian” genoemd).

Via syntax is deze functie nog rijker. Je kunt daarmee ook twee geobserveerde proporties vergelijken, bijvoorbeeld met de volgende SPSS-syntax:
PROPOR NUM=15 10 DENOM=450 500
/LEVEL ALPHA=.05.

De volgende SPSS-syntax laat alle mogelijkheden zien van de functie PROPOR inclusief voorbeelden:
PROPOR
/HELP.

==Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? ==

Met het binom-package in R kun je veel verschillende typen betrouwbaarheidsintervallen bepalen.

Mocht je nog geen/weinig ervaring hebben met R, dan helpt deze R-code je waarschijnlijk afdoende op weg:

install.packages(“binom”)
require(binom)
X = 5 # teller; getal wijzigen in het aantal <successen/zieken/keer kop in een coin toss>
N = 45 # noemer; getal wijzigen in het aantal <patiënten die behandeld zijn/mensen die onderzocht zijn/keer dat een muntje is opgegooid>
binom.confint(X, N, conf.level = 0.95)
help(binom)

== Z-test voor proporties ==

De z-test voor proporties is een parametrische toets voor binaire/dichotome variabelen, waarmee je een geobserveerde proportie in jouw steekproef kunt vergelijken met/toetsen tegen een vooraf gespecificeerde proportie (de nulhypothese).

Voor extreme proporties (richting nul of één) of voor kleine steekproeven is deze test echter niet geschikt.

Proporties

2024-12-11T15:02:52Z

M Wolvers: /* Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie in SPSS? */

''Aan dit onderwerp wordt nog gewerkt. [[meeschrijven|Bijdragen]] aan de wiki? Mail naar edsconsult@amsterdamumc.nl.''

= Proporties en percentages =

= Statistische tests voor proporties =

==Hoe bepaal ik een betrouwbaarheidsinterval voor een proportie in SPSS? ==

In SPSS kun je heel simpel een betrouwbaarheidsinterval voor een proportie bepalen via Analyze -> Descriptives -> Proportion Confidence Intervals. Je hebt daar géén data file (.sav) voor nodig en vult direct de geobserveerde aantallen in. Je krijgt dan de betrouwbaarheidsinterval voor een binomiale verdeling (Jeffrey's betrouwbaarheidsinterval, in het R-pakket binom “Bayesian” genoemd).

Via syntax is deze functie nog rijker. Je kunt daarmee ook twee geobserveerde proporties vergelijken, bijvoorbeeld met de volgende SPSS-syntax:
PROPOR NUM=15 10 DENOM=450 500
/LEVEL ALPHA=.05.

De volgende SPSS-syntax laat alle mogelijkheden zien van de functie PROPOR inclusief voorbeelden:
PROPOR
/HELP.

==Ik heb in mijn analyseplan gespecificeerd een ander type betrouwbaarheidsinterval te rapporteren. Hoe kan ik die berekenen? ==

Met het binom-package in R kun je veel verschillende typen betrouwbaarheidsintervallen bepalen.

Mocht je nog geen/weinig ervaring hebben met R, dan helpt deze R-code je waarschijnlijk afdoende op weg:

install.packages(“binom”)
require(binom)
X = 5 # getal wijzigen in het aantal <successen/zieken/keer kop in een coin toss>
N = 45 # getal wijzigen in het aantal <patiënten die behandeld zijn/mensen die onderzocht zijn/keer dat een muntje is opgegooid>
binom.confint(X, N, conf.level = 0.95)
help(binom)

== Z-test voor proporties ==

De z-test voor proporties is een parametrische toets voor binaire/dichotome variabelen, waarmee je een geobserveerde proportie in jouw steekproef kunt vergelijken met/toetsen tegen een vooraf gespecificeerde proportie (de nulhypothese).

Voor extreme proporties (richting nul of één) of voor kleine steekproeven is deze test echter niet geschikt.

Proporties

2024-12-11T14:59:25Z

M Wolvers: /* Statistische tests voor proporties */

Associatiematen 2x2 tabel

2024-12-11T14:52:26Z

M Wolvers: /* Hoe kan ik in SPSS het betrouwbaarheidsinterval van een odds ratio krijgen als ik enkel een kruistabel heb? */

{{auteurs|
|mainauthor= [[user:Rob de Haan|prof. dr. R.J. de Haan]]
|coauthor= [[user:Michel Soete|M. Soete]]
}}

Een associatie tussen twee [[KEUZE_TOETS#Binaire_variabelen | dichotome/binaire variabelen]] kan worden weergegeven als een 2x2 kruistabel (''contingency table''). Er bestaan verschillende manieren om dergelijke associaties te kwantificeren.

==Relatief risico==
Het relatieve risico (RR), ook wel risk ratio genoemd, is een bekende associatiemaat voor variabelen met twee uitkomstcategorieën. De maat drukt de sterkte uit van het verband tussen een determinant en een uitkomst. De waarden van het RR liggen tussen 0 (maximale negatieve associatie) en +oneindig (maximale positieve associatie), terwijl bij het ontbreken van associatie het RR gelijk is aan 1.
Laten we ervan uitgaan dat we in een grootschalige, placebogecontroleerde klinische trial (n=4444) het effect willen onderzoek van langdurig statine gebruik op de reductie van sterfte. De onderzoekgroep wordt gevormd door patiënten die een myocard infarct hebben gehad of lijden aan angina pectoris. De trial laat de volgende resultaten zien.

<center>
<table>
<tr><td></td><td> wel sterfte</td><td>geen sterfte</td><td>totaal</td></tr>
<tr><td>statine </td><td>182 (a) </td><td>2039 (b)</td><td>2221 (a+b)</td></tr>
<tr><td>placebo </td><td>256 (c) </td><td>1967 (d)</td><td>2223 (c+d)</td></tr>
</table>
</center>

Het RR wordt berekend door:

(a/(a+b)) / (c/(c+d)) = (182/2221) / (256/2223) = 0.71

Men deelt dus de kans op het optreden van sterfte in de behandelgroep door de kans op het optreden van sterfte in de placebogroep. Anders geformuleerd; het RR drukt de verhouding uit tussen de sterfte incidentie onder patiënten die wel of niet behandeld zijn. RR < 1 betekent in dit voorbeeld een gunstig behandeleffect, een RR > 1 een ongunstig effect. Met andere woorden: statine reduceert de kans op sterfte met een factor 0,71. De associatie tussen behandeling en uitkomst blijkt ook significant te zijn: p < 0,001 ([[Chi-kwadraat toets]]).

==Relatieve risicoreductie==
Aan de hand van het bovenstaande voorbeeld kan ook de zogenaamde relatieve risicoreductie (RRR) worden berekend. De RRR wordt berekend door:

100% * (1 – RR) = 100% * (1 – 0,71) = 29%.

Met andere woorden: door de statine behandeling daalt het sterfterisico met 29%.

==Absolute risicoreductie==
Men kan de afname van sterfterisico ook uitdrukken in een absolute risicoreductie (ARR). Het sterftepercentage in de statine groep is (182/2221) = 8,2% en in de placebogroep (256/2223) = 11,5%. De ARR is dus 11,5% - 8,2 = 3,3%. Met andere woorden: door 100 patiënten te behandelen spaart met 3,3 levens.

==Number Needed to Treat==
De inverse van de ARR is de Number Needed to Treat (NNT). Deze maat geeft goed inzicht in de klinische relevantie van een therapeutisch effect. De NNT wordt als volgt berekend:
100% / ARR. In dit voorbeeld is de NNT dus 100% / 3,3 = 30. Met andere woorden: om 1 sterfgeval te voorkomen, moet men 30 patiënten met statine behandelen.

==Odds ratio==
De associatie tussen variabelen met twee uitkomstcategorieën kan ook uitgedrukt worden in een odds ratio (OR). De keuze tussen OR en RR is afhankelijk van het onderzoeksdesign. In het trialvoorbeeld van hiervoor is er sprake van een prospectieve studieopzet, die de mogelijkheid biedt om een absolute kans uit te rekenen op het optreden van een bepaalde uitkomst. In andere onderzoekssituaties, zoals in case-control onderzoek of retrospectief onderzoek, is het niet mogelijk deze absolute kans direct te berekenen worden, en moet een alternatieve associatiemaat worden gebruikt: de odds ratio (OR). De OR kan gezien worden als een schatter van het RR, waarbij het niet gaat om het berekenen van absolute kansen op de uitkomstvariabelen, maar om de relatieve kansen daarvan. Net als bij het RR liggen de waarden van de OR tussen 0 (maximale negatieve associatie) en +oneindig (maximale positieve associatie), terwijl bij het ontbreken van associatie de OR gelijk is aan 1.
Laten we ervan uitgaan dat we in een case-control studie de associatie willen onderzoeken tussen roken en het krijgen van een cardiovasculaire aandoening (voorbeeld ontleend aan “Inleiding in de toegepaste biostatistiek” van J.W.R Twisk, Elsevier Gezondheidszorg, Maarssen, 2007). Onder de cases met een cardiovasculaire aandoening (=147) bevinden zich 86 rokers (59%), in de controlegroep zonder cardiovasculaire aandoening (n=53) roken 14 personen (26%).

<center>
<table>
<tr><td></td><td> cardiov aandoening</td><td>geen cardiov aandoening</td></tr>
<tr><td>roken </td><td>86 (a) </td><td>14 (b)</td></tr>
<tr><td>niet roken </td><td>61 (c) </td><td>39 (d)</td></tr>
</table>
</center>

De OR wordt berekend door:

(a/b) / (c/d) = (86/14) / (61/39) = 3,9

Men deelt dus de verhouding van kansen. De verhoudingen a/b en c/d worden in het Engels ‘odds’ genoemd. In dit voorbeeld is a/b de verhouding tussen de kans op het wel en niet hebben van een cardiovasculaire aandoening onder rokers, en c/d de verhouding tussen de kans op het wel en niet hebben van een cardiovasculaire aandoening onder niet-rokers. De OR is dus een maat voor de risicoverhouding op ziekte bij aanwezigheid of afwezigheid van de determinant. OR < 1 betekent in dit voorbeeld een beschermend effect van de determinant op de uitkomst, een OR > 1 een schadelijk effect. Met andere woorden: de odds op het hebben van een cardiovasculaire aandoening voor rokers is 3,9 keer zo groot als de odds op het hebben van deze aandoening voor niet-rokers. Deze associatie blijkt ook significant te zijn: p < 0,001 ([[Chi-kwadraat toets]]).

Omdat de interpretatie van een odds nogal lastig is, wordt de OR vaak opgevat als een [[Associatiematen_2x2_tabel#Relatief risico|RR]], maar zij zijn niet hetzelfde. De OR is namelijk altijd een overschatting van het RR. Deze overschatting wordt groter naarmate de prevalentie van de uitkomstvariabele groter wordt.

De odds ratio wordt veel gebruikt bij [[logistische regressie]].

== Hoe kan ik in SPSS het betrouwbaarheidsinterval van een odds ratio krijgen als ik enkel een kruistabel heb? ==

De kruistabel geeft afdoende informatie en het is niet nodig om op basis van de kruistabel voor elk van de cases in die kruistabel (N) regels aan te maken, zoals je databestand in SPSS normaal geordend is. In plaats daarvan volstaat het om voor elk van de cellen in de kruistabel (4) een case of regel aan te maken in een nieuw databestand:

Je maakt dan (al dan niet aan de hand van syntax) eerst drie variabelen aan (kolommen in een SPSS-databestand): twee dichotome variabelen die respectievelijk de rij-variabele en de kolom-variabele van de kruistabel voorstellen, én een frequentievariabele. Vervolgens specificeer je 4 cases (rijen in een SPSS-databestand) die elk één van de cellen in je kruistabel voorstellen. Voor alle vier die cases (cellen) geef je door middel van de frequentie-variabele aan hoe vol ze zitten/hoeveel patiënten er aan dat patroon voldoen. De frequentie-variabele gebruik je als ‘gewicht’ in de analyse. Hier is een voorbeeld voor een Chi-kwadraat-test van [https://stackoverflow.com/questions/16823530/entering-contingency-table-in-spss Stack Overflow]:

DATA LIST FREE
/STATUS success freq.

BEGIN DATA
0 0 1544
0 1 14
1 0 17
1 1 7
END DATA.

WEIGHT BY freq.
VALUE LABELS status 0 'Amateur' 1 'Professional' / success 0 'Failure' 1 'Success'.
SET ONUMBERS LABELS.

CROSSTABS status BY success
/STATISTICS CHISQUARE.

Uiteraard kun je voor deze data ook een odds ratio bepalen door een univariabele logistische regressie uit te voeren (nog steeds mét weging voor de frequentie-variabele). Dat kan door de volgende syntax te runnen:

LOGISTIC REGRESSION VARIABLES success
/METHOD=ENTER status
/PRINT=CI(95).

==Hoe werkt de diagnostische odds ratio?==

De odds ratio, afgekort als OR, is een associatiemaat voor variabelen met twee uitkomstcategorieën. De odds ratio wordt in de geneeskunde vaak toegepast als risicomaat voor de associatie van een risicofactor met een ziektetoestand. Ook kan de odds ratio worden gebruikt bij het evalueren van [[diagnostisch onderzoek|diagnostische testen]], we spreken dan van de diagnostische odds ratio. De 2x2 tabel ziet er dan als volgt uit.

<center>
<table>
<tr><td></td><td>Wel ziekte</td><td>Geen ziekte</td><td>totaal</td></tr>
<tr><td>Positieve testuitslag</td><td>a</td><td>b</td><td>a+b</td></tr>
<tr><td>Negatieve testuitslag</td><td>c</td><td>d</td><td>c+d</td></tr>
<tr><td>totaal</td><td>a+c</td><td>b+d</td><td>a+b+c+d</td></tr>
</table>
</center>

a is dan het aantal van de 'waar-positieven' en die frequentie is, tenzij bij gebrek aan associatie, relatief gezien altijd hoger bij diegenen die een positieve testuitslag hebben dan bij de 'negatieven' a/(a+b)> c/(c+d) en hoger dan de prevalentie (a+c)/(a+b+c+d). 'Waar-positieven' zijn personen die (terecht) positief zijn omdat ze ook tevens ziek zijn. b is dan de frequentie van de 'vals-positieven', deze scoren positief op de test maar zijn niet ziek, c is het aantal 'vals-negatieven', d is het aantal 'waar-negatieven'. De diagnostische OR is hier het product der 'waren' (a*d) gedeeld door het product der 'valsen' (b*c):

:<math>OR = \frac{a/b}{c/d}=\frac{a*d}{b*c}.</math>

Is de OR van test A groter dan die van test B dan is test A diagnostisch beter dan test B.

De OR kan ook gebruikt worden om te oordelen of een test beantwoordt aan een mathematische eis voor een screening test. Volgens bepaalde auteurs zou de OR van een screeningtest gelijk aan of groter dan 100 moeten zijn.

== Hoe transformeer ik een OR van onder de 1 naar een OR boven de 1? ==

''In mijn onderzoek ben ik na een regressie analyse op een odds ratio en een CI van 0.65 en 0.43-0.97 respectivelijk uitgekomen. Nu zou ik deze willen omrekenen naar een odds/CI boven de 1. Kan dat en zo ja hoe?

Om de odds ratio "de andere kant op" te krijgen, moet je de referentie categorie van de variabele veranderen. Bijvoorbeeld: als mannen vs vrouwen, waarbij vrouwen je referentie (0) is, een OR <1 geeft, dan geeft vrouwen vs mannen, waarbij mannen je referentie (0) is, een OR>1. De resulterende OR is gelijk aan de reciproke (of inverse) van de OR (1/OR).

NB: Het heeft geen zin bij de [[Associatiematen_2x2_tabel#Hoe_werkt_de_diagnostische_odds_ratio.3F|diagnostische OR]] de inverse odds ratio te berekenen. De diagnostische OR is steeds groter dan 1. Dit volgt uit de bepaling van het begrip 'positief testresultaat'. Een positief testresultaat is een testresultaat dat relatief gezien meer bij personen voorkomt die aan de doelziekte (target disease) lijden dan bij personen die er niet aan lijden. a/(a +c) moet bij de diagnostische odds ratio dus altijd groter zijn dan c/(c+d).

== Kan ik een OR interpreteren als een RR? ==
''Ik heb altijd geleerd dat odds ratio's niet geïnterpreteerd mogen worden als risico's. In dit [http://www.ncbi.nlm.nih.gov/pubmed/24581683 artikel uit de Lancet], zoeken ze naar een verband tussen verpleging (aantal per patiënten / opleiding) en ziekenhuissterfte. Daar eindigen ze uiteindelijk met odds ratio's (1.068 en 0.929) waaruit ze concluderen dat het een stap ophogen van de ene een toename van 7% in mortaliteit oplevert en een toename van de andere een afname van mortaliteit oplevert van 7%. Waarom mag je hier de OR wel interpreteren als een risico waarde?

Je hebt gelijk, een OR van 1.068 betekent dat de odds op mortaliteit 7% hoger is en niet dat sec het risico op mortaliteet 7% hoger is. Echter, wanneer prevalentie laag is (weinig mortaliteit overall), dan zullen de OR en RR erg op elkaar gaan lijken en dan kan de OR ook gebruikt worden als een benadering voor de RR ([https://pubmed.ncbi.nlm.nih.gov/19414690/ Cummings 2009]).

== Aanvullende bronnen ==

*Een voorbeeld van het gebruik van de diagnostische odds ratio: [http://www.bmj.com/content/339/bmj.b3537?tab=responses M. Soete (2009). The odds ratio gives proof that the PSA-test does not meet the formal requirements for a screening test, rapid response, BMJ.]

*[http://thestatsgeek.com/2015/01/03/interpreting-odds-and-odds-ratios/ TheStatsGeek - Interpreting odds and odds ratios] Een heldere (engelstalige) uitleg over wat de odds betekent en waarom we deze zoveel gebruiken.

{{onderschrift}}

Associatiematen 2x2 tabel

2024-12-11T14:52:05Z

M Wolvers: /* Odds ratio */

Missing values

2024-12-09T09:18:44Z

M Wolvers: /* Hoe houden een mixed model en een GEE-analyse rekening met missende waarden? */

{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]
|coauthor=
}}

==Welke soorten missing values zijn er? ==

In het algemeen worden er drie typen missing values onderscheiden:
*MCAR-missing completely at random: Hierbij wordt aangenomen dat de missings totaal willekeurig zijn en er dus geen reden is om aan te nemen dat hoge dan wel lagere waardes vaker ontbreken dan andere waardes. Met andere woorden: het missing proces is onafhankelijk van de uitkomst en van alle andere geobserveerde dan wel niet geobserveerde patiëntkarakteristieken. Er is bijvoorbeeld sprake van MCAR wanneer er follow-up data mist vanwege het onbeschikbaar zijn van het meetapparaat op de dag dat de betreffende patiënt zijn follow-up visite had.
*MAR-missing at random: Hierbij wordt aangenomen dat de missings niet willekeurig zijn, maar af kunnen hangen van bijvoorbeeld het niveau van de vorige waarnemingen of van andere bekende (patiënt-)karakteristieken. Met andere woorden: het missing proces is afhankelijk van geobserveerde eerdere metingen of bekende patiëntkarakteristieken. Bijvoorbeeld wanneer patiënten met slechte uitkomst in de eerste follow up visites eerder geneigd zijn met de studie op te houden dan patiënten met goede uitkomst in eerdere visites.
*Informative dropout / missing not at random: Hierbij wordt aangenomen dat de missings niet willekeurig zijn en beïnvloed worden door processen die niet geobserveerd zijn. Met andere woorden: het missing proces is afhankelijk van (nog) niet geobserveerde metingen of onbekende patiëntkarakteristieken. Bijvoorbeeld in een diagnostische setting waarbij patiënten die na het uitvoeren van de index test spontaan opknappen niet meer op komen dagen voor het uitvoeren van de gouden standaard test en waarbij de uiteindelijke ziektestatus dus onbekend blijft.

==Kan een GLM missende waarden aan? ==

''Ik wil een general linear model (GLM) gebruiken op een database. Ik heb begrepen dat als je missing values hebt, je deze analyse niet kan uitvoeren en je daarom de data moet imputeren. Klopt dit?

Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patiënten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patiënten de data niet compleet zijn. Als dit een zeer klein deel is en de patiënten met missende waardes zijn naar verwachting volledig vergelijkbaar met patiënten zonder missende waarden (MCAR), kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een [[herhaalde metingen#linear mixed model| mixed model in geval van herhaalde metingen]]).

==Hoe houden een [[herhaalde metingen#linear mixed model| mixed model]] en een GEE-analyse rekening met missende waarden?==

''Ik heb vernomen dat een mixed model en een GEE-analyse al automatisch om kunnen gaan met missings/drop out. Welke methode wordt hier dan precies toegepast en wordt hierin dan ook ‘gecorrigeerd’ voor selectieve uitval (missings at random (MAR))?

Bij een verondersteld missing at random mechanisme, zeg je dat er -geobserveerde- variabelen zijn die voorspellend zijn voor het missend zijn. Indien deze variabelen toegevoegd zijn aan een mixed model / GEE, dan wordt er inderdaad rekening mee gehouden. Het is dus wel van belang dat de betreffende variabelen in het model zijn opgenomen. Soms is het eenvoudig: wanneer de aanname is dat de metingen op T1 het missend zijn van metingen op T2 voorspelt, dan zit de voorspellende variabele T1 zowiso in het model en wordt er dus inderdaad 'automatisch' rekening gehouden. Als er echter ook andere voorspellers zijn, bijvoorbeeld vrouwen vallen vaker uit dan mannen, dan moet de variabele gender wel als voorspeller aan het model toegevoegd worden om hier rekening mee te houden. Ter info: als de (niet geobserveerde, maar wel bestaande) waarde op T2 zelf voorspelt voor het missend zijn op T2, dan is er sprake van missing 'not at random' en daar kan een dergelijk model niet voor corrigeren.

==Van hoeveel % van mijn patiënten moet de data compleet zijn om imputeren te rechtvaardigen?==
Helaas is er niet direct een percentage te noemen dat imputeren nog valide maakt. Zie de [[Missing_values#Aanvullende_bronnen | lijst met aanvullende bronnen]] onder aan deze pagina voor informatie over de (on)mogelijkheden van (meervoudig) imputeren.

==Welk programma kan ik het beste gebruiken om mijn missende data te imputeren?==
In [[statistische software#SPSS|SPSS]] is er de mogelijkheid voor het gebruiken van ''multiple imputation'' methodes (ga naar Analyze -> Multiple Imputation). De aanvulling 'SPSS Missing Values add-on' biedt ook multiple imputation aan bij gebruik van eerdere versies. Het verschil tussen simple en multiple imputation is kortweg: bij "simple" imputeer je de data 1 maal op 1 manier en gebruik je de verkregen dataset in je analyse. Bij multiple imputation-methodes imputeer je meerdere malen en hou je rekening met de onzekerheid in de geïmputeerde waardes.

Verder hebben pakketten als [[statistische software#Stata|Stata]], [[statistische software#s-plus|S-Plus]], [[statistische software#SAS|SAS]] en [[statistische software#R|R]] (bijvoorbeeld '''mice''' of '''Hmisc''') allen routines voor multiple imputatie.

== Referenties ==

<biblio>
#White2010 White IR, Royston P, Wood AM. Multiple imputation using chained equations: Issues and guidance for practice. Statist. Med., 30: 377–399. [http://dx.doi.org/10.1002/sim.4067 DOI:10.1002/sim.4067]
</biblio>

== Aanvullende bronnen ==

*[http://www.nap.edu/catalog/12955/the-prevention-and-treatment-of-missing-data-in-clinical-trials National Research Council. The Prevention and Treatment of Missing Data in Clinical Trials. The National Academies Press, 2010.]

*[http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2010/09/WC500096793.pdf The European Medicines Agency’s (EMA’s) guideline on missing data in confirmatory clinical trials] came into force on 1 January 2011.

*[https://www.uvm.edu/~statdhtx/StatPages/Missing_Data/Missing.html Treatment of missing data, website van David C. Howell]

*[https://pubmed.ncbi.nlm.nih.gov/16980149/ Donders AR, van der Heijden GJ, Stijnen T, Moons KG. Review: a gentle introduction to imputation of missing values. J Clin Epidemiol. 2006 Oct;59(10):1087-91.]

*[https://pubmed.ncbi.nlm.nih.gov/12589867/ Clark TG, Altman DG. Developing a prognostic model in the presence of missing data: an ovarian cancer case study. J Clin Epidemiol. 2003 Jan;56(1):28-37.]

*[https://stefvanbuuren.name/fimd/sec-nutshell.html Van Buuren, Stef. Flexible imputation of missing data. Second edition. CRC press, 2018.] Link naar volledige online versie van het boek op de website van de auteur.

*[http://www.theanalysisfactor.com/multiple-imputation-5-recent-findings-that-change-how-to-use-it/ Multiple Imputation: 5 Recent Findings that Change How to Use It - article from The Analysis Factor].

*[http://www.ntvg.nl/publicatie/rekenen-met-ontbrekende-gegevens/volledig Rekenen met ontbrekende gegevens. RCA Rippe, M den Heijer, S le Cessie. Ned Tijdschr Geneeskd. 2013;157:A5539].

*[https://pubmed.ncbi.nlm.nih.gov/19564179/ Sterne JA, White IR, Carlin JB, Spratt M, Royston P, Kenward MG, Wood AM, Carpenter JR. Multiple imputation for missing data in epidemiological and clinical research: potential and pitfalls. BMJ. 2009 Jun 29;338:b2393.]

*[http://www.ncbi.nlm.nih.gov/pubmed/19596181 Vergouwe Y, Royston P, Moons KG, Altman DG. Development and validation of a prediction model with missing predictor data: a practical approach. J Clin Epidemiol. 2010 Feb;63(2):205-14.]

*[http://www.ncbi.nlm.nih.gov/pubmed/16980150 Moons KG, Donders RA, Stijnen T, Harrell FE Jr. Using the outcome for imputation of missing predictor values was preferred. J Clin Epidemiol. 2006 Oct;59(10):1092-101]

{{onderschrift}}

File:Logo.png

2024-12-09T09:05:22Z

M Wolvers: M Wolvers uploaded a new version of File:Logo.png

== Summary ==
Importing file

Auteurschap

2024-12-09T08:55:26Z

M Wolvers:

Alle [[meeschrijven|tekstuele bijdragen]] op deze wiki zijn te volgen via de 'Geschiedenis' pagina's. Daarop staat per aanpassing de gebruikersnaam van degene die de wijziging gemaakt heeft. Naast deze functie die standaard gegenereerd wordt door [http://www.mediawiki.org Mediawiki], worden er per pagina ook auteurs vermeld.

De wiki biostatistiek hanteert verschillende rollen:

;Auteur: De hoofdauteur van de pagina. De persoon die het typewerk heeft gedaan en substantieel heeft bijgedragen aan de pagina.
;Co-auteur(s): Gebruikers die belangrijke verbeteringen hebben gemaakt aan de pagina of de pagina hebben gecontroleerd op juistheid.
;Moderator: Alle pagina's van de wiki biostatistiek worden gemodereerd door een statisticus van de afdeling [https://www.vumc.nl/research/overzicht/epidemiologie-en-data-science-eds.htm Epidemiology and Data Science (EDS)] van [http://www.amc.nl/ Amsterdam UMC]. De moderator is verantwoordelijk voor het controleren van de aanpassingen aan de pagina's en kan een wijziging al dan niet goedkeuren. Het [[meeschrijven|schrijven]] op de pagina's is beperkt tot gebruikers met inloggegevens. Op deze manier proberen we het niveau van de pagina's hoog te houden. De moderator controleert alle aanpassingen, maar foutieve informatie kan nooit 100% vermeden worden. Zie ook onze [[WikiStatistiek:General disclaimer|disclaimer]]. In technische termen heeft de moderator het gebruikersniveau van 'bureaucrat'.

{{onderschrift}}

Meeschrijven

2024-12-09T08:49:59Z

M Wolvers:

__NOTOC__
Deze [[Wikistatistiek:About|wiki biostatistiek]] is gebaseerd op [http://www.mediawiki.org Mediawiki], dezelfde software die gebruikt wordt door de [http://www.wikipedia.org Wikipedia] encyclopedia.

Iedereen is welkom om deze website te verbeteren. Hiervoor is wel een gebruikersaccount nodig. Heeft u opmerkingen over of wilt u meeschrijven aan de wiki biostatistiek? Mail dan naar edsconsult@amsterdamumc.nl.

Bent u ingelogd onder een account, klik dan op ''''bewerken'''' om te kunnen schrijven. U belandt in een bewerkingsscherm van de pagina waar u zich dan bevindt. Lees deze [http://nl.wikipedia.org/wiki/Help:Uitleg handleiding] en onderstaande codes om te leren hoe u de leesbaarheid van uw aanpassingen kan vergroten. Alle aanpassingen zijn direct voor iedereen zichtbaar nadat u op 'pagina opslaan' heeft geklikt. Aanpassingen worden gemodereerd door een statisticus. Lees over het [[auteurschap]] op onze site.

==Uitproberen?==
De [[Zandbak|'zandbak']] is een speciale pagina om het bewerken van pagina's een keer uit te proberen.

==Lay-out codes==

Hieronder een "cheatsheet" met daarin veel voorkomende layout trucs. Overgenomen van [http://nl.ecgpedia.org/wiki/Hoofdpagina ECGpedia].

{|align="center" style="width:100%; border:2px #a3b1bf solid; background:#f5faff; text-align:left;"
|colspan="3" align="center" style="background:#cee0f2; text-align:center;" |

<h2 style="margin:.5em; margin-top:.1em; margin-bottom:.1em; border-bottom:0; font-weight:bold;">Cheatsheet</h2>
|-
| width="25%" style="background:#cee0f2; padding:0.3em; text-align:center;"|'''Description'''
| style="background:#cee0f2; padding:0.3em; text-align:center;"|'''You type'''
| width="25%" style="background:#cee0f2; padding:0.3em; text-align:center;"|'''You get'''
|-
| colspan="3" style="background:#E6F2FF; padding: 0.2em; font-family: sans-serif; font-size: 0.9em; text-align:center;" | Applies anywhere
|-
|[[w:How_to_edit_a_page#Character_formatting|Italicise text]]
|
<tt><nowiki>''italic''</nowiki></tt>
|
''italic''
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|[[w:How_to_edit_a_page#Character_formatting|Bold text]]
|
<tt><nowiki>'''bold'''</nowiki></tt>
|
'''bold'''
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|[[w:How_to_edit_a_page#Character_formatting|Bold and italic]]
|
<tt><nowiki>'''''bold & italic'''''</nowiki></tt>
|
'''''bold & italic'''''
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
||[[w:How_to_edit_a_page#Links_and_URLs|Internal link]]<br />
(within Wikipedia)
|
<tt><nowiki>[[Name of page]]</nowiki></tt><br />
<tt><nowiki>[[Name of page|display text]]</nowiki></tt><br />
|
[[Name of page]]<br />
[[Name of page|display text]]<br />
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|[[w:How_to_edit_a_page#Links_and_URLs|Redirect to another page]]
|
<tt><nowiki>#REDIRECT [[Target page]]</nowiki></tt>
|
[[Target page]]
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|[[w:How_to_edit_a_page#Links_and_URLs|External link]]<br />
(to other websites)
|
<tt><nowiki>[http://www.example.org]</nowiki></tt><br />
<tt><nowiki>[http://www.example.org display text]</nowiki></tt><br />
<tt><nowiki>http://www.example.org</nowiki></tt>
|
[http://www.example.org]<br />
[http://www.example.org display text]<br />
http://www.example.org
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|
Sign your posts <br />
on talk pages
|
<tt><nowiki>~~~~</nowiki></tt>
|
[[Special:Mypage|Your username]] {{CURRENTTIME}}, <br />
{{CURRENTDAY}} {{CURRENTMONTHNAME}} {{CURRENTYEAR}} (UTC)
|-
| colspan="3" style="background:#E6F2FF; padding: 0.2em; font-family: sans-serif; font-size: 0.9em; text-align:center;" | Applies only at the beginning of the line
|-
|Headings<br />
<span style="font-size:0.9em;">''A Table of Contents will automatically be generated when four headings are added to an article.''</span>
|
<tt><nowiki>== Level 1 ==</nowiki></tt><br />
<tt><nowiki>=== Level 2 ===</nowiki></tt><br />
<tt><nowiki>==== Level 3 ====</nowiki></tt><br />
<tt><nowiki>===== Level 4 =====</nowiki></tt><br />
<tt><nowiki>====== Level 5 ======</nowiki></tt>
|

== Level 1 ==
=== Level 2 ===
==== Level 3 ====
===== Level 4 =====
====== Level 5 ======
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|
|
<tt>* One</tt><br />
<tt>* Two</tt><br />
<tt>** Two point one</tt><br />
<tt>* Three</tt>
|
* One
* Two
** Two point one
* Three
|-
|colspan="3" style="border-top:1px solid #cee0f2;"|
|-
|[[w:Help:List|Numbered list]]
|
<tt># One</tt><br />
<tt># Two</tt><br />
<tt>## Two point one</tt><br />
<tt># Three</tt>
|
# One
# Two
## Two point one
# Three
|-
|colspan="3" style="border-top:1px solid #cee0f2;"| 
|-
|
|

|
|}

<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
Ga naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.

Ga naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.

Of ga terug naar [[Wiki Statistiek|START]].
<div>