Multivariabele regressie voorlopig

From Wikistatistiek
Jump to navigation Jump to search
Auteur dr. M.D.J. Wolvers
Co-Auteur Jeroen Hoogland
auteurschap op deze site

Wat is multivariabele regressie?

Multivariabele regressie is een vorm van regressie waarbij er meerdere variabelen tegelijkertijd gerelateerd worden aan een uitkomstmaat. Deze variabelen worden ook wel covariaten, voorspellers, predictoren, onafhankelijke variabelen of factoren genoemd. De meeste multivariabele regressiemodellen in de klinische literatuur behoren tot de familie van generalized linear models. Dit omvat naast lineaire regressie ook logistische en multinomiale logistische regressie. Daarnaast is Cox regressie een veelgebruikte vorm van multivariabele regressie. Deze pagina richt zich op de algemene principes van regressie met meerdere covariaten en gaat uit van een dataset met onafhankelijke observaties.

Waarvoor kun je multivariabele regressie gebruiken?

Een statistische analyse kan grofweg drie doelen dienen [Hernán][Clarin][Schmueli]: beschrijven, voorspellen of verklaren. Elk doel vraagt een ander gebruik van multivariabele regressie. Hieronder worden veelgebruikte toepassingen en valkuilen van multivariabele regressie steeds per doel besproken.

Beschrijven

Het eerste doel is beschrijven: het gebruiken van data om een kwantitatieve samenvatting te geven van bepaalde karakteristieken van de wereld [Hernán]. Er worden daarbij geen claims of suggesties gemaakt over de oorzaak van het gevonden verschil of de gevonden associatie.

Een voorbeeld van beschrijvende analyses is de Tabel 1 in veel medisch wetenschappelijke artikelen, waarin demografische en klinische karakteristieken van de steekproef worden gedeeld. Soms is de onderzoeksvraag zelf ook puur beschrijvend, bijvoorbeeld: hoe vaak komt <deze specifieke comorbiditeit> voor in <deze specifieke populatie>.

Multivariabele regressie heeft echter zeer zelden een plaats in beschrijvend medisch onderzoek. Louter associatieve analyses hebben namelijk geen correctie voor confounding nodig [Hernán 2008 PMID = 29565659].

Multivariabele methoden waar je wél aan kunt denken voor beschrijvende onderzoeksdoeleinden zijn principal component analyse of clusteranalyse [Hamaker PMID=33186867]. Deze technieken zijn nuttig wanneer je geïnteresseerd bent in de onderlinge relaties binnen een groep variabelen, zonder dat er een uitkomstmaat gedefinieerd is.

Verder lezen

De op deze pagina genoemde modellen gaan ervan uit dat de observaties onafhankelijk zijn, wat betekent dat de metingen voor elke observationele eenheid (meestal: patiënt) niet correleren met metingen van de andere observationele eenheden in de steekproef. Er zijn uitbreidingen van multivariabele regressie beschikbaar voor data die niet aan deze voorwaarde voldoet. Wellicht helpen de pagina´s herhaalde metingen of mixed effects modellen je in dat geval verder.

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.