Correlatie: Difference between revisions
No edit summary |
|||
Line 3: | Line 3: | ||
=== Wanneer gebruik ik Pearson's ''r''? === | |||
Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van -1 tot +1. Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang. | Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (= correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van -1 tot +1 . Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang. | ||
De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is voor de eenheden waarin X en Y gemeten zijn. Wat meer statistisch geformuleerd: r is ongevoelig voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage, dan zal die correlatie identiek zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden. | |||
=== 1.2 Hoe interpreteer ik Pearson’s ''r''? === | |||
Pearson’s ’ r is een eenvoudige statistische maat. Toch is de interpretatie daarvan niet altijd even makkelijk. Bij de interpretatie moet je rekening houden met een aantal zaken. Als de correlatie 0 is, dan is er geen lineair verband. Dat wil niet zegen dat er geen andersoortig verband kan zijn. Het is daarom belangrijk om altijd eerst een scatterplot (spreidingsdiagram) te maken. Ook moet je rekening houden met het feit dat Pearson’s r erg gevoelig is voor extreme waarden (uitbijters) in je dataset. Verwar ook niet het begrip samenhang met causaliteit. X is de oorzaak van Y als een verandering in Y het gevolg is van een verandering in X. Als er een correlatie is tussen X en Y is, dan hoeft die samenhang niet causaal van aard te zijn. Er kan immers sprake zijn van wederzijdse beïnvloeding, of de correlatie tussen X en Y kan (deels) verklaard worden door allerlei andere factoren. | |||
===Waar vind ik Pearson’s r in SPSS? === | |||
Je vindt deze correlatietechniek in SPSS 16 onder Analyze -> Correlate -> Bivariate Correlations. | |||
==Spearman's rho== | ==Spearman's rho== |
Revision as of 16:13, 27 March 2009
Pearson's r
Pearson’s correlatie coëfficiënt r, soms ook wel de produkt-moment-correlatie-coëfficiënt (PMCC) genoemd, drukt de sterkte van een lineaire samenhang tussen twee variabelen uit in een getal. Het gebruik van Pearson’s r eist dat beide variabelen continue van aard zijn.
Wanneer gebruik ik Pearson's r?
Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (= correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van -1 tot +1 . Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang.
De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is voor de eenheden waarin X en Y gemeten zijn. Wat meer statistisch geformuleerd: r is ongevoelig voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage, dan zal die correlatie identiek zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden.
1.2 Hoe interpreteer ik Pearson’s r?
Pearson’s ’ r is een eenvoudige statistische maat. Toch is de interpretatie daarvan niet altijd even makkelijk. Bij de interpretatie moet je rekening houden met een aantal zaken. Als de correlatie 0 is, dan is er geen lineair verband. Dat wil niet zegen dat er geen andersoortig verband kan zijn. Het is daarom belangrijk om altijd eerst een scatterplot (spreidingsdiagram) te maken. Ook moet je rekening houden met het feit dat Pearson’s r erg gevoelig is voor extreme waarden (uitbijters) in je dataset. Verwar ook niet het begrip samenhang met causaliteit. X is de oorzaak van Y als een verandering in Y het gevolg is van een verandering in X. Als er een correlatie is tussen X en Y is, dan hoeft die samenhang niet causaal van aard te zijn. Er kan immers sprake zijn van wederzijdse beïnvloeding, of de correlatie tussen X en Y kan (deels) verklaard worden door allerlei andere factoren.
Waar vind ik Pearson’s r in SPSS?
Je vindt deze correlatietechniek in SPSS 16 onder Analyze -> Correlate -> Bivariate Correlations.