Mann-Whitney U toets: Difference between revisions
Line 40: | Line 40: | ||
1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen. | 1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen. | ||
2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test). | 2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test). | ||
==Graphpad geeft mij een andere p-waarde voor de Mann-Whitney U toets dan SPSS, welke moet ik aanhouden?== | |||
'' Ik heb een vraag over een discrepantie in uitslagen tussen GraphPad Prism enerzijds en PASW statistics anderzijds. Voor de analyse van de data uit mijn pilot studie heb ik gebruik gemaakt van deze beide programma's. Zo vergeleek ik de uitkomst van mijn primaire uitkomst variabele tussen de groepen "Low risk" en "High risk". Het resultaat van de Mann Whitney volgens GraphPad is een p waarde van 0.0252, PASW komt met een p waarde van 0.021. Hoewel dit verschil klein is krijg ik ook voor andere variabele steeds 2 (licht) verschillende resultaten. Ik vroeg mij af of jullie mij konden helpen achterhalen waar dat verschil in zit en welk van de 2 waardes ik aan zou moeten houden. | |||
Gewoonlijk raad ik aan om de resultaten van [[statistische software#SPSS|SPSS]] meer te vertrouwen dan die van graphpad. Zie bijvoorbeeld deze [http://www.graphpad.com/faq/viewfaq.cfm?faq=416 melding] van eedere fouten in de Mann Whitney versie van [[statistische software#Graphpad|Graphpad]]. In dit geval echter blijkt dat na repliceren van de analyse in [[statistische software#R|R]] dat graphpad een continuiteitscorrectie gebruikt voor het berekenen van de p-waarde en SPSS een iets ruwere p-waarde zonder correctie geeft. Niet goed of fout, maar gezien jouw relatief kleine aantallen zou ik in Graphpad uitkomst met continuiteitscorrectie gebruiken. Dit geldt voor het geval waarbij er ties (gelijke waarden) zijn en Graphpad de 'asymptotic' - en niet exact - p-waarde rapporteert. | |||
== Waar vind ik de Mann-Whitney U toets in SPSS?== | == Waar vind ik de Mann-Whitney U toets in SPSS?== |
Revision as of 15:16, 8 May 2012
Auteur | ir. N. van Geloven | |
Co-Auteur | ||
auteurschap op deze site |
De Mann-Whitney U toets (ook wel Mann–Whitney–Wilcoxon, Wilcoxon rank-sum toets, of Wilcoxon–Mann–Whitney toets genoemd) is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen twee onafhankelijke (ongepaarde) groepen.
Wanneer gebruik ik de Mann-Whitney U toets?
Als je wilt toetsen of de waardes van een (semi-)continue variable verschillen tussen twee aparte groepen kun je de Mann-Whitney U toets gebruiken. Bijvoorbeeld als je wilt testen of het aantal behandelde lesies verschilt tussen twee armen van een studie.
De Mann-Whitney U toets wordt vaak gebruikt als alternatief voor de ongepaarde t-toets, omdat de Mann-Whitney geen normaal verdeelde data veronderstelt. De Mann-Whitney U toets mag altijd gebruikt worden, voor alle ordinale data. Als de data toch normaal verdeeld zijn, zal de Mann-Whitney iets minder power hebben dan de ongepaarde t-toets om een verschil tussen de twee groepen te bemerken.
Voorbeeld van het gebruik van de Mann-Whitney U toets:
Table 2. Procedural characteristics | |||
---|---|---|---|
Variable* | Group A | Group B | p-value** |
Number of lesions treated | 4 [2;5] | 3 [1;4] | 0.45 |
Stent length (cm) | 2.2 [1.8;4.0] | 2.5 [1.7;3.8] | 0.33 |
*Variables are denoted as median [inter quartile range]. **Group differences were tested with the Mann-Whitney U test. |
Heb ik de juiste test gebruikt?
Wij voeren een onderzoek met als uitkomstmaat het percentages regressie (voor de behandeling is 100% en we kijken hoeveel er weg is na behandeling). Wij hebben twee groepen behandeld het hetzelfde apparaat maar met een andere methode. Ik wil graag weten of er een significant verschil zit tussen de twee groepen in de regressie-maat. Zodoende heb ik een paired-T-test gebruikt om te vergelijken. Mijn vragen zijn: 1. Moet de n van beide groepen gelijk zijn voor de test? SPSS maakt er 10 vs 10 van, terwijl het 13 vs 10 is. 2. Mag ik de groepen wel zo vergelijken? Ik heb aangenomen dat het standaard continue variabelen zijn.
1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen. 2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test).
Graphpad geeft mij een andere p-waarde voor de Mann-Whitney U toets dan SPSS, welke moet ik aanhouden?
Ik heb een vraag over een discrepantie in uitslagen tussen GraphPad Prism enerzijds en PASW statistics anderzijds. Voor de analyse van de data uit mijn pilot studie heb ik gebruik gemaakt van deze beide programma's. Zo vergeleek ik de uitkomst van mijn primaire uitkomst variabele tussen de groepen "Low risk" en "High risk". Het resultaat van de Mann Whitney volgens GraphPad is een p waarde van 0.0252, PASW komt met een p waarde van 0.021. Hoewel dit verschil klein is krijg ik ook voor andere variabele steeds 2 (licht) verschillende resultaten. Ik vroeg mij af of jullie mij konden helpen achterhalen waar dat verschil in zit en welk van de 2 waardes ik aan zou moeten houden.
Gewoonlijk raad ik aan om de resultaten van SPSS meer te vertrouwen dan die van graphpad. Zie bijvoorbeeld deze melding van eedere fouten in de Mann Whitney versie van Graphpad. In dit geval echter blijkt dat na repliceren van de analyse in R dat graphpad een continuiteitscorrectie gebruikt voor het berekenen van de p-waarde en SPSS een iets ruwere p-waarde zonder correctie geeft. Niet goed of fout, maar gezien jouw relatief kleine aantallen zou ik in Graphpad uitkomst met continuiteitscorrectie gebruiken. Dit geldt voor het geval waarbij er ties (gelijke waarden) zijn en Graphpad de 'asymptotic' - en niet exact - p-waarde rapporteert.
Waar vind ik de Mann-Whitney U toets in SPSS?
Je vindt de test in SPSS 16 onder Analyze->Non-parametric Tests->2 Independent Samples.
Referenties
Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.
Terug naar KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse.