Mann-Whitney U toets: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
No edit summary
 
(17 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]
|coauthor=
}}
De Mann-Whitney U toets (ook wel Mann–Whitney–Wilcoxon, Wilcoxon rank-sum toets, of Wilcoxon–Mann–Whitney toets genoemd) is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen twee onafhankelijke ([[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|ongepaarde]]) groepen.  
De Mann-Whitney U toets (ook wel Mann–Whitney–Wilcoxon, Wilcoxon rank-sum toets, of Wilcoxon–Mann–Whitney toets genoemd) is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen twee onafhankelijke ([[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|ongepaarde]]) groepen.  


== Wanneer gebruik ik de Mann-Whitney U toets? ==
== Wanneer gebruik ik de Mann-Whitney U toets? ==


Als je wilt toetsen of de waardes van een (semi-)continue variable verschillen tussen twee aparte groepen kun je de Mann-Whitney U toets gebruiken. Bijvoorbeeld als je wilt testen of het aantal behandelde lesies verschilt tussen twee armen van een studie.
Als je wilt toetsen of de waardes van een (semi-)continue variable verschillen tussen twee aparte groepen kun je de Mann-Whitney U toets gebruiken. Bijvoorbeeld als je wilt testen of het aantal behandelde lesies verschilt tussen twee armen van een studie.


De Mann-Whitney U toets wordt vaak gebruikt als alternatief voor de [[T-toets|ongepaarde t-toets]], omdat de Mann-Whitney geen normaal verdeelde data veronderstelt. De Mann-Whitney U toets mag altijd gebruikt worden, voor alle [[KEUZE TOETS#Van welk type is mijn uitkomstmaat?|ordinale]] data. Als de data toch normaal verdeeld zijn, zal de Mann-Whitney iets minder [[Poweranalyse|power]] hebben dan de [[T-toets|ongepaarde t-toets]] om een verschil tussen de twee groepen te bemerken.
De Mann-Whitney U toets wordt vaak gebruikt als alternatief voor de [[T-toets|ongepaarde t-toets]], omdat de Mann-Whitney geen normaal verdeelde data veronderstelt. De Mann-Whitney U toets mag altijd gebruikt worden, voor alle [[KEUZE TOETS#Van welk type is mijn uitkomstmaat?|ordinale]] data. Als de data toch normaal verdeeld zijn, zal de Mann-Whitney iets minder [[Poweranalyse|power]] hebben dan de [[T-toets|ongepaarde t-toets]] om een verschil tussen de twee groepen te bemerken.  


Voorbeeld van het gebruik van de Mann-Whitney U toets:
Voorbeeld van het gebruik van de Mann-Whitney U toets:
Line 18: Line 23:
|-
|-
|Number of lesions treated
|Number of lesions treated
|align="center" | 4 [1;7]
|align="center" | 4 [2;5]
|align="center" | 3 [2;8]
|align="center" | 3 [1;4]
|align="center" |0.45
|align="center" |0.45
|-
|-
Line 27: Line 32:
|align="center" |0.33
|align="center" |0.33
|-
|-
|colspan="4" rowspan="2"|  *Variables are denoted as median [min;max]. **Group differences were tested with the Mann-Whitney U test.
|colspan="4" rowspan="2"|  *Variables are denoted as median [inter quartile range]. **Group differences were tested with the Mann-Whitney U test.
|}
|}


==? ==
==Heb ik de juiste test gebruikt?==
''Wij voeren een onderzoek met als uitkomstmaat het percentages regressie (voor de behandeling is 100% en we kijken hoeveel er weg is na behandeling). Wij hebben twee groepen behandeld het hetzelfde apparaat maar met een andere methode. Ik wil graag weten of er een significant verschil zit tussen de twee groepen in de regressie-maat. Zodoende heb ik een paired-T-test gebruikt om te vergelijken.
''Wij voeren een onderzoek met als uitkomstmaat het percentages regressie (voor de behandeling is 100% en we kijken hoeveel er weg is na behandeling). Wij hebben twee groepen behandeld het hetzelfde apparaat maar met een andere methode. Ik wil graag weten of er een significant verschil zit tussen de twee groepen in de regressie-maat. Zodoende heb ik een paired-T-test gebruikt om te vergelijken.
''Mijn vragen zijn: 1. Moet de n van beide groepen gelijk zijn voor de test? SPSS  
''Mijn vragen zijn: 1. Moet de n van beide groepen gelijk zijn voor de test? SPSS maakt er 10 vs 10 van, terwijl het 13 vs 10 is. 2. Mag ik de groepen wel zo vergelijken? Ik heb aangenomen dat het standaard continue variabelen zijn.  
maakt er 10 vs 10 van, terwijl het 13 vs 10 is. 2. Mag ik de groepen wel zo vergelijken? Ik heb aangenomen dat het  
standaard continue variabelen zijn.  


1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen.
1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen.
2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test).  
2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test).
 
==Graphpad geeft mij een andere p-waarde voor de Mann-Whitney U toets dan SPSS, welke moet ik aanhouden?==
 
'' Ik heb een vraag over een discrepantie in uitslagen tussen GraphPad Prism enerzijds en SPSS statistics anderzijds. Voor de analyse van de data uit mijn pilot studie heb ik gebruik gemaakt van deze beide programma's. Zo vergeleek ik de uitkomst van mijn primaire uitkomst variabele tussen de groepen "Low risk" en "High risk". Het resultaat van de Mann Whitney volgens GraphPad is een p waarde van 0.0252, SPSS komt met een p waarde van 0.021. Hoewel dit verschil klein is krijg ik ook voor andere variabele steeds 2 (licht) verschillende resultaten. Ik vroeg mij af of jullie mij konden helpen achterhalen waar dat verschil in zit en welk van de 2 waardes ik aan zou moeten houden.
 
Gewoonlijk raad ik aan om de resultaten van [[statistische software#SPSS|SPSS]] meer te vertrouwen dan die van graphpad. Zie bijvoorbeeld deze [http://www.graphpad.com/faq/viewfaq.cfm?faq=416 melding] van eedere fouten in de Mann Whitney versie van [[statistische software#Graphpad|Graphpad]]. In dit geval echter blijkt dat na repliceren van de analyse in [[statistische software#R|R]] dat graphpad een continuiteitscorrectie gebruikt voor het berekenen van de p-waarde en SPSS een iets ruwere p-waarde zonder correctie geeft. Niet goed of fout, maar gezien jouw relatief kleine aantallen zou ik in Graphpad uitkomst met continuiteitscorrectie gebruiken. Dit geldt voor het geval waarbij er ties (gelijke waarden) zijn en Graphpad de 'asymptotic' - en niet exact - p-waarde rapporteert.
 
==Wat betekent de "missing analysis" regel die in de SPSS syntax verschijnt?==
 
''Ik doe een Mann Whitney U test in SPSS (via Analyze -> Non parametric tests -> Legacy dialogs -> 2 independent samples). Na het klikken op 'Paste' verschijnt er in de syntax een regel "/MISSING ANALYSIS". Er komt wel gewoon uitput van de analyse. Wat betekent deze code?
 
Je kunt bij het aansturen van de Mann-Whitney test onder 'options' kiezen voor hoe om te gaan met cases met missende waarden. SPSS biedt twee opties (uit de help file):
* Exclude cases test-by-test. When several tests are specified, each test is evaluated separately for missing values.
* Exclude cases listwise. Cases with missing values for any variable are excluded from all analyses.
De eerste is de standaardinstelling en komt in de syntax te staan als  " /MISSING ANALYSIS". Het betekent dat als je meerdere uitkomstvariabelen hebt die je tussen twee groepen vergelijkt met de mann-whitney, dat er voor iedere uitkomstvariabele apart gekeken wordt naar welke cases met missende waardes niet mee kunnen doen. De tweede optie "/MISSING LISTWISE" zorgt ervoor dat bij alle testen de casussen met een missende waarde in 1 van de uitkomstvariabelen niet mee doen.
 
== Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe? ==
 
''Het onderwerp van het onderzoek is compleetheid van de rapportage van een operatie. Ik onderscheid 5 facetten binnen rapportage. Om een indruk te geven per patiënt vat ik alle facetten samen in één score. Elke facet weegt even zwaar en een patiënt kan dus een score hebben van 0 (aan geen enkele facet voldaan) tot 5 (alle facetten zijn gerapporteerd). Nu wil ik de scores van twee onafhankelijke groepen vergelijken. De waardes zijn niet normaal verdeeld (gegeven het histogram en de Shapiro-Wilk test), dus zou ik de [[Mann-Whitney U toets]] gebruiken. Echter heb ik slecht zicht op de effectmaat (zoals ik dit wel mooi als het verschil tussen twee gemiddeldes bij een t-toets zou kunnen weergeven). Wat voor een effectmaat kan ik weergeven?
 
Je zou in deze situatie de ‘Hodges-Lehmann estimate of the median difference’ kunnen rapporteren.  


== Waar vind ik de Mann-Whitney U toets in SPSS?==
== Waar vind ik de Mann-Whitney U toets in SPSS?==


Je vindt de test in SPSS 16 onder Analyze->Non-parametric Tests->2 Independent Samples.
Je vindt de test in SPSS onder Analyze->Non-parametric Tests-> (Legacy Dialogs) -> 2 Independent Samples of onder de wizard onder Analyze -> Non-parametrc Tests -> independent samples.


== Referenties ==
== Referenties ==


<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
*[http://www.tqmp.org/Content/vol04-1/p013/p013.pdf Nadim Nachar. The Mann‐Whitney U, A Test for Assessing Whether Two Independent Samples Come from the Same Distribution. Tutorials in Quantitative Methods for Psychology 2008; vol. 4(1), p. 13‐20.]
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.


Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
{{onderschrift}}
<div>

Latest revision as of 14:53, 13 March 2018

Auteur dr. ir. N. van Geloven
Co-Auteur
auteurschap op deze site

De Mann-Whitney U toets (ook wel Mann–Whitney–Wilcoxon, Wilcoxon rank-sum toets, of Wilcoxon–Mann–Whitney toets genoemd) is een niet-parametrische toets voor het vergelijken van een (semi-)continue variabele tussen twee onafhankelijke (ongepaarde) groepen.

Wanneer gebruik ik de Mann-Whitney U toets?

Als je wilt toetsen of de waardes van een (semi-)continue variable verschillen tussen twee aparte groepen kun je de Mann-Whitney U toets gebruiken. Bijvoorbeeld als je wilt testen of het aantal behandelde lesies verschilt tussen twee armen van een studie.

De Mann-Whitney U toets wordt vaak gebruikt als alternatief voor de ongepaarde t-toets, omdat de Mann-Whitney geen normaal verdeelde data veronderstelt. De Mann-Whitney U toets mag altijd gebruikt worden, voor alle ordinale data. Als de data toch normaal verdeeld zijn, zal de Mann-Whitney iets minder power hebben dan de ongepaarde t-toets om een verschil tussen de twee groepen te bemerken.

Voorbeeld van het gebruik van de Mann-Whitney U toets:

Table 2. Procedural characteristics
Variable* Group A Group B p-value**
Number of lesions treated 4 [2;5] 3 [1;4] 0.45
Stent length (cm) 2.2 [1.8;4.0] 2.5 [1.7;3.8] 0.33
*Variables are denoted as median [inter quartile range]. **Group differences were tested with the Mann-Whitney U test.

Heb ik de juiste test gebruikt?

Wij voeren een onderzoek met als uitkomstmaat het percentages regressie (voor de behandeling is 100% en we kijken hoeveel er weg is na behandeling). Wij hebben twee groepen behandeld het hetzelfde apparaat maar met een andere methode. Ik wil graag weten of er een significant verschil zit tussen de twee groepen in de regressie-maat. Zodoende heb ik een paired-T-test gebruikt om te vergelijken. Mijn vragen zijn: 1. Moet de n van beide groepen gelijk zijn voor de test? SPSS maakt er 10 vs 10 van, terwijl het 13 vs 10 is. 2. Mag ik de groepen wel zo vergelijken? Ik heb aangenomen dat het standaard continue variabelen zijn.

1. De n hoeft zeker niet gelijk te zijn. Bij jou komt de 10 vs 10 omdat je, onterecht, een gepaarde t-test hebt gedaan: je vergelijkt immers 2 onafhankelijke patientengroepen. 2. Een vergelijking tussen de continue variabele bij 2 verschillende patientengroepen kan m.b.v. een independent t-test, mits de verdeling (ongeveer) normaal is en je niet te kleine aantallen hebt. Dan geef je je resultaten weer in gemiddelden en SD. Ik zie echter in je Excel-bestand 13 vs. 11 patienten, dus relatief weinig, en is de verdeling niet normaal: de mean en median waardes liggen uit elkaar. Dus kun je je resultaten het best weergeven als medianen en interkwartielbereiken (=interquartile ranges; 25-75ste percentiel) en non-parametrische statistiek gebruiken (Mann-Whitney test).

Graphpad geeft mij een andere p-waarde voor de Mann-Whitney U toets dan SPSS, welke moet ik aanhouden?

Ik heb een vraag over een discrepantie in uitslagen tussen GraphPad Prism enerzijds en SPSS statistics anderzijds. Voor de analyse van de data uit mijn pilot studie heb ik gebruik gemaakt van deze beide programma's. Zo vergeleek ik de uitkomst van mijn primaire uitkomst variabele tussen de groepen "Low risk" en "High risk". Het resultaat van de Mann Whitney volgens GraphPad is een p waarde van 0.0252, SPSS komt met een p waarde van 0.021. Hoewel dit verschil klein is krijg ik ook voor andere variabele steeds 2 (licht) verschillende resultaten. Ik vroeg mij af of jullie mij konden helpen achterhalen waar dat verschil in zit en welk van de 2 waardes ik aan zou moeten houden.

Gewoonlijk raad ik aan om de resultaten van SPSS meer te vertrouwen dan die van graphpad. Zie bijvoorbeeld deze melding van eedere fouten in de Mann Whitney versie van Graphpad. In dit geval echter blijkt dat na repliceren van de analyse in R dat graphpad een continuiteitscorrectie gebruikt voor het berekenen van de p-waarde en SPSS een iets ruwere p-waarde zonder correctie geeft. Niet goed of fout, maar gezien jouw relatief kleine aantallen zou ik in Graphpad uitkomst met continuiteitscorrectie gebruiken. Dit geldt voor het geval waarbij er ties (gelijke waarden) zijn en Graphpad de 'asymptotic' - en niet exact - p-waarde rapporteert.

Wat betekent de "missing analysis" regel die in de SPSS syntax verschijnt?

Ik doe een Mann Whitney U test in SPSS (via Analyze -> Non parametric tests -> Legacy dialogs -> 2 independent samples). Na het klikken op 'Paste' verschijnt er in de syntax een regel "/MISSING ANALYSIS". Er komt wel gewoon uitput van de analyse. Wat betekent deze code?

Je kunt bij het aansturen van de Mann-Whitney test onder 'options' kiezen voor hoe om te gaan met cases met missende waarden. SPSS biedt twee opties (uit de help file):

  • Exclude cases test-by-test. When several tests are specified, each test is evaluated separately for missing values.
  • Exclude cases listwise. Cases with missing values for any variable are excluded from all analyses.

De eerste is de standaardinstelling en komt in de syntax te staan als " /MISSING ANALYSIS". Het betekent dat als je meerdere uitkomstvariabelen hebt die je tussen twee groepen vergelijkt met de mann-whitney, dat er voor iedere uitkomstvariabele apart gekeken wordt naar welke cases met missende waardes niet mee kunnen doen. De tweede optie "/MISSING LISTWISE" zorgt ervoor dat bij alle testen de casussen met een missende waarde in 1 van de uitkomstvariabelen niet mee doen.

Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?

Het onderwerp van het onderzoek is compleetheid van de rapportage van een operatie. Ik onderscheid 5 facetten binnen rapportage. Om een indruk te geven per patiënt vat ik alle facetten samen in één score. Elke facet weegt even zwaar en een patiënt kan dus een score hebben van 0 (aan geen enkele facet voldaan) tot 5 (alle facetten zijn gerapporteerd). Nu wil ik de scores van twee onafhankelijke groepen vergelijken. De waardes zijn niet normaal verdeeld (gegeven het histogram en de Shapiro-Wilk test), dus zou ik de Mann-Whitney U toets gebruiken. Echter heb ik slecht zicht op de effectmaat (zoals ik dit wel mooi als het verschil tussen twee gemiddeldes bij een t-toets zou kunnen weergeven). Wat voor een effectmaat kan ik weergeven?

Je zou in deze situatie de ‘Hodges-Lehmann estimate of the median difference’ kunnen rapporteren.

Waar vind ik de Mann-Whitney U toets in SPSS?

Je vindt de test in SPSS onder Analyze->Non-parametric Tests-> (Legacy Dialogs) -> 2 Independent Samples of onder de wizard onder Analyze -> Non-parametrc Tests -> independent samples.

Referenties

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.