Gemiddelde en mediaan: Difference between revisions
Line 66: | Line 66: | ||
Als ik het goed begrijp heb je de Kolmogorov-Smirnov toets gebruikt om te toetsen of het aannemelijk is dat je data een normale verdeling volgen. Je gaat ervan uit dat je data wel een normale verdeling volgen omdat de p-waarde van de toets kleiner is dan 0,05. Gegeven dat de metingen alleen tussen 0 en 100 kunnen vallen en de waardes van de gemiddelde en standaard deviatie dat je geeft, denk ik dat je verdeling erg scheef is. Dit kan je bekijken door een histogram te maken. De Kolmogorov-Smirnov toets heeft weinig [[Poweranalyse | power]] om met dit aantal observaties (patiënten) afwijkingen van een normale verdeling te detecteren. Dit betekent dat de verdeling heel anders kan zijn dan een normale verdeling, zonder dat de p-waarde kleiner dan 0,05 is. In deze situatie heeft de Anderson-Darling toets meer power om afwijkingen van de normale verdeling te detecteren (Table 2)<cite>[razali2011]</cite>. De Anderson-Darling toets is echter niet in SPSS geïmplementeerd. | Als ik het goed begrijp heb je de Kolmogorov-Smirnov toets gebruikt om te toetsen of het aannemelijk is dat je data een normale verdeling volgen. Je gaat ervan uit dat je data wel een normale verdeling volgen omdat de p-waarde van de toets kleiner is dan 0,05. Gegeven dat de metingen alleen tussen 0 en 100 kunnen vallen en de waardes van de gemiddelde en standaard deviatie dat je geeft, denk ik dat je verdeling erg scheef is. Dit kan je bekijken door een histogram te maken. De Kolmogorov-Smirnov toets heeft weinig [[Poweranalyse | power]] om met dit aantal observaties (patiënten) afwijkingen van een normale verdeling te detecteren. Dit betekent dat de verdeling heel anders kan zijn dan een normale verdeling, zonder dat de p-waarde kleiner dan 0,05 is. In deze situatie heeft de Anderson-Darling toets meer power om afwijkingen van de normale verdeling te detecteren (Table 2)<cite>[razali2011]</cite>. De Anderson-Darling toets is echter niet in SPSS geïmplementeerd. | ||
Praktisch gezien kan je het beste in je artikel de mediaan en range of interquartile range weergeven. Deze zijn ook geschikt als je observaties geen normale verdeling volgen. | Praktisch gezien kan je het beste in je artikel de mediaan en range of interquartile range weergeven. Deze zijn ook geschikt als je observaties geen normale verdeling volgen.. | ||
== Referenties == | == Referenties == |
Revision as of 14:33, 15 July 2015
Moet ik de gemiddelden of de medianen van mijn data weergeven?
We hebben gekeken naar het verschil in doorlooptijden van de polikliniek in twee centra. Deze tijden waren niet normaal verdeeld, dus hebben we de waarden als mediaan [25ste–75ste percentiel] vermeld en de Mann-Whitney test gedaan om de verschillen tussen de centra te testen. Een reviewer vraagt nu echter om weergave van de gemiddelde doorlooptijden. Is het zinvol de waarden om te zetten naar mean?
Met niet-normaal verdeelde data is het inderdaad gebruikelijk om medianen te geven en niet-parametrische toetsen te gebruiken, dus dat hebben jullie prima gedaan. Volgens de reviewer is het duidelijker wanneer jullie gemiddelden geven en de data transformeren. Transformeren is mijns inziens niet wenselijk. Dit doe je eigenlijk alleen maar om in staat te zijn om parametriche testen uit te voeren (zoals regressie of t-test). De data die je krijgt na transformern zijn ook moeilijk om te interpreteren (wat moet je voorstellen van een gemiddelde van de logaritme van de tijd?). Om aan de reviewer's wensen toe te komen, kun je naast de mediane waarden ook de gemiddelden weergeven.
Gemiddede of mediaan als ene groep wel normaal verdeeld is en andere niet?
In mijn studie vergelijk ik een patiëntengroep met een controlegroep. In m’n tabel 1 vergelijk ik de klinische eigenschappen van de groepen. Daarbij heb ik de normaal verdeelde parameters in mean + SD gegeven, en de niet normaal verdeelde parameters in median + IQR. O.a. de leeftijd van de patiëntengroep is echter niet normaal verdeeld, terwijl de leeftijd van de controlegroep wel normaal verdeeld is; ik zou dus de een in mean moeten geven, en de ander in median. Lezers kunnen daardoor de waarden niet in één oogopslag met elkaar vergelijken. Zou ik in dit geval beter allebei in median moeten uitdrukken, of toch één mean en één median?
Ik raad je aan beide groepen met dezelfde descriptieve maten te beschrijven. Zoals je zelf al schrijft kun je anders niet goed vergelijken. Als voor een van de groepen geldt dat het weergeven van mean en sd geen goede weergave is van waar de meeste waardes zich bevinden, dan zou ik beide groepen met median en IQR beschrijven.
Hoe bereken ik de standard error van de mediaan?
Als je (vanwege niet normale verdeling) data weergeeft als median, en je wil daar een SE bijzetten, is dat dan de SE van de mean of moet dat dan altijd van de median zijn? Indien het dan de SE van de median moet zijn, hoe kan je dat bepalen? Welke handelingen in SPSS moet ik dan doen om deze data te verkrijgen (by explore namelijk alleen SE van mean weergegeven)?
Als de data weergegeven wordt mbv medianen, dan zou het vreemd zijn daar een se van de mean bij te zetten. Vaak zie je bij beschrijvingen van data de volgende notaties:
mean +/- SD
median [rangelower,rangeupper]
median [Q1,Q3]
Als je liever de SE rapporteert (en dus niet zo zeer de data beschrijft, maar een kwantificering geeft van de nauwkeurigheid van de schatting van de betreffende parameter), dan heb je in geval van de median dus de SE van de median nodig. SPSS geeft deze niet, omdat deze het best met behulp van bootstrapping berekend kan worden. Voor grote samples die normaal verdeeld zijn, kan de volgende approximatie gebruikt worden: SEmedian = 1.25 * SEmean. Maar in jouw geval zal dit niet passend zijn, vanwege ontbrekende normale verdeling.
Een andere aanpak is het noteren van een 95% betrouwbaarheidsinterval rondom de median. Volgens boek van Altman (Statistics with confidence) kan dan met de volgende formules:
Rond r en s af naar de meest dichtbijzijnde gehele getallen. Nu zijn de r-de en s-de observatie van de gerankte dataset de grenzen van het 95% betrouwbaarheidsinterval.
Je kunt dus of kiezen voor een van bovenstaande alternatieve beschrijvingen, of mbv boorstrapping een schatting van de se van de median krijgen.
Hoe bereken ik een 95% betrouwbaarheidsinterval rondom een geometrisch gemiddelde?
Ik moet het geometrisch gemiddelde met 95% betrouwbaarheidsinterval (confidence interval - CI) berekenen van een heleboel waarden van CRP. Nu heb ik de variabele ln(CRP) aangemaakt en daar het gemiddelde van berekend. Nu begrepen dat ik e^(dat getal) moet doen om het geometrisch gemiddelde te krijgen. Alleen nu weet ik niet hoe ik daar een 95% CI bij krijg.
De makkelijkste manier is om eerst een 95% CI te maken van de ln(CRP) variabele en die grenzen weer terug te transformeren met de e^(die grens) regel.
Hoe beschrijf ik het beste een kleine dataset?
Ik heb 5 metingen van spina bifida patienten, vier van dwarslaesiepatienten en 5 van controlebiopten. Hoe kan ik de data het beste beschrijven? Ik speel met ideeën, om bijvoorbeeld de mediaan en range per groep te gebruiken maar weet niet of dit zinvol is.
Als je de data apart per groep wilt beschrijven, dan heb je te maken met kleine groepen (5-4-5). Bij dergelijke kleine aantallen is een standaard deviatie doorgaans niet zo betrouwbaar. Het lijkt dus inderdaad gepast om op andere maat de spreiding in de data te beschrijven, bijv met een range. Het centrum van de data kun je indien de data redelijk symmetrisch is met een gemiddelde beschrijven, of zoals je voorstelt met mediaan. De mediaan van 4 getallen is wel iets lastiger te kiezen (vaak wordt gekozen voor het gemiddelde van de middelste twee getallen).
Met deze aanpak gebruik je 3 maten (laagste waarde, mean of median, hoogste waarde) om 4 of 5 datapunten te beschrijven. Je kunt ook overwegen de datapunten zelf te beschrijven, dit zijn maar 1 of 2 getallen extra en daarmee heeft een lezer alle informatie. Doorgaans gaat dit het overzichtelijke in een (jitter) plot, dus een plot waarin de individuele punten zichtbaar blijven door ze iets versprongen naast elkaar te plotten.
Hoe beschrijf ik het beste mijn observaties op een 5-punts likertschaal?
Ik heb 5-punts likertvragen in een vragenlijst gebruikt en de beste manier om die te verwerken is mediaan + IQR (iig geen gemiddelde). Als ik dit nu echter opschrijf ziet dit er niet uit (Bv, mediaan is 3, IQR 1, het blijft erg abstract), en overweeg ik om simpelweg de percentages uit te schrijven en er een tabel bij te voegen. Kunt u mij nog adviezen hierover geven?
Als je er ruimte voor hebt, is het uitschrijven van de percentages per categorie zeker een goede manier om de data volledig te beschrijven. Als je voor median + IQR gaat, kun je ook ipv alleen de breedte van de IQR, de twee grenzen van de IQR aangeven, bijv mediaan 3, IQR (2-4). Soms wordt met de range alleen de afstand tussen Q3 en Q1 bedoeld, soms de beschrijving van Q1 en Q3 zelf, die tweede versie zie ik wat vaker gebruikt worden.
Wat doe ik als de gemiddelde minus de standaard deviatie ver buiten de range van mogelijke waarden ligt?
Ik heb een meetinstrument waarbij uitkomsten tussen de 0 en 100 mogelijk zijn. 0 is zeer slecht en 100 is perfect. Ik heb metingen van 58 patiënten, waarbij de gemiddelde 13 en de standaard deviatie 28 is. De p-waarde van de Kolmogorov-Smirnov toets is groter dan 0,05. Maar eigenlijk kan dat niet, omdat het instrument niet negatief meet. Kan ik dan de gemiddelde en standaard deviatie in een artikel weergeven?
Als ik het goed begrijp heb je de Kolmogorov-Smirnov toets gebruikt om te toetsen of het aannemelijk is dat je data een normale verdeling volgen. Je gaat ervan uit dat je data wel een normale verdeling volgen omdat de p-waarde van de toets kleiner is dan 0,05. Gegeven dat de metingen alleen tussen 0 en 100 kunnen vallen en de waardes van de gemiddelde en standaard deviatie dat je geeft, denk ik dat je verdeling erg scheef is. Dit kan je bekijken door een histogram te maken. De Kolmogorov-Smirnov toets heeft weinig power om met dit aantal observaties (patiënten) afwijkingen van een normale verdeling te detecteren. Dit betekent dat de verdeling heel anders kan zijn dan een normale verdeling, zonder dat de p-waarde kleiner dan 0,05 is. In deze situatie heeft de Anderson-Darling toets meer power om afwijkingen van de normale verdeling te detecteren (Table 2)[1]. De Anderson-Darling toets is echter niet in SPSS geïmplementeerd.
Praktisch gezien kan je het beste in je artikel de mediaan en range of interquartile range weergeven. Deze zijn ook geschikt als je observaties geen normale verdeling volgen..
Referenties
-
Razali NM, Yap BW. Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics Vol 2.1 (2011): 21-33. link
- The difference between the sample mean and the population mean on TheStatsGeek.com Een zeer heldere Engelstalige uitlag over het verschil tussen een steekproefgemiddelde en een populatiegemiddelde.
Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.
De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.