Betrouwbaarheidsinterval: Difference between revisions
(→Hoe bereken ik een betrouwbaarheidsinterval behorend bij een verschil tussen twee medianen?: verwijzing naar SPSS aangepast) |
|||
Line 70: | Line 70: | ||
''Ik zou graag tevens een betrouwbaarheidsinterval geven van deze niet normaal verdeelde data. Is dat mogelijk? | ''Ik zou graag tevens een betrouwbaarheidsinterval geven van deze niet normaal verdeelde data. Is dat mogelijk? | ||
Ja dat kan. Ik begrijp dat je een betrouwbaarheidsinterval wilt berekenen bij het gepaarde verschil. Je zou hiervoor de Hodges-Lehmann procedure kunnen gebruiken. | Ja dat kan. Ik begrijp dat je een betrouwbaarheidsinterval wilt berekenen bij het gepaarde verschil. Je zou hiervoor de Hodges-Lehmann procedure kunnen gebruiken. In [[statistische_software#SPSS|SPSS]] 28 kun je een dergelijk betrouwbaarheidsinterval opvragen onder Analyze -> Nonparametric Tests -> Related Samples. | ||
Let wel op welk verschil je precies schat. | Let wel op welk verschil je precies schat. Déze Hodges-Lehmann procedure schat het mediane verschil (= de mediaan van alle gepaarde verschillen). Dit is niet hetzelfde als het verschil tussen de twee medianen per interventiegroep. | ||
==Referenties == | ==Referenties == |
Revision as of 10:20, 11 January 2023
Auteur | dr. ir. N. van Geloven | |
Co-Auteur | ||
auteurschap op deze site |
Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt. Formeel zegt het interval iets over welke waardes verwacht worden als een experiment meerdere keren herhaald zou worden. Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
Wanneer gebruik ik een betrouwbaarheidsinterval?
Je kunt een betrouwbaarheidsinterval gebruiken bij iedere schatting die je maakt. Bijvoorbeeld: als ik van een groep patienten het gemiddelde gewicht gemeten heb, dan kan ik het gemiddelde gewicht van de hele patientpopulatie schatten middels door het gemiddelde van mijn steekproef te nemen en de zekerheid van deze schatting aangeven met een betrouwbaarheidsinterval.
Vaak wordt er in het medisch onderzoek een betrouwbaarheidsinterval gegeven rondom de schatting van een bepaald effect (of een bepaald verschil tussen groepen). Bijvoorbeeld: "women receiving treatment were less likely to report severe pain (risk ratio 0.41, 95% confidence interval 0.32 to 0.55)".
Welke software is er voor het berekenen van betrouwbaarheidsintervallen?
In de meeste statistische pakketten kun je aangeven dat je de beschrijving van een variabele of de resultaten van een analyse met bijbehorend betrouwbaarheidsinterval wilt zien. Het programma CIA (beschikbaar in de softwarewinkel van de CDW), behorend bij het boek "Statistics with confidence" is helemaal gewijd aan het berekenen van betrouwbaarheidsintervallen.
Hoe bereken ik een betrouwbaarheidsinterval rondom een incidence rate?
Ik heb nu de death rate per 1000y berekend, door het totaal aantal overledenen te delen door de som aantal jaren follow up (persoonsjaren). Graag zou ik bij deze death rate een 95% CI willen berekenen in SPSS. Kan dit?
Ik ken geen methode om deze confidence intervallen in SPSS uit te rekenen. De manier waarop dit kan staat op de site van StatsDirect Ltd beschreven. Je kunt dit zelf implementeren (in bijv excel, of R), maar je kunt ook gebruik maken van bestaande implementaties. De nieuwere versies van het programma CIA heeft opties hiervoor en ook op de website OpenEpi vind je onder 'Person Time' opties.
Welke betrouwbaarheidsintervallen horen er bij de toetsen die ik gedaan heb?
In mijn onderzoek voer ik een Chi-square test, Mann-Whitney test en een Kaplan-Meier analyse uit om twee groepen met elkaar te vergelijken. In de eerste versie van mijn artikel had ik de p-waarden gerapporteerd. Omdat we slechts een beperkt aantal deelnemers hebben stelde één van mijn co-auteurs voor om ipv de p-waarde het 95%-betrouwbaarheidsinterval te rapporteren. Naar mijn idee kan ik dit interval bij bovengenoemde testen in SPSS echter niet uit de analyses krijgen. Klopt dit? Hebben jullie ideeën over hoe ik de intervallen wel kan verkrijgen?
Een 95% betrouwbaarheidsinterval kun je berekenen rondom een ‘effect maat’. Voor ieder van de genoemde vergelijkingen zou je dan moeten gaan kiezen welke effectmaat je wilt rapporteren en daarbij het betrouwbaarheidsinterval uitrekenen.
- Bij een Chi-kwadraat toets (het vergelijken van proporties) kun je denken aan een risk difference, risk ratio of odds ratio. De laatste 2 kun je inclusief betrouwbaarheidsinterval opvragen in de crosstabs procedure van SPSS (vink ‘risk’ aan, let wel goed op welke groep als referentie gekozen wordt). Een risk difference wordt volgens mij niet aangeboden in de crosstabs procedure. Je zou die bijv kunnen verkrijgen via de ‘two by two table’ calculator op de OpenEpi website . Of met CIA.
- bij een Mann-Whitney U toets kun je denken aan het rapporteren van de betrouwbaarheidsintervallen rondom de twee medianen van beide groepen en een geschat verschil tussen de medianen + betrouwbaarheidsinterval. Volgens mij geeft SPSS voor die laatste geen optie. Je zou dit ook via CIA kunnen berekenen.
- Kaplan Meier analyse: indien je daar alleen een (of meerdere) survival curves mee plot, dan ligt het voor de hand dat je een 95% betrouwbaarheidsinterval rondom het geschatte survival (of event) percentage rapporteert. SPSS geeft dat voor bijv mean en median survival (indien deze beide berekend kunnen worden). Voor de curve zelf geeft SPSS niet een betrouwbaarheidsinterval. Dit zou je eventueel kunnen berekenen met R, functie survfit. Wellicht ben je meer geintersseerd in een schatting van het verschil in termen van ratio tussen 2 curves op een bepaald punt. Dat zou je eventueel zelf mbv de standaard errors die SPSS geeft + een delta methode aanpassing kunnen berekenen.
Hoe bereken ik het betrouwbaarheidsinterval rondom een relatief risico behorend bij een gepaarde (McNemar) vergelijking?
Onze gematchte dichotome uitkomstmaat hebben we vergeleken met gepaarde testen (McNemar toets), waar een aantal hele mooie p-waarden uitkomen. Om deze bevindingen echter nog iets meer kracht bij te zetten, zouden we hier ook graag een relatief risico met betrouwbaarheidsinterval bij weer willen geven. Als je echter op de 'gewone' manier deze relatieve risico's berekent, past de conclusie over significantie op basis van het betrouwbaarheidsinterval niet altijd bij de p-waarde uit de McNemar toets. Zo kan het betrouwbaarheidsinterval de 1 bevatten, maar wel een P van <0.05 of andersom. Dit verschil is waarschijnlijk te verklaren doordat dit relatief risico met betrouwbaarheidsinterval geen rekening houd met het feit dat het om gepaarde data gaat. Mijn vraag is dan ook of er een mogelijkheid is om het relatieve risico met betrouwbaarheidsinterval over gepaarde data te berekenen, zodanig dat we zowel dit betrouwbaarheidsinterval als de p-waarde uit de McNemar toets samen in een tabel weer kunnen geven.
Na een kleine zoektocht kom ik hiervoor op de volgende methode van Price en Bonett. Op deze bijbehorende website staat een uitwerking hiervan in de vorm van een excel-calculator aangeboden. Let erop dat er in de calculator van de volgende datastructuur wordt uitgegaan:
Cases (of gepaarde groep 1) | |||
positief | negatief | ||
Controls (of gepaarde groep 2) | positief | a | b |
negatief | c | d |
Hoe bereken ik een betrouwbaarheidsinterval behorend bij een verschil tussen twee medianen?
Achtergrond: we verrichten een randomized cross-over studie waarbij twee interventies worden vergeleken. Bij normaal verdeelde data geef ik per interventie:
Mean + SD, + een paired difference, een SD van de paired difference, en een 95%CI van de paired difference
Een aantal (secondaire) uitkomstmaten zijn niet normaal verdeeld. Ik geef hierbij nu per interventie:
Median + IQR, + paired difference en een IQR van de paired difference.
Ik zou graag tevens een betrouwbaarheidsinterval geven van deze niet normaal verdeelde data. Is dat mogelijk?
Ja dat kan. Ik begrijp dat je een betrouwbaarheidsinterval wilt berekenen bij het gepaarde verschil. Je zou hiervoor de Hodges-Lehmann procedure kunnen gebruiken. In SPSS 28 kun je een dergelijk betrouwbaarheidsinterval opvragen onder Analyze -> Nonparametric Tests -> Related Samples.
Let wel op welk verschil je precies schat. Déze Hodges-Lehmann procedure schat het mediane verschil (= de mediaan van alle gepaarde verschillen). Dit is niet hetzelfde als het verschil tussen de twee medianen per interventiegroep.
Referenties
- Douglas G. Altman, David Machin, Trevor N. Bryant, Martin J. Gardner, Statistics with confidence, BMJ books.
- CIA Confidence interval analysis - software behorend bij het boek Statistics with confidence.
- Douglas G. Altman, J Martin Bland, Statistical Notes, Standard deviations and standard errors, BMJ 2005;331:903
- OpenEpi Dean AG, Sullivan KM, Soe MM. OpenEpi: Open Source Epidemiologic Statistics for Public Health, Version 2.3.1. www.OpenEpi.com, updated 2011/23/06, accessed 2011/11/28.
- Bonett DG, Price RM. Confidence intervals for a ratio of binomial proportions based on paired data. Stat Med. 2006 Sep 15;25(17):3039-47.
Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.
De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.