<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wikibiostatistiek.amsterdamumc.org/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Rebecca+Holman</id>
	<title>Wikistatistiek - User contributions [en]</title>
	<link rel="self" type="application/atom+xml" href="https://wikibiostatistiek.amsterdamumc.org/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Rebecca+Holman"/>
	<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/Special:Contributions/Rebecca_Holman"/>
	<updated>2026-04-30T02:13:12Z</updated>
	<subtitle>User contributions</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Multivariabele_regressie&amp;diff=2709</id>
		<title>Multivariabele regressie</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Multivariabele_regressie&amp;diff=2709"/>
		<updated>2020-07-24T13:09:22Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor= &lt;br /&gt;
}}&lt;br /&gt;
Bij een multivariabele regressie worden er meerdere voorspellers tegelijkertijd gerelateerd aan de uitkomstmaat. Vaak wordt een multivariabel regressiemodel gebruikt om te corrigeren voor mogelijke confounders.&lt;br /&gt;
&lt;br /&gt;
== Hoe interpreteer ik een verschillende uitkomst in een univariabel en multivariabel model? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voor een van mijn studies heb ik een logistische regressie analyse gedaan. Mijn outcome is een dichotome variabele: 1 is verbetering 0 is geen verbetering. Vervolgens wil ik weten of leeftijd en bepaalde genetische afwijkingen wel of geen invloed op die outcome hebben. Als ik alleen leeftijd toevoeg aan mijn model komt deze als zeer zeer significant uit de bus. Als ik daar dan vervolgens de genetische variabelen aan toevoeg, verdwijnt de significantie van age als predictor (p=0.054) en zijn alleen de genetische variabelen significante predictoren. Mijn vraag is nu, hoe moet ik dit interpreteren? &lt;br /&gt;
&lt;br /&gt;
Als een variabele in je multivariabele model niet significant is, dan betekent het dat deze geen significante associatie heeft met de uitkomstmaat, rekeninghoudend met het effect van de andere variabelen die op dat moment in je model zitten (dus conditioneel op die variabelen). Bij jou lijkt het er op dat het effect leeftijd gecorrigeerd voor de andere covariaten geen significant effect (bij een signniveau van 5%) heeft op de uitkomstmaat. Dit kan door twee zaken beïnvloed worden. Of de andere covariaten vagen het effect van leeftijd weg, of er is niet genoeg data om het effect van leeftijd als significant te bestempelen. Ook al is het conditionele (gecorrigeerd in een multivariabel model) verband even groot als het onconditionele (univariabel model), dan nog is vaak de precisie van het conditionele model minder groot (bredere [[betrouwbaarheidsinterval|betrouwbaarheidsintervallen]]), doordat men in een model meerdere verbanden schat en daardoor minder kracht heeft effecten aan te wijzen. Door niet alleen naar de p-waarde, maar ook naar het confidence interval te kijken, ben je iets minder afhankelijk van de harde (maar willekeurige) 5% grens.&lt;br /&gt;
&lt;br /&gt;
== Hoeveel variabelen mag ik meegeven aan mijn model? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil graag een multivariabele logistische analyse doen voor de risicofactoren voor obesitas binnen een patientengroep. Hoeveel variabelen (risicofactoren) mag ik testen op 893 patienten? &lt;br /&gt;
&lt;br /&gt;
Een vuistregel is dat bij [[logistische regressie]] het aantal parameters in een multivariabel model maximaal 5% tot 10% mag zijn van het minimum van het aantal mensen met en zonder obesitas (event) in je sample. Dus als je 300 met en 593 zonder obesitas hebt, mag je max 15 tot 30 parameters in je model opnemen. Ik spreek hier over parameters, niet over variabelen, omdat bijv. een categorische variabele met 3 categorieen 2 extra parameters in je model geeft.&lt;br /&gt;
Bij [[logistische regressie]] heb je per parameter dus minimaal 10, maar het liefst ten minste 20 of 30, &#039;events&#039; nodig. Bij minder &#039;events&#039; kunnen de schattingen van de parameters misleidend zijn. Hierbij tel je het uitkomst dat het minst vaak voorkomt als event. Stel je hebt een onderzoek waarbij 285 van de 300 patienten overlijdt en 15 niet. Dan zijn er 15 &#039;events&#039;. &lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1016/S0895-4356(96)00236-3 Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR. A simulation study of the number of events per variable in logistic regression analysis. &#039;&#039;J Clin Epidemiol&#039;&#039;. 1996 Dec;49(12):1373-9.]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Bij een [[lineaire regressie|lineair regressie model]] luidt de vuistregel dat het aantal parameters max 5% tot 10% mag zijn van het totaal aantal gebruikte observaties mag zijn, oftewel minimaal 10 a 20 patienten per variabele. Deze suggestie wordt oa gedaan in het boek van Harrel &amp;lt;cite&amp;gt;[Harrel]&amp;lt;/cite&amp;gt;. Wanneer je een meer nauwkeurige schatting van het benodigd aantal voorspellers wilt hebben, dan zul je een inschatting moeten doen van de verwachte sterkte van de voorspellers, zie ook de suggesties in twee andere posts op deze wiki: &lt;br /&gt;
*[[Poweranalyse#Welke_informatie_heb_ik_nodig_voor_een_poweranalyse_als_ik_een_multivariabele_lineaire_regressie_ga_doen.3F|poweranalyse voor een multiariabel lineair regressiemodel]] en &lt;br /&gt;
*[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F|poweranalyse bij een predictiemodel]].&lt;br /&gt;
&lt;br /&gt;
== Hoe kies ik welke variabelen ik meeneem in mijn multivariabele model? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb 90 patienten waarbij ik baseline parameters heb verzamled (9 lab parameters en 13 klinische parameters). Met een non-parameterische test heb ik gevonden dat 1 lab parameter en enkele klinische parameters verschillend zijn tussen beide uitkomst groepen (=diagnose wel/niet na 2 jaar). Nu wilde ik kijken welke parameters het beste voorspellend zijn voor uitkomst. Ik heb backward logistische regressie gedaan met de parameters die eerder een significant verschil lieten zien, maar ik weet niet zeker of dit de beste keuze is. Mogelijk moet het anders of moeten er meer parameters in of moeten parameters gecombineerd worden?&lt;br /&gt;
&lt;br /&gt;
In jouw geval waarin je 90 patienten hebt en het effect van 21 (9+13) variabelen wilt testen, heb je niet genoeg patienten om al deze variabelen in 1 multivariabel model te testen (hetgeen natuurlijk het mooist zou zijn). Er moet dus een keuze gemaakt worden welke variabelen meegegeven gaan worden in een multivariabel model. Er bestaat geen consensus over de beste wijze om variabelen te selecteren, maar de keuze maak je altijd op basis van twee criteria:&lt;br /&gt;
*1. Van welke variabelen verwacht ik een effect / welke variabelen vind ik relevant?&lt;br /&gt;
*2. Voor welke variabelen geeft de data aan dat er een effect zou kunnen optreden (welke wijst het model als significant aan)?&lt;br /&gt;
Wat jij hebt gedaan is een soort univariabele preselectie van variabelen, waarbij je de variabelen eerst los test en degene die daar significant uitkomen meegeeft in een multivariabel model. Hoewel er methodologische nadelen te noemen zijn van deze aanpak, is het een veel gebruikte. Hierbij probeer je vraag 2 te beantwoorden. Je beschrijft echter dat je deze preselectie op basis van een niet-parametrische toets hebt gedaan, en dus niet op basis van hetzelfde (logistische?) model als waarin je de multivariabele analyse hebt gedaan. Als je hetzelfde model gebruikt, zou het de analyse consistenter maken. Verder is het zaak om bij de preselectie niet te streng te zijn met afwijzing. Een p-waarde van 0,10 of 0,20 zou hiervoor aangehouden kunnen worden. Je uiteindelijke conclusies zullen gebaseerd zijn op het multivariabele model waar je wel met een gebruikelijke strenge p-waarde kunt rekenen.&lt;br /&gt;
Kijk ook nog eens kritisch naar de variabelen in het kader van vraag 1. Het combineren van variabelen ten slotte is ook een goede manier om het aantal te testen variabelen te verkleinen.&lt;br /&gt;
&lt;br /&gt;
== Ik heb backwards selection gebruikt - hoe interpreteer ik mijn resultaten? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik ben bezig met een onderzoek naar welke variabelen van invloed zijn op een tumorbiopsie-uitkomst (wel of geen diagnose). Hiervoor heb ik een aantal parameters (bijv. tumorgrootte, lokatie van de tumor, in welke mate de tumor uitstulpt etc) genomen waarvan ik verwacht dat ze van invloed zijn. Ik heb er een backward multiple regressie op los gelaten en krijg hier ook wel resultaten uit, maar weet niet zo goed hoe ik die moet interpreteren.&lt;br /&gt;
&lt;br /&gt;
De output vertelt welke factoren in het uiteindelijke model samenhangen met de uitkomst. Je ziet in de ouput de p waarde en een richtingscoefficient B met standaard error (SE (B)). Deze richtingscoefficient geeft aan hoe groot het effect is. Als je stapsgewijs variabelen uit je model haalt die niet significant bijdragen aan je model (zoals jij dat hebt gedaan), hou je uiteindelijk de variabelen over die dus significant geassocieerd zijn met je uitkomst, terwijl je corrigeert voor de andere variabelen in je model. Als je nog verder zou willen gaan kun je er ook voor kiezen om forward te doen en kijken of dan dezelfde variabelen samenhangen met je uitkomst.&lt;br /&gt;
&lt;br /&gt;
== Hoe kan ik het best mijn variabelen selecteren, dmv handmatige selectie of met een automatische procedure? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Er zijn verschillende methode voor het doen van een multivariabele regressie. Ik wil een backwards selectiestrategie aanhouden. Wat is aan te raden? Een handmatig procebure met enter selection, waar bij je handmatig de variabele met de hoogtste p waarde verwijdert tot er een set variabelen overblijft die allemaal significant zijn, of een automatische backward procedure?&lt;br /&gt;
&lt;br /&gt;
Ik adviseer de handmatige manier, omdat je daarmee zelf de stappen in de hand hebt, je data leert kennen, en kunt bijsturen waar nodig. Doorgaans wil je niet dat belangrijke selecties door een ‘machine’ gebeuren, je wilt kunnen bemerken daar waar juist zeer relevant geachte variabelen eruit gaan en ook daar waar mogelijk sprake is van [[Multivariabele_regressie#Er_is_overlap_tussen_twee_van_onze_voorspellers.2C_mogen_deze_samen_in_een_multivariabel_model.3F|colineariteit]] etc.&lt;br /&gt;
 &lt;br /&gt;
De enige reden om voor automatisch te gaan is dat daarbij vaak ook na exclusie van een variabele de set van reeds afgevallen voorspellers opnieuw een voor een aangeboden wordt aan het kleinere model om te zien of ze nu wel sign bijdragen. Uiteraard kun je dit ook handmatig doen, maar dat is wat veel werk. Een mooie combi is het eerst handmatig te doen en daarna ter controle nog eens automatisch.&lt;br /&gt;
&lt;br /&gt;
== Hoe rapporteer ik de resultaten van mijn multivariabele model? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voor een vragenlijstonderzoek betreffende kwaliteit van leven heb ik in de analyse lineaire regressie gedaan met forward selection. In het uiteindelijke model zijn er variabelen met een niet-significante p-waarde. Als je een tabel maakt van de variabelen in het uiteindelijke model, zouden jullie die dan sorteren op grootte van de beta, op significantie van de p-waarde of op grootte van de verklaarde variantie? Of zouden jullie gewoon de output van SPSS overnemen?&lt;br /&gt;
&lt;br /&gt;
Er zijn geen vaste regels voor de volgorde waarin je variabelen in een tabel zet. Er zou bijvoorbeeld hierarchie in de variabelen kunnen zitten, of chronologische volgorde (bijvoorbeeld eerst leeftijd en geslacht en pas later de invloed van roken oid). Het is wel helder om alle variabelen van je uiteindelijke model (dus ook niet significante) te laten zien, dan kan een lezer zien naast welke andere voorspellers de variabelen beoordeeld zijn.&lt;br /&gt;
&lt;br /&gt;
== Hoe selecteer ik mbv univariabele regressie factoren voor in een multivariabele regressie? == &lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Wij analyseren de verschillen in uitkomst (success rate) tussen twee operaties. We hebben eerst een aantal factoren los getest op invloed op success rate. Daarna de significante factoren overgebracht naar een multivariabele logistische regressie. Is dit een goede methodiek? &lt;br /&gt;
&lt;br /&gt;
Bij dergelijke &#039;univariabele preselectie&#039; is het methodologisch te prefereren om niet alleen variabelen die significant zijn in de univariabele analyse door te schuiven naar multivariabele, maar daarbij een meer coulante p-waarde aan te houden (bijv variabelen met univariabele p&amp;lt;0.20 of p&amp;lt;0.30).&lt;br /&gt;
&lt;br /&gt;
== Wanneer is het noodzakelijk om leeftijd en geslacht als covariaat mee te nemen in mijn analyses? ==&lt;br /&gt;
&#039;&#039;Ik doe oa. een [[t-toets#ongepaarde t-toets|independent sample t-test]] om het verschil op een afhankelijke variabele (continu) te bekijken tussen twee groepen en [[chi-kwadraat toets|Pearson Chi-Square analyses]] om het verschil op een afhankelijke variabele (dichotoom) te bekijken tussen twee groepen. &lt;br /&gt;
 &lt;br /&gt;
&#039;&#039;Nu heb ik wel bekeken of de twee groepen significant van elkaar verschillen qua leeftijd en geslacht. Dit is niet zo en om deze reden heb ik leeftijd en geslacht niet meegenomen in mijn verdere analyses. Is dit zo voldoende gegrond of moet je ook bekijken hoe het zit met de relatie tussen geslacht/leeftijd en de afhankelijke variabele? &lt;br /&gt;
&lt;br /&gt;
Uitgangspunt van meenemen zijn de volgende:&lt;br /&gt;
1. Als er een verschil in leeftijd/geslacht is in de twee groepen &amp;amp; leeftijd en geslacht hebben wel invloed op de uitkomstmaat, dan moet je ervoor corrigeren, want dan kan het tot bias leiden. &lt;br /&gt;
2. Als er een verschil in leeftijd/geslacht is in de twee groepen &amp;amp; leeftijd en geslacht hebben geen invloed op de uitkomstmaat, dan zal meenemen van de variabelen niet tot andere resultaten leiden en kun je dat dus net zo goed niet doen.&lt;br /&gt;
3. Als er geen verschil in leeftijd/geslacht is in de twee groepen &amp;amp; leeftijd en geslacht hebben geen invloed op de uitkomstmaat, dan zal meenemen van de variabelen niet tot andere resultaten leiden en kun je dat dus net zo goed niet doen.&lt;br /&gt;
4. Als er geen verschil in leeftijd/geslacht is in de twee groepen &amp;amp; leeftijd en geslacht hebben wel invloed op de uitkomstmaat, dan zal meenemen van de variabelen niet tot andere schattingen leiden voor de groepsvariabele, maar kan er wel een sterker model komen door rekening te houden met de extra factoren. Het significantieniveau van de groepsvariabele kan hierdoor wel veranderen, daarom wil je de variabelen het liefst wel meenemen in het model.&lt;br /&gt;
&lt;br /&gt;
Of de variabelen verschillen over de groepsvariabele kun je het beste in je eigen data bekijken (dit hoeft niet een significant verschil te zijn, dus een verschil is er al snel, in geval van een gerandomiseerde groepsverdeling kun je er meestal vanuit gaan dat er geen verschil is). Of er reden is om aan te nemen dat leeftijd en geslacht de afhankelijke variabele(n) beinvloeden, kun je het best op basis van (externe) kennis beoordelen. Als je goede redenen hebt om aan te nemen dat dat zo is, dan zou je ze (sowieso) mee kunnen nemen in een multivariabel model. Het zou namelijk kunnen dat die invloed er wel is, maar dat je die in jouw eigen data toevallig niet terugvindt.&lt;br /&gt;
&lt;br /&gt;
Voorwaarde voor meenemen van extra covariaten is wel dat je voldoende data hebt om zo&#039;n extra term in het model op te kunnen nemen (qua power). Als je niet voldoende ruimte hebt in de data, dan zou je de variabelen leeftijd en geslacht minder &#039;graag&#039; willen meenemen. Je kunt dan een &#039;voorselectie&#039; doen en in je eigen data kijken of er reden is om ze mee te nemen. Bijvoorbeeld door toch weer naar de invloed in je eigen data te kijken:&lt;br /&gt;
1. kijken of ze verschillen over de 2 groepen (zoals jij gedaan hebt) &lt;br /&gt;
2. kijken of ze (univariabel) invloed hebben op de uitkomstmaat.&lt;br /&gt;
Zie hierbij ook de voorgaande vraag over [[multivariabele regressie#Hoe selecteer ik mbv univariabele regressie factoren voor in een multivariabele regressie.3F|preselectie]].&lt;br /&gt;
&lt;br /&gt;
== Hoe kies ik welke variabelen ik in mijn model moet meenemen? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb een databestand met een heleboel variabelen. Ik ben op zoek naar een zo eenvoudig mogelijk (en dus makkelijk toepasbaar) voorspellend model. Hoe kies ik welke variabelen ik in mijn model moet meenemen?&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Er zijn veel verschillende manieren om een multivariabele model te bouwen. We geven hier een voorbeeld van een eenvoudige procedure. Deze procedure is toepasbaar op verschillende vormen van regressie analyse. &lt;br /&gt;
* &#039;&#039;&#039;Stap 1&#039;&#039;&#039;. Voer een reeks regressie analyses uit, waarbij je steeds een verklarende variabel tegelijk meeneemt. Noteer bij elke analyse de p-waarde van de verklarende variabel in de regressie analyse.&lt;br /&gt;
* &#039;&#039;&#039;Stap 2&#039;&#039;&#039;. Neem alle variabelen die in stap 1 een p-waarde kleiner dan 0.3 hebben. Voer een regressie analyse met deze variabelen allemaal tegelijk. &lt;br /&gt;
* &#039;&#039;&#039;Stap 3&#039;&#039;&#039;. Verwijder de variabel uit stap 2 met de grootste p-waarde en voer de regressie analyse opnieuw uit.&lt;br /&gt;
* &#039;&#039;&#039;Stap 4&#039;&#039;&#039;. Herhaal stap 3 totdat alle variabelen die nog in het model zijn een p-waarde kleiner dan 0.05 hebben. &lt;br /&gt;
* &#039;&#039;&#039;Stap 5&#039;&#039;&#039;. Als alle variabelen een p-waarde kleiner dan 0.05 hebben, heb je je uiteindelijke model. Je kunt dit model verder in je manuscript beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Er is overlap tussen twee van onze voorspellers, mogen deze samen in een multivariabel model? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;We zijn op zoek naar voorspellende factoren voor het optreden van hepatitis A. We hebben verschillende factoren univariaat getoetst (leeftijd, geslacht, comorbiditeit, etc). Nu vonden we in de univariate analyse dat &amp;quot;man&amp;quot; vs. &amp;quot;vrouw&amp;quot; positief geassocieerd was met de uitkomstmaat en dat &amp;quot;comorbiditeit&amp;quot; negatief geassocieerd was (getoetst met een [[Chi-kwadraat toets]]). In de groep &amp;quot;zonder comborbiditeit&amp;quot; zitten veel mannen en in de groep &amp;quot;met comorbiditeit&amp;quot; zitten veel vrouwen, er is dus enige overlap in de groepen. Is het mogelijk om beide voorspellende factoren in een multivariabele logistische regressie te stoppen, of moeten wij daarvoor eerst bv. de mate van overlap toetsen omdat het model anders instabiel wordt?&lt;br /&gt;
&lt;br /&gt;
De mate van overlap tussen de twee voorspellers mag inderdaad niet te hoog zijn, dan zal het model zoals je zegt instabiel worden. Dat wordt het probleem van colineariteit genoemd. Het is goed om daar eerst naar te kijken, al zijn er geen harde grenzen aan te geven voor wanneer de overlap te groot is. Wat wel eens gehanteerd wordt is dat de [[correlatie|correlatiecoefficient]] tussen de twee voorspellers niet hoger mag zijn dan 0.8. Wanneer het model instabiel wordt, zul je dat zien aan zeer grote standaard errors van de regressiecoefficienten. Je kunt in SPSS ook handig gebruik maken van de optie &#039;Colinearity Diagnostics&#039; te vinden onder &#039;Statistics&#039; bij de [[Lineaire_regressie#Waar_vind_ik_lineaire_regressie_in_SPSS.3F|lineare regressie]] procedure. Je doet dan net alsof je een lineaire regressie wilt doen, vraagt om deze diagnostics en kijkt dan in de output alleen naar dat gedeelte om te beoordelen of de voorspellers niet te veel overlap bevatten.&lt;br /&gt;
&lt;br /&gt;
== Hoe moet ik corrigeren voor baseline waardes? ==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Wij doen een onderzoek naar het voorspellers van fysiek functioneren na totale heup prothesen. Onze uitkomst maat van fysiek functioneren, HOOS (Hip disability and Osteoarthristis Outcome Score), drukt de functie uit op een schaal van 0-100 gemeten op de baseline en na 2 jaar. De volgende regressies met als voorspeller leeftijd en als afhankelijke variabele de HOOS zijn gedaan.&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;1: uitkomst HOOS absolute uitkomst op 2 jaar, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503&lt;br /&gt;
*&#039;&#039;2: uitkomst HOOS verschil score tussen 2 jaar en baseline, predictoren leeftijd + baseline HOOS, p-waarde voor leeftijd: 0.503&lt;br /&gt;
*&#039;&#039;3. uitkomst HOOS verschil score tussen 2 jaar en baseline, predictor leeftijd (ongecorrigeerd), p-waarde voor leeftijd: 0.048&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Zoals u ziet is er een verschil in significantie afhankelijk van de correctie voor baseline. Welke uitkomst moet ik gebruiken?&lt;br /&gt;
&lt;br /&gt;
Een waarschijnlijke verklaring van jouw uitkomsten is dat de correlatie tussen leeftijd en HOOS score op baseline de schijnbare significantie in model 3 veroorzaakt. In het algemeen is het aan te raden de baseline score als covariaat mee te geven in het model, zie ook de [[Multivariabele_regressie#Referenties|EMA Guideline on adjustment for baseline covariates (draft April 2013)]], paragraaf 4.2.6, daar staat ook de te verwachten overeenstemming van model 1 en 2 genoemd.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Harrel Regression Modeling Strategies with Applications to Linear Models, Logistic Regression and Survival Analysis. Frank E. Harrell, Jun, Springer-Verlag, New York, 2001. No. of pages: 568. ISBN 0-387-95232-2.&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
*[http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500003639.pdf EMA Points to consider on adjustment for baseline covariates (final 2003)]&lt;br /&gt;
*[http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2013/06/WC500144946.pdf EMA Guideline on adjustment for baseline covariates (draft April 2013)]&lt;br /&gt;
&lt;br /&gt;
*[http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2014/02/WC500160523.pdf EMA Guideline on the investigation of subgroups in confirmatory clinical trials (draft Feb 2014)]&lt;br /&gt;
&lt;br /&gt;
*[http://www.ncbi.nlm.nih.gov/pubmed/15184705 What you see may not be what you get: a brief, nontechnical introduction to overfitting in regression-type models, Babyak M.A., Psychosom Med. 2004 May-Jun;66(3):411-21]&lt;br /&gt;
&lt;br /&gt;
*[http://www.ncbi.nlm.nih.gov/pubmed/21030068 Everything You Always Wanted to Know About Evaluating Prediction Models (But Were Too Afraid to Ask)] Andrew J. Vickers and Angel M. Cronin, Urology Volume 76, Issue 6, December 2010, Pages 1298-1301. &lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2708</id>
		<title>Mixed effects modellen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2708"/>
		<updated>2020-07-09T13:06:11Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
&lt;br /&gt;
Mixed models kunnen op meerdere manieren gespecificeerd worden. Het is zinvol om een onderscheid te maken tussen &lt;br /&gt;
#onderzoeken waarbij alle patienten op (min of meer) dezelfde tijdstippen (of onder dezelfde condities) herhaald worden gemeten, en&lt;br /&gt;
#onderzoeken waarin het aantal herhaalde metingen per patient en/of de tijdstippen en condities verschillen tussen patienten.&lt;br /&gt;
&lt;br /&gt;
====Situatie 1: herhaalde metingen op dezelfde momenten====&lt;br /&gt;
&lt;br /&gt;
Als alle patienten op dezelfde tijdstippen (onder dezelfde condities) zijn gemeten, kan het mixed-model gezien worden als een uitbreiding van een standaard [[lineaire regressie| lineair model]]. In formulevorm ziet de uitbreiding van het standaard model er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = a + b \times X_{i,t} + \epsilon_{i,t}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij &amp;lt;math&amp;gt;Y_{i,t}&amp;lt;/math&amp;gt; de meting van de &amp;lt;math&amp;gt;i^{de}&amp;lt;/math&amp;gt; patient is op het &amp;lt;math&amp;gt;t^{de}&amp;lt;/math&amp;gt; tijdstip (conditie); &amp;lt;math&amp;gt;X_{i,t}&amp;lt;/math&amp;gt; is de meting van de covariaat op dat moment en &amp;lt;math&amp;gt;\epsilon_{i,t}&amp;lt;/math&amp;gt; is de afstand (of: &#039;&#039;residu&#039;&#039;) van de datapunten tot de [[lineaire regressie#Hoe werkt (enkelvoudige) lineaire regressie?|regressielijn]]. Bij een standaard [[lineaire regressie]] zijn al deze residuen onafhankelijk van elkaar, maar bij herhaalde metingen is dat niet per se het geval. Namelijk, als het eerste datapunt van een patient (ver) boven (of onder) de lijn ligt, is het goed voorstelbaar dat volgende datapunten van dezelfde persoon ook boven (of onder) de regressielijn zullen liggen. Anders geformuleerd: datapunten van dezelfde persoon lijken meer op elkaar dan op datapunten van andere personen. &lt;br /&gt;
Bij een mixed model wordt rekening gehouden met de [[correlatie|correlaties]] tussen de residuen van metingen bij dezelfde patient. Dit kan op verschillende manieren en moet door de gebruiker worden gespecificeerd. Veel voorkomende correlatiestructuren zijn:&lt;br /&gt;
*compound symmetry, waarbij aangenomen wordt dat de correlaties tussen alle residuen van dezelfde persoon gelijk zijn. De eerste en de tweede meting van een persoon hangen dus even sterk met elkaar samen als de eerste en de laatste meting van die persoon;&lt;br /&gt;
*unstructured, waarbij geen enkele aanname wordt gemaakt over de correlaties. Iedere correlatie tussen twee tijdspunten wordt los van de anderen bepaald;&lt;br /&gt;
&lt;br /&gt;
Er zijn nog diverse andere opties en de beste keuze hangt af van het type onderzoek en het aantal herhaalde metingen. Er zijn statistische maten die je helpen bij het maken van de keuze. Vaak wordt hiervoor de Akaike Information Criterium (AIC) gebruikt. Dit is een maat voor hoe goed het gekozen model past bij de data. Hoe lager de AIC, hoe beter het model past.&lt;br /&gt;
&lt;br /&gt;
Deze eerste soort uitbreiding van het standaard lineaire model wordt ook wel &#039;Generalized Least Squares Model&#039; genoemd.&lt;br /&gt;
&lt;br /&gt;
====Situatie 2: herhaalde metingen op verschillende momenten====&lt;br /&gt;
&lt;br /&gt;
Als het aantal herhaalde metingen per patient en/of de tijdstippen (condities) waarop er gemeten wordt verschillen tussen patienten, ligt het voor de hand om het [[lineaire regressie|lineaire model]] op een andere wijze uit te breiden. In situatie 1 werd de correlatie tussen meetpunten op verschillende tijdstippen direct gemodelleerd. Als er niet op vaste tijdstippen gemeten wordt, is dit niet logisch. De afhankelijkheid van metingen bij eenzelfde patient kan ook gemodelleerd worden met zogenaamde random effects. Met random effects wordt een inschatting gemaakt van de afwijking die metingen van eenzelfde patient hebben ten opzichte van de regressielijn. Hierbij maakt het niet uit hoe vaak en op welke tijdstippen een patient gemeten is; al zijn metingen worden verondersteld een vaste afwijking van de &#039;gemiddelde&#039; regressielijn te hebben. In formulevorm ziet dit er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = (a+ \alpha_i) + (b+\beta_i) \times X_{i,t}  + \epsilon_{i,t} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij de nu toegevoegde &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; de specifieke afwijkingen van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt;  t.o.v. de regressielijn voorstellen. De &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; is de afwijking van de intercept van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|intercept]] &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;. De &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; is de afwijking van de [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|helling]] (&#039;&#039;slope&#039;&#039;) van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde helling &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; van de regressielijn. De &amp;lt;math&amp;gt;\alpha&#039;s&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta&#039;s&amp;lt;/math&amp;gt; worden niet direct geschat, in plaats daarvan wordt verondersteld dat zij normaal verdeeld zijn met gemiddelde 0. De standaard deviaties van deze verdelingen worden geschat. &lt;br /&gt;
De specificaties van de random effects kunnen nog uitgebreid worden en de fit van het model wordt gekwantificeerd met bijvoorbeeld de AIC. Ook hier geldt: het model met de laagste AIC past het beste bij de data.&lt;br /&gt;
&lt;br /&gt;
Deze tweede soort modellen wordt vaak aangeduid als &#039;Random Effect Models&#039;.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik linear mixed models in SPSS?==&lt;br /&gt;
Je vindt de linear mixed models in SPSS 16 onder Analyze-&amp;gt;Mixed models-&amp;gt;Linear. T/m [[statistische software#SPSS|SPSS 18]] is er alleen nog een mixed model beschikbaar voor continue (normaal verdeelde) uitkomsten. Vanaf [[statistische software#SPSS|SPSS 19]] biedt SPSS ook procedures aan voor andere typen uitkomsten zoals dichotome variabelen. Deze vind je onder Analyze -&amp;gt; Mixed Models -&amp;gt; Generalized. In andere pakketten zoals [[statistische software#R|R]] (package &#039;nlme&#039; en package &#039;lme4&#039;), Stata ([http://www.gllamm.org GLAMM]) en [[statistische software#SAS|SAS]] zijn er ook mixed modellen beschikbaar voor verschillende typen uitkomstmaten.&lt;br /&gt;
&lt;br /&gt;
Let op: om een mixed model in SPSS te kunnen draaien moeten de data onder elkaar gestructureerd staan, waarbij iedere meting op een rij staat en er meerdere rijen zijn die bij dezelfde patient horen. In deze [http://www.spss.ch/upload/1126184451_Linear%20Mixed%20Effects%20Modeling%20in%20SPSS.pdf SPSS handleiding] staat stap voor stap beschreven hoe data te restructureren is in het gewenste format voor mixed models. Als er drie herhaalde metingen van drie patienten zijn, ziet het resultaat er bijvoorbeeld zo uit:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! metingnr !! meting&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
De hierboven beschreven &#039;situatie 1&#039; modellering gebeurt in SPSS middels het specificeren van de &#039;Repeated&#039; (+bijbehorende repeated covariance type) in het eerste panel van de mixed procedure. De in &#039;situatie 2&#039; besproken modellering wordt gespecificeerd onder de &#039;Random...&#039; knop (let op: random intercept staat by default uit, bij covariance type kan correlatie tussen de random effects gespecificeerd worden). Vaak is het gebruik van 1 van beide opties (danwel repeated danwel random) voldoende om de correlatie in de data op te vangen. Gebruik maken van beide opties kan wel, maar zal soms leiden tot overbodige parameters.&lt;br /&gt;
&lt;br /&gt;
==Hoe analyseer ik met een mixed model een effect in de tijd?==&lt;br /&gt;
&#039;&#039;Ik onderzoek een groep patienten die een operatie hebben ondergaan. We zijn geinteresseerd in de pijnscore (VAS) op verschillende tijdsmomenten na de operatie. De verwachting is (uiteraard) dat de pijn direct na de operatie heviger is dan bijv. 3 mnd daarna (dit klopt ook als je de data in een barplot zet). In eerste instantie heb ik de ANOVA for repeated measures gebruikt om te analyseren of de pijn significant verandert in de tijd. Maar, omdat ik een aantal missing data heb, heb ik ook geprobeerd een mixed models analyse (hier mijn [[Media:voorbeeld_mixed_model_spss.doc|syntax]]) te doen. Mijn vragen hierover:  &lt;br /&gt;
&lt;br /&gt;
&#039;&#039;1. Heb ik de juiste covariance structure gebruikt? (nl. AR1)&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;2. Ik heb &#039;tijd&#039; als fixed effect genomen omdat de afname van de VAS op specifieke tijdsmomenten gebeurde, klopt dat?&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;3. Hoe geef de resultaten van deze mixed analyse weer?&lt;br /&gt;
&lt;br /&gt;
1. Of AR(1) de beste is is niet zo te zeggen, dat hangt af van de correlatie tussen de tijdsmomenten in jouw data. Je kunt bijvoorbeeld alle mogelijke structuren draaien en dan degene met de kleinste AIC te kiezen (smaller is better zoals er ook onder staat). &lt;br /&gt;
&lt;br /&gt;
2. Tijd is hier inderdaad een fixed variable, want je wilt hier de hypothese toetsen of er een verandering in de tijd is.&lt;br /&gt;
&lt;br /&gt;
3. In de output vind je onder &amp;quot;fixed effects&amp;quot; een B die aangeeft wat het effect is per tijdspunt (tov het startpunt) en een bijbehorende p-waarde. Dit is de toets die je waarschijnlijk wilt rapporteren. Onder het kopje &amp;quot;mean estimates&amp;quot; vind je de schatting van het model voor de gemiddelde VAS waarde op ieder tijdpunt. Deze mean estimates zijn voor een lezer makkelijker te interpreteren dan de B&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Wat is het verschil tussen een mixed model en een GEE model?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb een mixed model gebruikt omdat ik wil corrigeren voor de familieverbanden tussen mijn patienten. In een paper met een soortgelijke analyse zie ik echter dat er een GEE model is gebruikt. Welke moet ik hebben en wat is het verschil?&lt;br /&gt;
&lt;br /&gt;
Beide modellen, een mixed model en een GEE model, kunnen corrigeren voor familieverbanden (of andere herhaalde metingen structuren). Een GEE (generalized estimation equations), ook wel genoemd marginaal model, negeert de correlaties tussen de herhaalde metingen in dezelfde familie, maar corrigeert de [[standaardfout/standard error|standaardfouten]] van de regressie coëfficiënten door robuuste [[standaardfout/standard error|standaardfouten]] te berekenen. Een mixed model, ook wel conditioneel model, of ook wel random-effects model modelleert de correlaties tussen de herhaalde metingen in dezelfde familie door een random-effect per familie in het model te includeren. De herhaalde metingen in een familie hebben die random-effects parameter gezamenlijk en dat maakt dat die metingen correleren. De volgende pagina van [http://www.theanalysisfactor.com/extensions-general-linear-model/ The analysis factor]  geeft een helder overzicht van de overeenkomst/verschillen tussen verschillende modellen die je kunt gebruiken voor herhaalde metingen.&lt;br /&gt;
&lt;br /&gt;
==Hoe wordt gebruikelijk een linear mixed model gerapporteerd in een artikel?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Het valt me op dat hier maar weinig over te vinden is op Pubmed, en als er al wat is, is het heel wisselend. Ik heb bijvoorbeeld een artikel gevonden waarin ze alleen maar de Beta coefficient met bijbehorende p-waarde geven. Maar ik wil toch graag ook wel de mean (±SD) weergeven. Is het gebruikelijk dat per cluster te doen? Of bijvoorbeeld toch een mean (±SD) per groep?&lt;br /&gt;
&lt;br /&gt;
Je zou de ruwe data (mean +sd) kunnen presenteren voor iedere groep. Hier is de (cluster)correctie van het mixed model echter nog niet in meegenomen. Alternatief kun je de estimated marginal means (+ conf interval) uit het model per groep rapporteren, deze zijn &#039;gecorrigeerd&#039; voor de clusters/correlaties. Deze kun je ook opvragen in SPSS.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 deze paper] bij continue uitkomsten. En [https://doi.org/10.1155/2016/7329158 deze paper] bij ordinale uitkomsten.&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Template:Onderschrift&amp;diff=2707</id>
		<title>Template:Onderschrift</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Template:Onderschrift&amp;diff=2707"/>
		<updated>2020-06-03T12:08:33Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amsterdamumc.nl) ondersteuning aanvragen. Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2706</id>
		<title>Wiki Statistiek</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2706"/>
		<updated>2020-06-03T12:05:12Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:0px;margin-bottom:15px;background-color:#D1DAEB;font-size:120%;font-weight:bold;border:1px solid #faf5ff;text-align:left;color:#000;padding:0.2em 0.4em;&amp;quot;&amp;gt;&amp;lt;font color=&amp;quot;black&amp;quot;&amp;gt;&amp;lt;big&amp;gt;&#039;&#039;&#039;Welkom op de wiki biostatistiek van het [https://www.amc.nl/ Amsterdam UMC, locatie AMC.]&#039;&#039;&#039;&amp;lt;/big&amp;gt;&amp;lt;/font&amp;gt;&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In deze wiki worden antwoorden gegeven op veelgestelde vragen over statistiek in medisch onderzoek. Start uw zoektocht langs een van onze twee overzichtspagina&#039;s:&lt;br /&gt;
&lt;br /&gt;
*Via het &#039;&#039;&#039;[[OVERZICHT]]&#039;&#039;&#039; ziet u snel alle statistische onderwerpen op deze wiki.  &lt;br /&gt;
&lt;br /&gt;
*Op de pagina &#039;&#039;&#039;[[KEUZE TOETS]]&#039;&#039;&#039; kunt u kijken welke toets of analyse geschikt is voor uw data.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt; &lt;br /&gt;
&#039;&#039;&#039;Populaire pagina&#039;s&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;1&#039;&#039;&#039; || [[poweranalyse|Poweranalyse]]             || &#039;&#039;&#039;6&#039;&#039;&#039; || [[Cohen&#039;s kappa]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;2&#039;&#039;&#039; || [[lineaire regressie|Lineaire regressie]] || &#039;&#039;&#039;7&#039;&#039;&#039; || [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;3&#039;&#039;&#039; || [[herhaalde metingen|Herhaalde metingen]] || &#039;&#039;&#039;8&#039;&#039;&#039; ||[[Randomiseren]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;4&#039;&#039;&#039; || [[Logistische regressie]]                || &#039;&#039;&#039;9&#039;&#039;&#039; || [[Chi-kwadraat toets]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;5&#039;&#039;&#039; || [[t-toets|T-toets]]                 || &#039;&#039;&#039;10&#039;&#039;&#039; || [[Intraclass correlatie coefficient]]&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Laatste toevoegingen:&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;[[Systematische_reviews | De methodologie van systematische reviews]]&lt;br /&gt;
*&#039;&#039;[[Mann-Whitney_U_toets#Welke_effectmaat_kan_ik_rapporteren_als_ik_een_Mann-Whitney_U_toets_doe.3F | Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoe_bereken_ik_de_steekproefgrootte_voor_een_studie_met_.C3.A9.C3.A9n_groep.2C_waarbij_de_uitkomst_een_proportie_is.3F | Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?]]&lt;br /&gt;
*&#039;&#039;[[KEUZE_TOETS#Hoe_ga_ik_ermee_om_als_ik_veel_waarden_onder_of_boven_een_detectielimiet_heb.3F | Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F | Hoeveel patienten heb ik nodig om een predictie model te bouwen?]]&lt;br /&gt;
*&#039;&#039;[[T-toets#Wanneer_kunnen_we_gelijke_varianties_aannemen_in_de_t-toets.3F | Wanneer kunnen we gelijke varianties aannemen in de t-toets?]]&lt;br /&gt;
*&#039;&#039;[[Fisher%27s_exact_toets#Kan_ik_Fisher.27s_exact_toets_ook_bij_grotere_steekproeven_gebruiken.3F | Kan ik Fisher&#039;s exact toets ook bij grotere steekproeven gebruiken?]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&#039;&#039;&#039;Over de wiki biostatistiek&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de help desk statistiek van het Amsterdam UMC, locatie AMC. Medewerkers van het Amsterdam UMC, locatie AMC, kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amsterdamumc.nl) ondersteuning aanvragen.  Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Poweranalyse&amp;diff=2698</id>
		<title>Poweranalyse</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Poweranalyse&amp;diff=2698"/>
		<updated>2020-01-29T15:33:31Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Jan Binnekade|dr. J.M. Binnekade]]&lt;br /&gt;
|coauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
Een power analyse berekent het benodigd aantal proefpersonen (sample size) van een studie om een vooraf gedefinieerd minimaal klinisch relevant verschil met een bepaalde kans (power) waar te nemen.&lt;br /&gt;
&lt;br /&gt;
==Waarom doe ik een power analyse of steekproefgrootte berekening?==&lt;br /&gt;
Een van de meest gestelde vragen vooraf aan een studie is: hoeveel patiënten, proefpersonen of proefdieren heb ik in deze studie nodig? Een belangrijke vraag; een verkeerde steekproefgrootte kan ethische bezwaren opleveren. Een onderschatting van de steekproefgrootte kan er toe leiden dat een werkelijk effect niet door de studie gedetecteerd wordt en deelnemers dus voor niets zijn getest. De studie zal dan tot een fout negatieve conclusie leiden. Een te grote steekproefgrootte kan ook tot bezwaren leiden. Als de interventie effectief blijkt, worden er onnodig veel deelnemers in de controlegroep behandeld. Als de interventie niet werkzaam blijkt, worden te veel deelnemers blootgesteld aan een ineffectieve interventie &amp;lt;cite&amp;gt;[jones2003 , florey1993]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Wanneer heb ik een power analyse nodig?==&lt;br /&gt;
Voor de uitvoering en rapportage van (vergelijkend) onderzoek gelden regels. In het [http://www.consort-statement.org/ CONSORT statement], waarin je deze regels terug vindt, staat dat een onderzoeker voordat een studie wordt uitgevoerd een sample size moet berekenen en deze in de methode sectie van het artikel moet rapporteren. Een Randomized Controlled Trial (RCT) moet inclusief sample size berekening vooraf aan de uitvoering geregistreerd worden. Bovendien krijg je zonder een goede sample size berekening geen positieve beoordeling van de Medisch Ethische Commissie. Verder is het bij de economische onderbouwing van een subsidie aanvraag en voor de logistieke planning van een studie van belang.&lt;br /&gt;
&lt;br /&gt;
==Welke software is beschikbaar voor een power analyse?==&lt;br /&gt;
Voor het berekenen van de sample size is binnen het AMC het programma [[statistische software#nQuery Advisor|nQuery Advisor]] beschikbaar. nQuery is een gevalideerd en gebruikersvriendelijk programma waarmee je voor diverse onderzoeksdesigns en data typen de groepsgrootte en statistische power kunt berekenen. nQuery is in het AMC via de &#039;&#039;softwarewinkel&#039;&#039; in de CDW voor alle medewerkers beschikbaar. Voor meer geavanceerde onderzoeksdesigns hebben een beperkte aantal medewerkers van de CRU een licentie voor het programma PASS 15. &lt;br /&gt;
&lt;br /&gt;
Andere programma&#039;s die powerberekeningen aanbieden zijn bijvoorbeeld [[statistische software#SAS|SAS]] of [[statistische software#Stata|Stata]]. Op het internet zijn bovendien meerdere gratis power programma&#039;s beschikbaar, deze zijn echter niet altijd betrouwbaar.&lt;br /&gt;
&lt;br /&gt;
==Wat is de power van een studie?==&lt;br /&gt;
&lt;br /&gt;
In de studie proberen we te bepalen of de groepen hetzelfde zijn (nul hypothese) of verschillend zijn (alternatieve hypothese) &amp;lt;cite&amp;gt;[#park2010]&amp;lt;/cite&amp;gt;. We kunnen hierbij twee typen fouten maken: een type I fout (α) en een type II fout (β). We maken een type I fout als we ten onrechte de nul hypothese verwerpen (fout positief). We maken een type II fout als we ten onrechte de nul hypothese accepteren (fout negatief). De power van een studie is 1 - β. Het is dus 1 minus de kans op het ten onrechte accepteren van de nulhypothese. Grof gezegd is het de kans om een werkelijk effect in de populatie op te pikken in de studie.&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|&lt;br /&gt;
|&lt;br /&gt;
|colspan=&amp;quot;2&amp;quot; align=&amp;quot;center&amp;quot;|Totale populatie&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;left&amp;quot; |&lt;br /&gt;
|align=&amp;quot;center&amp;quot;|&lt;br /&gt;
|width=&amp;quot;120&amp;quot; align=&amp;quot;center&amp;quot;|werkelijk effect&lt;br /&gt;
H1 waar&lt;br /&gt;
|width=&amp;quot;120&amp;quot; align=&amp;quot;center&amp;quot;|werkelijk geen effect&lt;br /&gt;
H0 waar&lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot; align=&amp;quot;center&amp;quot;|Studie&lt;br /&gt;
resultaat&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | effect gemeten&lt;br /&gt;
H1 waar&lt;br /&gt;
|align=&amp;quot;center&amp;quot; style=&amp;quot;background:#faecc8&amp;quot;  | terecht positief&lt;br /&gt;
power (1-β)&lt;br /&gt;
&lt;br /&gt;
80%&lt;br /&gt;
|align=&amp;quot;center&amp;quot; |fout positief&lt;br /&gt;
type I fout (α)&lt;br /&gt;
&lt;br /&gt;
5%&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | geen effect gemeten&lt;br /&gt;
H0 waar&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | fout negatief&lt;br /&gt;
type II fout (β)&lt;br /&gt;
&lt;br /&gt;
20%&lt;br /&gt;
|align=&amp;quot;center&amp;quot; |terecht negatief&lt;br /&gt;
(1-α)&lt;br /&gt;
&lt;br /&gt;
95%&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==Welke informatie heb ik nodig voor een power analyse?==&lt;br /&gt;
Een sample size berekening is gebaseerd op (beredeneerde) aannames. Je hebt informatie nodig over de volgende onderwerpen ([[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse? |meer uitleg per onderwerp]]):&lt;br /&gt;
&lt;br /&gt;
*De gewenste power van de studie (1-β). De keuze voor het power niveau bepaalt hoe zeker je kan zijn dat een type II fout vermeden wordt.&amp;lt;br /&amp;gt;&lt;br /&gt;
*Het gewenste significantie niveau (α). Dit α niveau laat zien welke kans je accepteert om een type I fout te maken. &amp;lt;br /&amp;gt;&lt;br /&gt;
*Eenzijdige of tweezijdige toets. Toets je het verschil slechts een kant op, of hou je er rekening mee dat een studiearm zowel slechter als beter kan presteren dan de andere?&lt;br /&gt;
*Verwacht of klinisch relevant verschil. Naar welk verschil of welk effect wordt er gezocht?&lt;br /&gt;
*Verwachte spreiding / standaard deviatie. Hoeveel variatie verwacht je in de proefpersonen van dezelfde studiegroep?&amp;lt;br /&amp;gt;&lt;br /&gt;
*Welke statistische toets. Welke toets wordt gebruikt tijdens de analyse van de studie?&amp;lt;br /&amp;gt;&lt;br /&gt;
*Lost to follow up. Maak een inschatting hoeveel proefpersonen verloren zullen gaan voor de analyse zodat je hiervoor kunt corrigeren in de sample size berekening.&lt;br /&gt;
&lt;br /&gt;
==Waar vind ik de benodigde informatie voor een power analyse?==&lt;br /&gt;
&lt;br /&gt;
*De gewenste power van de studie (1-β)&lt;br /&gt;
De power geeft de kans op het vinden van een verschil dat werkelijk bestaat (in de populatie). Ofwel: de kans dat nul hypothese terecht wordt verworpen. Een gebruikelijke keuze voor de power is 1-β = 0,80. Dit betekent dat je een kans van 0.20 accepteert om een werkelijk aanwezig effect te missen in de studie. Wil je zekerder zijn om een verschil op te kunnen merken in de studie, dan zou je een hogere power (bijvoorbeeld 0,90 of 0,95) moeten gebruiken. Het verhogen van de power zal leiden tot een grotere sample size. Bijvoorbeeld: het verhogen van de power naar 0,90 bij een α van 0,05 zal je sample size ongeveer 30% doen toenemen.&lt;br /&gt;
&lt;br /&gt;
*Het gewenste significantie niveau (α)&lt;br /&gt;
De gebruikelijke keuze voor α is 0,05, je accepteert dan een kans van 5% dat je conclusie over een verschil tussen beide groepen fout positief is. In tabel 1 zie je de samenhang tussen de hypothesen en conclusies uit de studie uitgedrukt in een 2 x 2 tabel. Een reden om de α te verlagen zou kunnen zijn dat er gecorrigeerd wordt voor [[multiple testing]]. Een lager significantieniveau zal leiden tot een grotere sample size. Bijvoorbeeld: je verlaagt α naar 0,01 bij een power van 0,80 dan zal je benodigde sample size met ± 50% toenemen. De kans op een fout positieve conclusie is dan nog maar 1 procent. Als een effectief middel wordt vergeleken met een goedkoper alternatief kun je er ook voor kiezen om minder kans te lopen op een fout positieve conclusie, dus een lager α level te nemen. Je wilt geen effectief middel ten onrechte inruilen voor een niet effectief middel. In dit zelfde voorbeeld zou je wellicht ook de power te verlagen, je maakt je minder zorgen om een effectieve behandeling te missen, die heb je al. &lt;br /&gt;
&lt;br /&gt;
*Eenzijdig of tweezijdige toets&lt;br /&gt;
Je moet beslissen of er één dan wel tweezijdig getoetst gaat worden in de analyse. Gangbaar is tweezijdig. Eenzijdig toetsen is alleen verdedigbaar als het effect van een interventie onmogelijk anders kan zijn dan verwacht. Hierover is dan een uitgebreide verklaring nodig in een MEC-aanvraag of een publicatie. Bij sommige studies zijn er toch geldige overwegingen om éénzijdig te toetsen &amp;lt;cite&amp;gt;[knottnerus2001 , peace1989]&amp;lt;/cite&amp;gt;. Tweezijdig toetsen geeft een hogere sample size dan eenzijdig toetsen. &lt;br /&gt;
&lt;br /&gt;
*Verwacht of klinisch relevant effect dat je wilt kunnen aantonen&lt;br /&gt;
Bij een studie die twee groepen vergelijkt, bijvoorbeeld een controle en experimentele groep, is dit bijvoorbeeld het verschil tussen de groepen in fractie successen (dichotome uitkomst maat: succes/falen) of het verschil tussen twee gemiddelden bij een continue uitkomstmaat (verschil in gemiddelde bloeddruk). Maar het kan ieder type effect zijn, afhankelijk van wat je studie primair beoogt te schatten. De grootte van het effect dat je gebruikt in je sample size berekening is leidend voor welk effect je straks met voldoende statistische zekerheid kunt schatten/aantonen. Er zijn twee manieren om tot je keuze te komen. &lt;br /&gt;
&lt;br /&gt;
Ten eerste kun je nadenken over wat je verwacht dat het effect zal zijn. Een inschatting kun je mede maken op basis van eerdere bevindingen (literatuur of het resultaat van pilot studies). Let wel: het hoeft niet zo te zijn dat als 1 of 2 kleine studies een (positief) effect hebben beschreven, dat deze studies ook direct de meest realistische inschatting van de grootte van het werkelijke effect geven. Meestal is er sprake van enige vorm van publicatiebias (positieve resultaten vallen het meest op, worden het snelst gepubliceerd). Het kan dus verstandig om voor een reele inschatting van het effect iets lager in te zetten. Zie ook dit artikel dat uitleg geeft over hoe puntschattingen uit eerdere kleine pilotstudies niet altijd de beste raadgever zijn voor het plannen van een grote nieuwe studie &amp;lt;cite&amp;gt;[westlund2016]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Ten tweede kun je kun je de power baseren op het kleinste verschil dat je nog relevant zou vinden. Het (behandel)effect dat je gebruikt in de sample size berekening geeft dan het kleinste klinisch relevante verschil weer. Idee hierbij is dat als het werkelijke effect kleiner zou zijn, het niet de moeite is om de studie uit te voeren, omdat het dan niet tot verandering van praktijk zou leiden. Als je sterke aanwijzingen hebt dat het werkelijke effect groter te verwachten is dan het minimaal relevante effect, dan kun je ook voor dat grotere verwachte effect kiezen &amp;lt;cite&amp;gt;[EMAE9]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Het is verstandig beide aspecten in het oog te houden: het gekozen effect moet zowel relevant zijn (dus niet te klein, het moet wel uitmaken) alsook realistisch (dus niet te optimistisch groot ingeschat).&lt;br /&gt;
&lt;br /&gt;
*Verwachte spreiding / standaard deviatie&lt;br /&gt;
De inschatting van de spreiding wordt gebaseerd op eerdere bevindingen (literatuur of pilot study). Wanneer er geen directe schatting van de standaard deviatie aanwezig is, kan er met [[statistische software#nQuery Advisor|nQuery]] een schatting gemaakt worden op basis van wel bekende gegevens. &lt;br /&gt;
Als een waarneming gepaard gaat met veel variatie wordt het moeilijker om een verschil tussen groepen aan te tonen. Je hebt dan dus meer proefpersonen nodig om een verschil te vinden. Dit wordt wel vergeleken met de ruis die je op de radio hoort, hoe meer ruis (variatie) hoe moeilijker het wordt om het echte signaal (effect) te horen. &lt;br /&gt;
&lt;br /&gt;
*Welke statistische toets&lt;br /&gt;
Een sample size berekening is altijd gebaseerd op een type statistische analyse. Je moet dus al een idee hebben hoe jou data uiteindelijk geanalyseerd gaan worden. Hulp bij het maken van een keuze voor een geschikte toets staat op de pagina [[KEUZE TOETS]] van deze wiki.&lt;br /&gt;
&lt;br /&gt;
*Wat te doen als ik onvoldoende informatie heb?&lt;br /&gt;
Als er helemaal geen informatie in de literatuur te vinden is over de benodigde inschatingen, kan een pilot studie overwogen worden. Hierbij wordt een klein aantal proefpersonen getest. Met de informatie uit de pilot studie kan vervolgens een betere inschatting gemaakt worden van het totaal aantal personen nodig om de onderzoeksvraag te beantwoorden. Voor de grootte van de pilot studie spelen vaak punten als invasiviteit, maar ook kosten een rol.&lt;br /&gt;
&lt;br /&gt;
==Er is nog nooit eerder naar onze uitkomst gekeken, hoe kom ik aan een inschatting van de effectmaat?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Van een aantal uitkomsten in ons onderzoek is nog niets bekend over hoeveelheden (gemiddelden, standaarddeviaties) in onze setting (wij gaan dit voor het eerst testen en er is hier dus geen literatuur over bekend) en zodoende denk ik dat ik de effectgrootte niet kan berekenen. Hoe kan ik hier mee om gaan?&lt;br /&gt;
&lt;br /&gt;
Het is bij sample size berekening lang niet altijd nodig om een reeds in de literatuur beschreven effect te hebben. Je kunt plannen op effecten die je relevant vindt. Je wilt voldoende patiënten hebben om een relevant verschil te kunnen vinden. Je kunt op basis van externe kennis redeneren wat een relevant verschil is. &lt;br /&gt;
&lt;br /&gt;
==Kan ik meerdere uitkomstmaten combineren in een poweranalyse?==&lt;br /&gt;
Een poweranalyse kan maar op een uitkomstmaat van de studie gebaseerd worden. Meestal is dit het primaire eindpunt van de studie. &lt;br /&gt;
Echter, voor de secundaire eindpunten kan de berekende sample size onvoldoende zijn. Je kunt voor de secundaire eindpunten apart een power analyse doen en de sample size baseren op het hoogste aantal personen. Let wel op dat het uiteindelijke criterium waar de sample size op gebaseerd is nog voldoende relevant is om de (extra) personen op te testen. Ruw gezegd zijn er dus twee aanpakken mogelijk: &lt;br /&gt;
&lt;br /&gt;
- je kiest 1 van de uitkomsten (en een van de vergelijkingen) uit als de belangrijkste, de primaire uitkomstparameter. De sample size wordt dan zo gekozen dat er voldoende aantallen zijn voor deze primaire uitkomst. De andere vergelijkingen die gedaan worden in het onderzoek zijn ‘secundair’. Dat betekent dat je er niet per se voor gepowered was. Als je geen significantie vindt, kan dat liggen aan te kleine groepsgroottes. Ook als je wel significantie vindt, kun je niet al te harde conclusies verbinden, omdat je onderzoek niet gepland was op deze vergelijking, het is een soort ‘bijproduct’. &lt;br /&gt;
&lt;br /&gt;
- je berekent de benodigde groepsgrootte voor alle gewenste vergelijkingen en kiest de grootst benodigde groepsgrootte uit. Hiermee ben je op alles gepowered en zou je dus ook alles als ‘primaire uitkomstmaat’ bestempelen. Indien er meerdere vergelijkingen zijn, is het waarschijnlijk nodig om te corrigeren voor [[multiple testing]] om de fout positieve kans over je hele onderzoek/experiment onder controle te houden.&lt;br /&gt;
&lt;br /&gt;
==Corrigeert een correcte sample size berekening voor meetfouten?==&lt;br /&gt;
Een sample size berekening houdt rekening met de invloed van niet systematische fouten ofwel random variatie in de steekproef. Voor andere fouten geeft een sample size berekening geen oplossing. Dan moet je denken aan systematische fouten (bijvoorbeeld slechte ijking van meetapparatuur). Dit geldt ook voor de (ongewenste) invloed van andere variabelen op de studie uitkomsten (bijvoorbeeld confounders). Voor systematische bias moet in de studie opzet en/of in de analysefase gecorrigeerd worden.&lt;br /&gt;
&lt;br /&gt;
== Wanneer is een post hoc poweranalyse zinvol? ==&lt;br /&gt;
Een poweranalyse wordt vooraf aan een onderzoek gedaan. Echter, wanneer er bij de analyse van een studie geen significant verschil wordt gevonden en er vooraf geen poweranalyse is gedaan, kan een post hoc poweranalyse helpen de studieuitkomst te interpreteren. De powerberekening geeft dan aan of het niet significante resultaat (p waarde groter dan 0.05) te maken heeft met te weinig power, of dat je wel voldoende power had om een effect te vinden, maar het effect er gewoon niet is. In dat laatste geval is er sprake van een &amp;quot;true negative&amp;quot; resultaat, terwijl bij een te lage power je niet kan uitsluiten dat je met een &amp;quot;false negative&amp;quot; resultaat te maken hebt.&lt;br /&gt;
Bij een significant studieresultaat is het niet meer relevant om naar de power van een studie te kijken. Er is een effect opgemerkt in de studie, de kans op het missen van een aanwezig effect is niet meer aan de orde &amp;lt;cite&amp;gt;[levine2001 , goodman1994 , lenth2001]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Hoe doe ik een post hoc poweranalyse? ==&lt;br /&gt;
&lt;br /&gt;
Bij een post-hoc powerberekening probeer je achteraf (na statistische analyse) nog iets te zeggen over de power die je vooraf aan de studie had. Hierbij wil je niet weten wat de power van je studie is bij gevonden verschil, maar je wilt weten hoeveel power je had om een wellicht aanwezig verschil aan te kunnen tonen in jouw studiepopulatie. Je berekent welk effect je met bijvoorbeeld 80% power had kunnen testen met het huidige aantal proefpersonen. Een opmerking zou er als volgt uit kunnen zien: &amp;quot;Considering the number of included patients, this study would have 80% power to pick up a mean difference of &amp;gt;= ... between pre and post medication.&amp;quot;&lt;br /&gt;
&lt;br /&gt;
Vervolgens is het interessant om het verschil waarvoor je 80% power had te vergelijken met wat je een (klinisch) relevant verschil vindt. Dit zegt iets over of je voldoende power had relevante verschillen op te pikken.&lt;br /&gt;
&lt;br /&gt;
==Poweranalyse in specifieke onderzoeksdesigns==&lt;br /&gt;
&lt;br /&gt;
===Hoe doe ik een poweranalyse bij een equivalentiestudie?===&lt;br /&gt;
In een equivalentiestudie probeer je aan te tonen dat groepen hetzelfde zijn. Ook in deze groepen zal variatie in de waarnemingen aanwezig zijn. Daarom moet worden aangegeven welk (klein) verschil tussen de groepen verwaarloosbaar is, ofwel bij welk verschil zie je de groepen nog als gelijk (equivalence limit difference). Verder moet worden aangegeven welk verschil wordt verwacht (expected difference). De expected difference zal in de regel kleiner zijn dan de gehanteerde equivalence limit difference. Voor de power wordt vaak 90% gekozen, je loopt dan minder kans dat je ten onrechte de nul hypothese verwerpt, wat bij een equivalentie studie betekent dat je ten onrechte het bestaan van een verschil tussen de groepen verwerpt.&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een sample size voor een kappa coëfficiënt?===&lt;br /&gt;
Hoe vaak moeten twee beoordelaars een object beoordelen om een valide uitspraak over de [[Cohen&#039;s kappa|kappa]] te kunnen doen? In het geval van een dichotome beoordeling (bijv. ziekte is aanwezig of afwezig), kun je met [[statistische software#nQuery Advisor|nQuery]] op de volgende manier een sample size berekenen: Selecteer in het scherm Study Goal and Design (File -&amp;gt; New) onder Goal: Make Conclusion Using “Agreement”, onder Number of Groups “one” en onder Analysis Method “test”. Selecteer vervolgens Kappa (binary outcome). &lt;br /&gt;
&lt;br /&gt;
Nadat een nieuwe tabel is aangemaakt moeten de volgende gegevens worden ingevuld:&lt;br /&gt;
*Test significance level, α (bijvoorbeeld 0,05) &lt;br /&gt;
*1 or 2 sided test (meestal 2 sided)&lt;br /&gt;
*Proportion successes (verwacht percentage positieve testen)&lt;br /&gt;
*Null hypothesis agreement, geef hier een waarde op hoger dan 0 (bijv. 0,40) want je verwacht meer overeenkomst dan op basis van toeval&lt;br /&gt;
*Alternative agreement, geef de Kappa die je wilt detecteren (bijv. 0,70)&lt;br /&gt;
*Power (meestal 80% of 90%)&lt;br /&gt;
&lt;br /&gt;
nQuery berekent op basis van deze gegevens de sample size.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een steekproefgrootte voor een Fleiss kappa coëfficiënt voor meerdere categorieën en raters? ===&lt;br /&gt;
&#039;&#039;Ik wil een onderzoek uitvoeren waarbij een nog onbekende aantal raters patiënten op basis van filmbeelden beoordelen. De raters zullen de patiënten in drie of vier categorieën indelen. Hoe bereken ik hoeveel patiënten ik nodig heb?&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
Je kunt deze berekening met de R package [http://cran.r-project.org/web/packages/kappaSize/kappaSize.pdf kappaSize] uitvoeren.&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een steekproefgrootte voor intraclass correlatie coefficient? ===&lt;br /&gt;
De methoden hiervoor worden in dit artikel beschreven &amp;lt;cite&amp;gt;[zou2012]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoe wordt een groepsgrootte berekening aangepast bij een ‘clustered’ trial?===&lt;br /&gt;
In een &#039;clustered&#039; trial randomiseer je groepen (clusters) in plaats van individuen. Groepen zijn bijvoorbeeld afdelingen in een ziekenhuis. De patiënten in de studie worden per afdeling gerandomiseerd dus krijgen per afdeling dezelfde interventie. Het voordeel van dit studie design is dat patiënten die verschillende interventies loten elkaar niet kunnen beinvloeden (contamineren). Het nadeel is dat je in een clustered trial meer patiënten nodig hebt dan in een &#039;gewone&#039; trial. &lt;br /&gt;
Er is een relatie tussen het aantal proefpersonen in een cluster en het aantal clusters dat je nodig hebt. Hoe meer proefpersonen zich in een cluster bevinden,  hoe minder clusters je nodig hebt.  Een voorbeeld betreft huisartspraktijken &amp;lt;cite&amp;gt;[kerry1998]&amp;lt;/cite&amp;gt;:&lt;br /&gt;
&lt;br /&gt;
:Na interventie (placebo/experiment) wil men bij patienten een gemiddelde afname van 0,1 mmol/L cholesterol met een power van 90% en een significantie van 5% aantonen. De interventie wordt gerandomiseerd over huisartspraktijken. Bij 10 patienten per praktijk zijn 558 praktijken nodig (4% meer patienten dan in een trial waarbij per patient gerandomiseerd wordt). Bij 50 patienten per praktijk heb ik 126 praktijken nodig (17% meer patienten dan een gewone trial). Bij 500 patienten per praktijk ben ik met 32 clusters klaar, maar ik heb bijna 3 keer zoveel patienten nodig als in een gewone gerandomiseerde trial. De extra patienten t.g.v. het cluster effect noemt men het design effect of de inflatiefactor.&lt;br /&gt;
&lt;br /&gt;
Je hebt de voor de berekening van de sample size bij een cluster gerandomiseerde trial de volgende gegevens nodig: significantie niveau; power; standaard deviatie; klinisch relevant verschil; het aantal patienten per cluster (k); correlatie tussen patienten in hetzelfde cluster &amp;lt;math&amp;gt;\rho&amp;lt;/math&amp;gt; (gebruikelijk is &amp;lt;math&amp;gt;\rho &amp;gt; 0,05&amp;lt;/math&amp;gt;). Bij de berekening van steekproefgrootte bij cluster randomized trials wordt vaak aangeraden een zogenaamde inflatiefactor van &amp;lt;math&amp;gt;1+(n-1)\rho&amp;lt;/math&amp;gt; te gebruiken met n = de gemiddelde clustergrootte en &amp;lt;math&amp;gt;\rho&amp;lt;/math&amp;gt; de [[intraclass correlatie coefficient]]. Er is een stap voor stap uitleg hierover verschenen &amp;lt;cite&amp;gt; [mccarthy2007]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoe kan ik een sample size berekening doen in een hiërarchisch design?===&lt;br /&gt;
&lt;br /&gt;
Voor de sample size berekening in een hiërarchisch design kunnen vaak de [[Poweranalyse#Hoe_wordt_een_groepsgrootte_berekening_aangepast_bij_een_.E2.80.98clustered.E2.80.99_trial.3F | simpele aanpassingsmethoden zoals bij een clustered design]] worden gebruikt. Er zijn ook geavanceerdere aanpakken waarbij je meer verwachte relaties kunt meenemen in de berekening. Neem hiervoor contact met een statisticus op.&lt;br /&gt;
&lt;br /&gt;
===Kan ik bij een diagnostische studie een poweranalyse doen?===&lt;br /&gt;
&lt;br /&gt;
Bij een diagnostische studie wordt vaak de [[diagnostisch onderzoek#Wat wordt bedoeld met sensitiviteit en specificiteit?|sensitiviteit en specificiteit]] van een diagnostisch instrument geanalyseerd. Uit een powerberekening vind je hoeveel positieve en negatieve mensen je nodig hebt om sensitiviteit en specificiteit met een bepaalde power te kunnen toetsen. Afhankelijk van hoe vaak beide typen voorkomen in de populatie heb je dan een bepaalde steekproefgrootte nodig. Je kunt je voorstellen dat het aantal van de meest zeldzame soort bepalend is voor de steekproefgrootte. Sample size voor sensitiviteit en specificiteit bereken je apart. &lt;br /&gt;
In [[statistische software#nQuery Advisor |nQuery]] kun voor een poweranalyse op de sensitiviteit bijvoorbeeld het volgende doen. Bereken de sample size voor 1 proportie (kies: Proportions – one Group – Confidence Interval). De &#039;expected proportion&#039; kun je opvatten als de beoogde sensitiviteit terwijl je met de &#039;distance from proportion to limit&#039; de gewenste breedte (1 kant op) van het betrouwbaarheidsinterval rond de sensitiviteit aangeeft. De zo berekende sample size heeft betrekking op het aantal patienten dat positief scoort op de gouden standaard. Stel je verwacht in je studiepopulatie een &#039;prevalentie&#039; van 0,33 dan moet je berekende sample size met (1/0,33=3) vermenigvuldigen voor het totaal benodigd aantal personen. Er zijn voorbeelden van dit soort berekeningen gepubliceerd &amp;lt;cite&amp;gt;[lameris2007]&amp;lt;/cite&amp;gt;, ook zijn hiervoor nomograms gepubliceerd &amp;lt;cite&amp;gt;[carley2005]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Welke informatie heb ik nodig voor een poweranalyse als ik een niet-parametrische test gebruik?===&lt;br /&gt;
Voor een steekproefgrootte berekening gebaseerd op een non-parametrische toets, bijvoorbeeld de [[Mann-Whitney U toets]] kan via een omweg toch gebruik gemaakt worden van de gemiddelde en standaard deviatie van beide groepen om de power of steekproefgrootte te bepalen. Tijdens een berekening in [[statistische software#nQuery Advisor|nQuery]] wordt de kans gevraagd dat een observatie in groep 1 kleiner is dan in groep 2 (P1 = P(X&amp;lt;Y)) als de alternatieve hypothese waar is. Dit kun je inschatten met behulp van het tabblad &#039;assistants&#039; en vervolgens te kiezen voor de optie &#039;calculate effect size&#039;. Hierin wordt gevraagd naar de gemiddelde en standaard deviatie van beide groepen. De door de assistant berekende effect size voer je vervolgens in het vorige scherm in. De rest van de berekening wijst zichzelf.&lt;br /&gt;
&lt;br /&gt;
Indien er pilot data aanwezig is, dan kan er nog preciezer een schatting gemaakt worden van de gevraagde kans (P1 = P(X&amp;lt;Y)), er kan dan namelijk gewoon geteld worden bij hoeveel van de observatieparen (meting 1 groep 1 vs meting 1 groep 2, meting 1 groep 1 vs meting 2 groep 2 etc) de meting in groep 1 kleiner was dan die in groep 2. Dit aantal gedeeld door het totaal aantal paren geeft dan de gevraagde kans.&lt;br /&gt;
&lt;br /&gt;
===Welke informatie heb ik nodig voor een poweranalyse als ik een multivariabele lineaire regressie ga doen?===&lt;br /&gt;
Een vuistregel voor sample size van een [[multivariabele regressie|multivariabele lineaire regressie]] analyse is dat per predictor (onafhankelijke variabele in het model) je minstens 10-20 patienten in je studie moet hebben. [[statistische software#nQuery Advisor|nQuery]] kan de sample size berekenen voor een multivariabel regressie model met meerdere continue predictoren. nQuery test R2=0 (geen verklaarde variantie in het model) voor normaal verdeelde covariaten. Kies in nQuery onder &#039;study goal and design&#039; voor &#039;regression&#039;, &#039;one group&#039; en voor &#039;test&#039; en bij type test voor &#039;linear regression, multiple covariates&#039;. Vervolgens geef je de volgende waarden op: test significance level (0,05); number of variables k = aantal predictors in je model; squared multiple correlation R2, wat is de verwachte verklaarde variantie ; en de power (meestal 80%). Met deze waarden kan een sample size worden berekend.&lt;br /&gt;
&lt;br /&gt;
===Is een poweranalyse zinvol bij een tevredenheidsenquete?===&lt;br /&gt;
&#039;&#039;Ik ben bezig met het plannen van een onderzoek met vragenlijsten over het gebruik en de tevredenheid van fysiotherapie bij patienten met rugklachten. Omdat het hier niet per definitie om een vergelijkend onderzoek gaat vroeg ik mij af of het nodig is om een powerberekening uit te voeren. Mocht een powerberekening niet nodig zijn, is er dan nog een andere manier om het benodigde aantal deelnemers te bepalen? Of is het in dit geval zo dat er gewoon zoveel mogelijk patiënten moeten deelnemen om een goed beeld van de huidige situatie te krijgen?&lt;br /&gt;
&lt;br /&gt;
Ook bij niet vergelijkend onderzoek is het raadzaam om een sample size berekening te doen. Want ook dan wil je verzekeren dat je de resultaten uit de studie met voldoende zekerheid kunt omkleden. Bijv zul je bij 5 van de 10 tevreden patienten een heel andere mate van bewijs hebben dan als je 50 van de 100 tevreden patienten hebt verzameld. Ook vanuit andere kant bekeken geldt dat het goed is om te kijken naar een maximum benodigd aantal, omdat je daarmee patienten (en jezelf) onnodige moeite kan besparen. Ook hier geldt dus dat er bepaald moet worden wat de belangrijkste uitkomstparameters van het onderzoek zijn, wat de verwachting hiervan is en met welke mate van precisie (bijv breedte betrouwbaarheidsinterval) de wens is hierover te rapporteren.&lt;br /&gt;
&lt;br /&gt;
===Ik bereken de sample size voor het vergelijken van twee proporties, moet ik de continuity corrected chi-square versie gebruiken?===&lt;br /&gt;
&#039;&#039;Wij willen de sample size berekening doen voor een vergelijking van 2 proporties. We verwachten 2% events in de ene groep en 30% event in de andere groep. In nQuery vind ik een optie voor chi-square test en een optie voor &amp;quot;continuity corrected&amp;quot; chi-square test. Wanneer moet ik die correctie gebruiken?&lt;br /&gt;
&lt;br /&gt;
De berekening van nQuery gebruikt (op de achtergrond, te zien in de help file) een z test voor het berekenen vna de aantallen voor het vergelijken van 2 proporties. Je kunt je voorstellen dat het er bij de omzetting van een proportie naar zo&#039;n (continue) z-verdeling een approximatie wordt gedaan. Bij relatief grote aantallen gaat dat wel goed. Bij wat kleinere aantallen is de benadering minder precies. Hiervoor is er de &#039;continuity corrected&#039; versie. Deze maakt een aanpassing om er rekening mee te houden dat de proporties bij kleine aantallen niet &#039;glad&#039; overgezet kunnen worden in een z-verdeling en zorgt voor een wat conservatievere (grotere) sample size. Er zijn helaas geen absolute grenzen vanaf waar je de continuity correctie &#039;moet&#039; gebruiken. Een grens van (totale) sample size tot 100 wordt wel eens aangehouden.&lt;br /&gt;
&lt;br /&gt;
In jullie geval waarbij er naast relatief kleine aantallen (totale n blijft ruim onder de 100) ook in 1 groep een heel kleine event rate verwacht wordt, zou ik altijd proberen te zorgen voor een veilige sample size door wel met de continuity corrected versie te werken.&lt;br /&gt;
&lt;br /&gt;
===Ik bereken de sample size voor het schatten van een enkele proportie en merk dat ik meer personen nodig heb als het % dichter bij 50% ligt, klopt dat wel?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik doe een sample size berekening voor het schatten van een enkele proportie waarbij ik een vaste wens voor de breedte van het betrouwbaarheidsinterval rondom die proportie wens. Wat mij verbaast is dat de aantallen patienten groter worden richting een verwacht percentage van 50% en hierna weer afneemt. Dit snap ik niet helemaal. Is hier een logische verklaring voor??&lt;br /&gt;
&lt;br /&gt;
Dat klopt. De verklaring daarvoor is dat het makkelijker is om een laag percentage te schatten dan een percentage dat richting de 50% gaat. Intuitief kun je hier als volgt over denken:&lt;br /&gt;
&lt;br /&gt;
Stel je hebt een (gewonen 1-6) dobbelsteen en weet niet wat er voor een punten op deze dobbelsteen staan. &lt;br /&gt;
- Je gaat eerst kijken hoe vaak de 1 voorkomt. Je gooit heel vaak met de dobbelsteen en telt hoe vaak er een 1 boven komt. Je zult hierbij al vrij snel doorhebben dat de 1 niet vaak voorkomt. Het valt snel op dat dit een laag percentage moet zijn. Een schatting van tussne 0 en 25% is snel te maken. &lt;br /&gt;
- Stel je wilt kijken hoe vaak er een even getal (2 4 of 6) boven komt. Weer ga je vaak gooien. Maar nu is het lastiger om te bepalen wat het percentage even getallen is. De ene keer komt het vaak (achter elkaar) voor, dan weer niet. Je schommelt met je schatting, bijvoorbeeld tussen de 25% en 75%. &lt;br /&gt;
&lt;br /&gt;
Je ziet dat in het tweede geval, bij een werkelijk percentage van 50% het moeilijker is om dit percentage met smalle betrouwbaarheidsband te melden dan bij het eerste geval.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patiënten heb ik bij een pilot studie nodig? ===&lt;br /&gt;
Er zijn geen duidelijke regels over hoeveel patiënten je meeneemt als je een pilot studie uitvoert. Als de doel van de pilot studie is om een schatting van de gemiddelde en standaard deviatie te krijgen, raden sommige statistici 12 patiënten per groep aan &amp;lt;cite&amp;gt;[julios2005]&amp;lt;/cite&amp;gt;. Als je een schatting van een proportie, Pearson&#039;s correlatie coëfficiënt, Cronbach&#039;s alpha coëfficiënt of de effect size wilt maken zijn andere aantallen nodig &amp;lt;cite&amp;gt;[hertzog2008]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patienten heb ik minder nodig als ik een cross-over studie doe ipv een studie met paralelle groepen?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik doe onderzoek bij gezonde proefpersonen; omdat ik ze blootstel aan straling, willen we het aantal proefpersonen beperken. Daarom overwegen we een cross-over design. In hoeverre kunnen we met dit ontwerp de groepsgrootte beperken?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende rekenregel toepassen  om het contrast in steekproefomvang  tussen het parallelle en cross-over design te bepalen &amp;lt;cite&amp;gt;[bonten2012]&amp;lt;/cite&amp;gt; &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
n_{cross-over} = \frac{((1-r) * n_{parallel})}{2}&lt;br /&gt;
&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Hierbij is r de [[Correlatie|correlatie]] tussen metingen binnen dezelfde personen. Bezwaar van een cross-over studie kan wel zijn dat de totale stralingsbelasting per patiënt hoger zal zijn. Je moet goed kunnen motiveren waarom minder patiënten meer straling geven beter is dan iedereen dezelfde straling geven. En verder moet er geen sprake zijn van carry-over of cumulerende effecten.&lt;br /&gt;
&lt;br /&gt;
===nQuery en PASS berekenen ieder een andere groepsgrootte voor mijn geplande logistische regressie, welke kan ik gebruiken?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;In mijn studie wil ik het kijken naar het verband tussen een continue uitslag van een diagnostische test en een dichotome uitkomst (gouden standaard). Ik wil daarvoor een [[logistische regressie]] te gebruiken en denk nu na over benodigde sample size. Ik heb verschillende aannames ingevoerd in zowel [[statistische software|nQuery]] als [[statistische software|PASS]], maar beide programma&#039;s geven verschillende benodigde groepsgroottes terug. Welke moet ik van uit gaan?&lt;br /&gt;
&lt;br /&gt;
Ik heb de door nQuery &amp;lt;cite&amp;gt;[hsieh1989]&amp;lt;/cite&amp;gt; en PASS &amp;lt;cite&amp;gt;[hsieh1998]&amp;lt;/cite&amp;gt; genoemde referenties erbij genomen. Hieruit blijkt dat de berekening van nQuery een ‘upper bound’ benadering gebruikt waardoor die doorgaans hogere groepsgroottes zal berekenen dan benodigd. Ik raad je dus aan om voor jouw berekening niet nQuery te gebruiken, maar PASS of om de juiste formules &amp;lt;cite&amp;gt;[hsieh1998]&amp;lt;/cite&amp;gt;zelf toe te passen.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patienten heb ik nodig voor een genome wide associatie studie?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil in een groot cohort whole genome SNP array doen. Ik ben vooral geïnteresseerd in de meest relevante nonsynSNP met MAF &amp;gt;5%. Dit betekent dat ik in DNA van patiënten 100.000-en SNPs ga meten mbv genome wide association zoals &#039;genome wide human SNP array&#039;. Ik neem een van-te-voren geselecteerde groep patienten, bijvoorbeeld 300 waarvan 50% goede nierfunctie heeft en 50% slechte nierfunctie. Ik vroeg me af of het mogelijk is om van te voren een idee te hebben hoeveel patiënten je moet gebruiken voor voldoende power?&lt;br /&gt;
&lt;br /&gt;
De standaard poweranalyse voor GWAS is vergelijkbaar met die van een studie waar u naar 1 SNP kijkt, behalve dan dat het significantie-niveau wordt verlaagd. Meestal gebruiken we een [[Multiple_testing|Bonferroni correctie]], dus het significantie niveau wordt dan 0.05 gedeeld door het aantal SNPs. Dus als u een 250K chip gebruikt en 200K SNPs voldoen aan alle kwaliteitscriteria dan wordt het significantie niveau 0.05/200,000 = 0.00000025. Als u een groter platform gaat gebruiken met, zeg, 1,000,000 SNPs of als u SNPs gaat imputeren naar GONL of 1000genomes, dan gebruiken we de zogenaamde &amp;quot;genomewide significance&amp;quot; van 8.5x10^9. Als u de analyse beperkt tot nonsynonymous SNPs met MAF&amp;gt;5%, dan beperkt u het aantal enorm. Ik denk dat de meeste algemene platforms heel weinig van dergelijke SNPs bevatten en zelfs dedicated platforms (zoals de cardiochip, metabochip of kankerchips) hebben heel weinig van dergelijke SNPs met mAF&amp;gt;5%. Ook dan is het significantie-niveau gelijk aan 0.05/aantal resterende SNPs.&lt;br /&gt;
&lt;br /&gt;
De vergelijking die u gaat maken betreft de genotyperingen van een SNP in de groepen patienten met goede of minder goede nierfunctie. Stel dat u gaat kijken naar het percentage patienten met genotypes AA of Aa versus het genotype aa, dan kunt u die percentages &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; noemen. Over die &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; moet u uitspraken doen en daarna kunt u de standaard steekproefgrootte formule gebruiken:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
N_{\rm{per\, &lt;br /&gt;
groep}} = \frac{(z_{\alpha} + z_{\beta})^2 * (p_1*(1-p_1)+p_2*(1-p_2))}{(p_1-p_2)^2}&lt;br /&gt;
&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;\beta&amp;lt;/math&amp;gt; = 1-power en als power 80% is, dan is &amp;lt;math&amp;gt;z_{\beta}&amp;lt;/math&amp;gt;=0.84 (als power 90% is, dan is &amp;lt;math&amp;gt;z_{\beta}&amp;lt;/math&amp;gt;=1.28). &lt;br /&gt;
&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; = significantie niveau en als &amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt;=0.05, dan is  &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=1.96. Als &amp;lt;math&amp;gt;\alpha=\frac{0.05}{200000}&amp;lt;/math&amp;gt;, dan is &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=5.16 en als &amp;lt;math&amp;gt;\alpha=&amp;lt;/math&amp;gt;0.000000085 dan is &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=5.36.&lt;br /&gt;
&lt;br /&gt;
Stel je neemt aan dat in de &amp;quot;gezonde&amp;quot; populatie het AA+Aa genotype in 10% van de personen voorkomt, dan geldt dat &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt;=0.10. Stel verder dat de [[Associatiematen_2x2_tabel#Odds_ratio|odds ratio]] van deze SNP voor het hebben van minder goede nierfunctie gelijk is aan 2.5. Dan verwacht je dat &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; ongeveer gelijk is aan 0.10*2.5 = 0.25 (je kunt het iets preciezer uitrekenen). Om 80% power te hebben om zo&#039;n SNP significante te vinden als je 200,000 SNPs toets, dan heb je &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
N_{\rm{per\, groep}} = \frac{(5.16+0.84)^2 * (0.10*(1-0.10)+0.25*(1-0.25))} {(0.10-0.25)^2} = 444&lt;br /&gt;
&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
patienten met slechte en 444 patienten met goede nier functie nodig. &lt;br /&gt;
&lt;br /&gt;
Overigens zien we zelden zulke sterke associaties bij SNPs, meestal zijn de [[Associatiematen_2x2_tabel#Odds_ratio|odds ratio&#039;s]] 1.1 of 1.2 of zoiets en dan toets je &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt;=0.10 versus &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt;=0.11 of 0.12 en zul je zien dat je heel erg veel patienten nodig hebt.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patiënten heb ik nodig om een predictie model te bouwen?===&lt;br /&gt;
&#039;&#039;Ik wil een predictie model voor een binaire (0/1) uitkomst bouwen. Van hoeveel patiënten heb ik data nodig?&#039;&#039;&lt;br /&gt;
In deze situatie gaat het niet om het aantal patienten, maar om het aantal events (&amp;quot;1&amp;quot;) en non-events (&amp;quot;0&amp;quot;). Per parameter dat je in je predictiemodel schat, heb je minimaal 20 events en minimaal 20 non-events nodig &amp;lt;cite&amp;gt;[ogundimu2016]&amp;lt;/cite&amp;gt;. Je hebt dus zoveel patiënten nodig dat het aannemelijk is dat je minimaal 20 events (bijvoorbeeld ziekenhuissterfte) en 20 non-events (bijvoorbeeld levend uit het ziekenhuis ontslagen) per parameter die je wil schatten. Maar om een goede schatting van de benodigde aantal kan het nodig zijn om ook andere factoren mee te nemen &amp;lt;cite&amp;gt;[smeden2018]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil een predictie model voor een continue uitkomst bouwen. Van hoeveel patiënten heb ik data nodig?&#039;&#039;&lt;br /&gt;
Het antwoord hierop is vrij complex, er zijn wel een aantal artikelen die handvatten rondom het aantal benodigde patiënten kunnen geven &amp;lt;cite&amp;gt;[knofczynski2007 , brooks2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Denk bij het plannen van een studie om een predictie model te bouwen ook aan de eventueel benodigde data voor het (intern)valideren van het model!&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?===&lt;br /&gt;
&#039;&#039;Ik wil de steekproef voor een studie met één groep patiënten berekenen. De patiënten worden op een nieuwe manier geopereerd. Ik wil de proportie patiënten met een bepaalde complicatie bij de nieuwe operatie vergelijken met de proportie patiënten met deze complicatie bij de huidige standaard operatie. De proportie complicaties bij de huidige standaard operatie is uit de literatuur bekend en bedraagt 0,52. Ik verwacht dat de proportie complicaties bij de nieuwe manier van opereren 0,42 zal zijn. Hoe kan ik voor deze studie een steekproefgrootte berekenen?&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
In deze type studie schat je op basis van de data van patiënten uit één groep een proportie. Vervolgens vergelijk je deze proportie met een vooraf gestelde waarde van de proportie. Deze vergelijking kan je met een chi-kwadrat toets voor één proportie uitvoeren. &lt;br /&gt;
In nQuery kan je in het menu File de optie New kiezen. Vervolgens klik je bij “Goals: make conclusions using” de optie “proportions”, bij “Number of Groups” de optie “One” en bij “Analysis Method” de optie “test” aan. Vervolgens klik je in de scherm daaronder op het “+”teken naast de tekst “Single proportion”. Kies “One sample Chi-squared” en het rekenscherm verschijnt. Vul de gewenste waardes voor alpha (meestal 0,05), één of tweezijdige toets (meestal tweezijdig), de “null hypothesis proportion” (hier 0,52) , de “Alternative proportion” (hier 0,42) en de gewenste power (meestal 80%) in. Klik dan op “Enter” op je toetsenbord en de benodigde aantal patiënten in de onderzoeksgroep zal in de rij “n” verschijnen. In deze voorbeeld is dat 195.&lt;br /&gt;
&lt;br /&gt;
Als je met andere properties werkt, kan het nodig zijn om de optie &amp;quot;Exact test for single proportion&amp;quot; te gebruiken.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#park2010 Park HM. Hypothesis Testing and Statistical Power of a Test. 2010. [http://hdl.handle.net/2022/19738 Link]&lt;br /&gt;
&lt;br /&gt;
#knottnerus2001 Knottnerus JA, Bouter LM. The ethics of sample size: Two-sided testing and one-sided thinking. Journal of Clinical Epidemiology. 2001 Feb; 54(2): 109-110. [https://doi.org/10.1016/S0895-4356(00)00276-6 DOI]&lt;br /&gt;
&lt;br /&gt;
#westlund2016 Westlund E, Stuart EA. The Nonuse, Misuse, and Proper Use of Pilot Studies in Experimental Evaluation Research. American Journal of Evaluation. 2017 38(2), 246–261. [https://doi.org/10.1177/1098214016651489 DOI]&lt;br /&gt;
&lt;br /&gt;
#EMAE9 European Medicines Agency. Note for guidance on statistical principles for clinical trials (CPMP/ICH/363/96). [https://www.ema.europa.eu/documents/scientific-guideline/ich-e-9-statistical-principles-clinical-trials-step-5_en.pdf download from ema website]&lt;br /&gt;
&lt;br /&gt;
#peace1989 Peace KE. The alternative hypothesis: One-sided or two-sided? Journal of Clinical Epidemiology. 1989 42(5): 473-476. [https://doi.org/10.1016/0895-4356(89)90137-6 DOI]&lt;br /&gt;
&lt;br /&gt;
#levine2001 Levine M, Ensom MHH. Post Hoc Power Analysis: An Idea Whose Time Has Passed? Pharmacotherapy. 2001 21(4):405-409. [https://doi.org/10.1592/phco.21.5.405.34503 DOI]&lt;br /&gt;
&lt;br /&gt;
#goodman1994 Goodman SN, Berlin JA. The Use of Predicted Confidence Intervals When Planning Experiments and the Misuse of Power When Interpreting the Results. Annals Internal Medicine. 1994 121(3): 200-206. [https://doi.org/10.7326/0003-4819-121-3-199408010-00008 DOI]&lt;br /&gt;
&lt;br /&gt;
#lenth2001 Lenth RV. Some Practical Guidelines for Effective Sample Size Determination. The American Statistician. 2001 55(3): 187-193. [https://www.jstor.org/stable/2685797 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#mccarthy2007  McCarthy WF. Assessment of Sample Size and Power for the Analysis of Clustered Matched-Pair Data. COBRA Preprint Series. Working Paper 28. July 2007. [http://biostats.bepress.com/cobra/art28 DOI].&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#lameris2007 Lameris W, van Randen A, Dijkgraaf MGW, Bossuyt PMM, Stoker J, Boermeester MA. Optimization of diagnostic imaging use in patients with acute abdominal pain (OPTIMA): Design and rationale. BMC Emerg Med. 2007 7: 9.  [https://dx.doi.org/10.1186%2F1471-227X-7-9 DOI].&lt;br /&gt;
&lt;br /&gt;
#carley2005 Carley S, Dosman S, Jones SR, Harrison M. Simple nomograms to calculate sample size in diagnostic studies. Emergency Medicine Journal 2005 22(5) 180-181. [http://dx.doi.org/10.1136/emj.2003.011148 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#julios2005 Julious SA. Sample size of 12 per group rule of thumb for a pilot study. Pharmaceutical Statistics. 2005 4(4) 287-291. [https://doi.org/10.1002/pst.185 DOI].&lt;br /&gt;
&lt;br /&gt;
#hertzog2008 Hertzog MA. Considerations in determining sample size for pilot studies. Research in Nursing and Health. 2008 31(2) 180-191. [https://doi.org/10.1002/nur.20247 DOI]. &lt;br /&gt;
&lt;br /&gt;
#bonten2012 Bonten TN, Siegerink B, van der Bom JG. Cross-overstudies. Ned Tijdschr Geneeskd. 2012 156:A5542. [https://www.ntvg.nl/artikelen/cross-overstudies Link]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#hsieh1989 Hsieh FY. Sample size tables for logistic regression. Statistics in Medicine. 1989 8(7) 795-802. [https://doi.org/10.1002/sim.4780080704 DOI] &lt;br /&gt;
&lt;br /&gt;
#hsieh1998 Hsieh FY, Bloch DA, Larsen MD. A simple method of sample size calculation for linear and logistic regression. Statistics in Medicine. 1998 17(14) 1623-1634. [https://doi.org/10.1002/(SICI)1097-0258(19980730)17:14&amp;lt;1623::AID-SIM871&amp;gt;3.0.CO;2-S DOI]&lt;br /&gt;
&lt;br /&gt;
#ogundimu2016 Ogundimu EO, Altman DG, Collins GS. Adequate sample size for developing prediction models is not simply related to events per variable. Journal of Clinical Epidemiology. 2016 76 175-182. [https://doi.org/10.1016/j.jclinepi.2016.02.031 DOI]&lt;br /&gt;
&lt;br /&gt;
# smeden2018 van Smeden M, Moons KGM, de Groot JAH, Collins GS, Altman DG, Eijkemans MJC, Reitsma JB. Sample size for binary logistic prediction models: Beyond events per variable criteria. Statistical Methods in Medical Research 2018. [https://doi.org/10.1177/0962280218784726 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#knofczynski2007 Knofczynski GT, Mundfrom D. Sample Sizes When Using Multiple Linear Regression for Prediction. Educational and Psychological Measurement. 2007 68(3). [https://doi.org/10.1177/0013164407310131 DOI]&lt;br /&gt;
&lt;br /&gt;
#brooks2012 Brooks GP, Barcikowski RS. The PEAR Method for Sample Sizes in Multiple Linear Regression. Multiple Linear Regression Viewpoints. 2012 38(2) 1-16. [http://www.glmj.org/archives/articles/Brooks_v38n2.pdf Link]&lt;br /&gt;
&lt;br /&gt;
#florey1993 Florey CD. Sample size for beginners. BMJ 1993 306 1181-4 [https://doi.org/10.1136/bmj.306.6886.1181 DOI]&lt;br /&gt;
&lt;br /&gt;
#kerry1998 Kerry SM, Bland JM, Statistics notes: sample size in cluster randomization. BMJ 1998 volume 316(5):549. [https://doi.org/10.1136/bmj.316.7130.549 DOI]&lt;br /&gt;
&lt;br /&gt;
#jones2003 Jones SR, Carley S, Harrison M.  An introduction to power and sample size estimation, Emergency Medicine Journal, 2003 20(5):453-458 [http://dx.doi.org/10.1136/emj.20.5.453 DOI]&lt;br /&gt;
&lt;br /&gt;
#zou2012 Zou GY. Sample size formulas for estimating intraclass correlation coefficients with precision and assurance. Stat Med. 2012 31(29):3972-81. [http://dx.doi.org/10.1002/sim.5466 DOI] &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2697</id>
		<title>OVERZICHT</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2697"/>
		<updated>2020-01-29T15:32:25Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{| border =&amp;quot;2&amp;quot; style=&amp;quot;width:850px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;8&amp;quot;&lt;br /&gt;
! [[Poweranalyse]]!! Toetsen !! Statistische maten&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Poweranalyse#Wat is een poweranalyse|wat is een poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Wanneer heb ik een power analyse nodig?|wanneer heb ik een poweranalyse nodig]]&lt;br /&gt;
*[[Poweranalyse#Welke software is beschikbaar voor power analyse?|welke software is er voor poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Welke informatie heb ik nodig voor een power analyse?|welke informatie heb ik nodig]]&lt;br /&gt;
*[[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse?|waar vind ik de informatie]]&lt;br /&gt;
*[[Poweranalyse#Kan ik meerdere uitkomstmaten combineren in een poweranalyse?|meerdere uitkomstmaten]]&lt;br /&gt;
*[[Poweranalyse#Wanneer is een post hoc poweranalyse zinvol?|post hoc poweranalyses]]&lt;br /&gt;
*[[Poweranalyse#Poweranalyse in specifieke onderzoeksdesigns|specifieke onderzoeksdesigns]]&lt;br /&gt;
| &lt;br /&gt;
*[[Fisher&#039;s exact toets]] &lt;br /&gt;
*[[Chi-kwadraat toets]]&lt;br /&gt;
*[[McNemar toets]]&lt;br /&gt;
*[[T-toets]]&lt;br /&gt;
*[[Mann-Whitney U toets]]&lt;br /&gt;
*[[Wilcoxon signed rank toets]]&lt;br /&gt;
*[[one-way ANOVA]]&lt;br /&gt;
*[[Kruskal Wallis]]&lt;br /&gt;
*[[Friedman toets]]&lt;br /&gt;
*[[Tekentoets]]&lt;br /&gt;
*[[Cochran&#039;s Q toets]]&lt;br /&gt;
| &lt;br /&gt;
*[[gemiddelde en mediaan]]&lt;br /&gt;
*[[standaardfout/standard error]]&lt;br /&gt;
*[[betrouwbaarheidsinterval]]&lt;br /&gt;
*[[associatiematen 2x2 tabel]]&lt;br /&gt;
*[[z-scores]]&lt;br /&gt;
*[[effect maten]]&lt;br /&gt;
*[[model fit maten]]&lt;br /&gt;
*[[statistiek rapporteren]]&lt;br /&gt;
|-&lt;br /&gt;
! Regressieanalyse!! [[Herhaalde metingen]]!! [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
*[[lineaire regressie]]&lt;br /&gt;
*[[logistische regressie]]&lt;br /&gt;
*[[multivariabele regressie]]&lt;br /&gt;
*[[ANCOVA]]&lt;br /&gt;
*[[multinomiale logistische regressie]]&lt;br /&gt;
*[[ordinale logistische regressie]]&lt;br /&gt;
*[[risicoscores gebaseerd op regressiemodellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[repeated measures ANOVA]]&lt;br /&gt;
*[[generalized estimating equations]]&lt;br /&gt;
*[[mixed effects modellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[Survival analyse#kaplan meier analyse|Kaplan Meier]]&lt;br /&gt;
*[[Survival analyse#cox regressie|Cox regressie]]&lt;br /&gt;
*[[competing risk analyse]]&lt;br /&gt;
|-&lt;br /&gt;
! [[Correlatie]]!! Studieontwerp!! Overig&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Correlatie#Pearson&#039;s r|Pearson&#039;s r]]&lt;br /&gt;
*[[Correlatie#Spearman’s rho|Spearman&#039;s rho]]&lt;br /&gt;
*[[Cohen&#039;s kappa]]&lt;br /&gt;
*[[intraclass correlatie coefficient]]&lt;br /&gt;
| &lt;br /&gt;
*[[observationeel onderzoek]]&lt;br /&gt;
*[[diagnostisch onderzoek]]&lt;br /&gt;
*[[systematische reviews]]&lt;br /&gt;
*[[meta-analyse]]&lt;br /&gt;
*[[equivalentie design]]&lt;br /&gt;
| &lt;br /&gt;
*[[interimanalyse]]&lt;br /&gt;
*[[matchen]]&lt;br /&gt;
*[[multiple testing]]&lt;br /&gt;
*[[missing values]]&lt;br /&gt;
*[[outliers]]&lt;br /&gt;
*[[randomiseren]]&lt;br /&gt;
*[[statistische software]]&lt;br /&gt;
*[[grafieken]]&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar de pagina [[KEUZE TOETS]] gaan voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. De helpdesk statistiek biedt statistische ondersteuning aan  onderzoekers van het Amsterdam UMC, locatie AMC, bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm AMC intranet site van de CRU] statistische ondersteuning aanvragen.&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2696</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2696"/>
		<updated>2020-01-29T15:30:51Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt; and provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Reasons for performing sample size calculations ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the study has an unacceptably large probability of reaching a false negative conclusion. This means that the subjects will be subjected to the risks of participating in the study in vain. On the other hand, including too many subjects may also lead to undesirable situations. If an intervention turns out to be effective, too many subjects have missed out on this intervention. If the intervention is not effective, too many have been exposed to this ineffective intervention. For these reasons a trial should always consider what number of subjects would be appropriate to answer the study question. Sample size calculations prior to a study can help focus on the number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
=== Comparing two proportions - methods to help stop smoking ===&lt;br /&gt;
Suppose we want set up a randomized controlled trial to compare two methods of helping&lt;br /&gt;
smokers to give up smoking. One group is to be given a new kind of nicotine chewing&lt;br /&gt;
gum and the other group will receive advice from their doctor and a booklet. We want to&lt;br /&gt;
know how many patients to include in our study. Based on published evidence we expect&lt;br /&gt;
that in the advice group 15% of smokers will remain non-smokers at 6 months. We would&lt;br /&gt;
be interested in an improvement to 30% in the group given gum. In nQuery we take the&lt;br /&gt;
following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two proportions and that we want to test the difference&lt;br /&gt;
between these two proportions using a Chi-square test (Figure 3).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 proportion 0.15, group 2 proportion 0.30, power 80% and see that&lt;br /&gt;
nQuery calculates 121 persons per group to be tested (Figure 4).&lt;br /&gt;
4. To test the effect of using slightly different assumptions and we repeat the calculation&lt;br /&gt;
and see that we need 250 persons per group to detect a difference between proportions&lt;br /&gt;
of 0.10 (0.15 versus 0.25) and only 73 per group to detect a difference between&lt;br /&gt;
proportions of 0.20 (0.15 versus 0.35) (Figure 4). Note: If numbers per group were&lt;br /&gt;
low, we could also check how using a continuity corrected chi-squared test would&lt;br /&gt;
alter our calculations. Continuity adjustment to chi-square is usually applied to&lt;br /&gt;
tables with one or more cells with frequencies less than five. Some authors also apply&lt;br /&gt;
it to all 2 by 2 tables since the correction gives a better approximation to the binomial&lt;br /&gt;
distribution. (Garson, G. David, 2009).&lt;br /&gt;
We here accept that our study is not powered on finding a difference smaller than 15%&lt;br /&gt;
between groups. Anticipating on a 10% attrition rate and keeping our initial assumptions&lt;br /&gt;
for the difference in proportions, we decide to include 135 (121/0.9 = 134,44) persons per&lt;br /&gt;
group, or 270 in total.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2695</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2695"/>
		<updated>2020-01-29T15:26:59Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Why perform a sample size calculation? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Reasons for performing sample size calculations ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the study has an unacceptably large probability of reaching a false negative conclusion. This means that the subjects will be subjected to the risks of participating in the study in vain. On the other hand, including too many subjects may also lead to undesirable situations. If an intervention turns out to be effective, too many subjects have missed out on this intervention. If the intervention is not effective, too many have been exposed to this ineffective intervention. For these reasons a trial should always consider what number of subjects would be appropriate to answer the study question. Sample size calculations prior to a study can help focus on the number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
=== Comparing two proportions - methods to help stop smoking ===&lt;br /&gt;
Suppose we want set up a randomized controlled trial to compare two methods of helping&lt;br /&gt;
smokers to give up smoking. One group is to be given a new kind of nicotine chewing&lt;br /&gt;
gum and the other group will receive advice from their doctor and a booklet. We want to&lt;br /&gt;
know how many patients to include in our study. Based on published evidence we expect&lt;br /&gt;
that in the advice group 15% of smokers will remain non-smokers at 6 months. We would&lt;br /&gt;
be interested in an improvement to 30% in the group given gum. In nQuery we take the&lt;br /&gt;
following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two proportions and that we want to test the difference&lt;br /&gt;
between these two proportions using a Chi-square test (Figure 3).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 proportion 0.15, group 2 proportion 0.30, power 80% and see that&lt;br /&gt;
nQuery calculates 121 persons per group to be tested (Figure 4).&lt;br /&gt;
4. To test the effect of using slightly different assumptions and we repeat the calculation&lt;br /&gt;
and see that we need 250 persons per group to detect a difference between proportions&lt;br /&gt;
of 0.10 (0.15 versus 0.25) and only 73 per group to detect a difference between&lt;br /&gt;
proportions of 0.20 (0.15 versus 0.35) (Figure 4). Note: If numbers per group were&lt;br /&gt;
low, we could also check how using a continuity corrected chi-squared test would&lt;br /&gt;
alter our calculations. Continuity adjustment to chi-square is usually applied to&lt;br /&gt;
tables with one or more cells with frequencies less than five. Some authors also apply&lt;br /&gt;
it to all 2 by 2 tables since the correction gives a better approximation to the binomial&lt;br /&gt;
distribution. (Garson, G. David, 2009).&lt;br /&gt;
We here accept that our study is not powered on finding a difference smaller than 15%&lt;br /&gt;
between groups. Anticipating on a 10% attrition rate and keeping our initial assumptions&lt;br /&gt;
for the difference in proportions, we decide to include 135 (121/0.9 = 134,44) persons per&lt;br /&gt;
group, or 270 in total.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2694</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2694"/>
		<updated>2020-01-29T15:26:34Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Why perform a sample size calculation? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the study has an unacceptably large probability of reaching a false negative conclusion. This means that the subjects will be subjected to the risks of participating in the study in vain. On the other hand, including too many subjects may also lead to undesirable situations. If an intervention turns out to be effective, too many subjects have missed out on this intervention. If the intervention is not effective, too many have been exposed to this ineffective intervention. For these reasons a trial should always consider what number of subjects would be appropriate to answer the study question. Sample size calculations prior to a study can help focus on the number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
=== Comparing two proportions - methods to help stop smoking ===&lt;br /&gt;
Suppose we want set up a randomized controlled trial to compare two methods of helping&lt;br /&gt;
smokers to give up smoking. One group is to be given a new kind of nicotine chewing&lt;br /&gt;
gum and the other group will receive advice from their doctor and a booklet. We want to&lt;br /&gt;
know how many patients to include in our study. Based on published evidence we expect&lt;br /&gt;
that in the advice group 15% of smokers will remain non-smokers at 6 months. We would&lt;br /&gt;
be interested in an improvement to 30% in the group given gum. In nQuery we take the&lt;br /&gt;
following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two proportions and that we want to test the difference&lt;br /&gt;
between these two proportions using a Chi-square test (Figure 3).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 proportion 0.15, group 2 proportion 0.30, power 80% and see that&lt;br /&gt;
nQuery calculates 121 persons per group to be tested (Figure 4).&lt;br /&gt;
4. To test the effect of using slightly different assumptions and we repeat the calculation&lt;br /&gt;
and see that we need 250 persons per group to detect a difference between proportions&lt;br /&gt;
of 0.10 (0.15 versus 0.25) and only 73 per group to detect a difference between&lt;br /&gt;
proportions of 0.20 (0.15 versus 0.35) (Figure 4). Note: If numbers per group were&lt;br /&gt;
low, we could also check how using a continuity corrected chi-squared test would&lt;br /&gt;
alter our calculations. Continuity adjustment to chi-square is usually applied to&lt;br /&gt;
tables with one or more cells with frequencies less than five. Some authors also apply&lt;br /&gt;
it to all 2 by 2 tables since the correction gives a better approximation to the binomial&lt;br /&gt;
distribution. (Garson, G. David, 2009).&lt;br /&gt;
We here accept that our study is not powered on finding a difference smaller than 15%&lt;br /&gt;
between groups. Anticipating on a 10% attrition rate and keeping our initial assumptions&lt;br /&gt;
for the difference in proportions, we decide to include 135 (121/0.9 = 134,44) persons per&lt;br /&gt;
group, or 270 in total.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2693</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2693"/>
		<updated>2020-01-29T15:20:11Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Comparing two proportions - methods to help stop smoking */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
=== Comparing two proportions - methods to help stop smoking ===&lt;br /&gt;
Suppose we want set up a randomized controlled trial to compare two methods of helping&lt;br /&gt;
smokers to give up smoking. One group is to be given a new kind of nicotine chewing&lt;br /&gt;
gum and the other group will receive advice from their doctor and a booklet. We want to&lt;br /&gt;
know how many patients to include in our study. Based on published evidence we expect&lt;br /&gt;
that in the advice group 15% of smokers will remain non-smokers at 6 months. We would&lt;br /&gt;
be interested in an improvement to 30% in the group given gum. In nQuery we take the&lt;br /&gt;
following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two proportions and that we want to test the difference&lt;br /&gt;
between these two proportions using a Chi-square test (Figure 3).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 proportion 0.15, group 2 proportion 0.30, power 80% and see that&lt;br /&gt;
nQuery calculates 121 persons per group to be tested (Figure 4).&lt;br /&gt;
4. To test the effect of using slightly different assumptions and we repeat the calculation&lt;br /&gt;
and see that we need 250 persons per group to detect a difference between proportions&lt;br /&gt;
of 0.10 (0.15 versus 0.25) and only 73 per group to detect a difference between&lt;br /&gt;
proportions of 0.20 (0.15 versus 0.35) (Figure 4). Note: If numbers per group were&lt;br /&gt;
low, we could also check how using a continuity corrected chi-squared test would&lt;br /&gt;
alter our calculations. Continuity adjustment to chi-square is usually applied to&lt;br /&gt;
tables with one or more cells with frequencies less than five. Some authors also apply&lt;br /&gt;
it to all 2 by 2 tables since the correction gives a better approximation to the binomial&lt;br /&gt;
distribution. (Garson, G. David, 2009).&lt;br /&gt;
We here accept that our study is not powered on finding a difference smaller than 15%&lt;br /&gt;
between groups. Anticipating on a 10% attrition rate and keeping our initial assumptions&lt;br /&gt;
for the difference in proportions, we decide to include 135 (121/0.9 = 134,44) persons per&lt;br /&gt;
group, or 270 in total.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2692</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2692"/>
		<updated>2020-01-29T15:19:39Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Example of calculations */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
== Comparing two proportions - methods to help stop smoking ==&lt;br /&gt;
Suppose we want set up a randomized controlled trial to compare two methods of helping&lt;br /&gt;
smokers to give up smoking. One group is to be given a new kind of nicotine chewing&lt;br /&gt;
gum and the other group will receive advice from their doctor and a booklet. We want to&lt;br /&gt;
know how many patients to include in our study. Based on published evidence we expect&lt;br /&gt;
that in the advice group 15% of smokers will remain non-smokers at 6 months. We would&lt;br /&gt;
be interested in an improvement to 30% in the group given gum. In nQuery we take the&lt;br /&gt;
following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two proportions and that we want to test the difference&lt;br /&gt;
between these two proportions using a Chi-square test (Figure 3).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 proportion 0.15, group 2 proportion 0.30, power 80% and see that&lt;br /&gt;
nQuery calculates 121 persons per group to be tested (Figure 4).&lt;br /&gt;
4. To test the effect of using slightly different assumptions and we repeat the calculation&lt;br /&gt;
and see that we need 250 persons per group to detect a difference between proportions&lt;br /&gt;
of 0.10 (0.15 versus 0.25) and only 73 per group to detect a difference between&lt;br /&gt;
proportions of 0.20 (0.15 versus 0.35) (Figure 4). Note: If numbers per group were&lt;br /&gt;
low, we could also check how using a continuity corrected chi-squared test would&lt;br /&gt;
alter our calculations. Continuity adjustment to chi-square is usually applied to&lt;br /&gt;
tables with one or more cells with frequencies less than five. Some authors also apply&lt;br /&gt;
it to all 2 by 2 tables since the correction gives a better approximation to the binomial&lt;br /&gt;
distribution. (Garson, G. David, 2009).&lt;br /&gt;
We here accept that our study is not powered on finding a difference smaller than 15%&lt;br /&gt;
between groups. Anticipating on a 10% attrition rate and keeping our initial assumptions&lt;br /&gt;
for the difference in proportions, we decide to include 135 (121/0.9 = 134,44) persons per&lt;br /&gt;
group, or 270 in total.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2691</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2691"/>
		<updated>2020-01-29T15:19:15Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Sources of information for sample size calculations */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
== Example of calculations ==&lt;br /&gt;
=== Comparing two means - fever and chronic rhinosinusitus ===&lt;br /&gt;
Suppose we want to investigate the symptoms of patients undergoing surgery for chronic&lt;br /&gt;
rhinosinusitus (CRS). In particular we are interested whether these patients show signs&lt;br /&gt;
of fever. We plan to measure pre-operative temperature of CRS patients and of healthy&lt;br /&gt;
control patients undergoing a cosmetic nose surgery. We want to know how many patients&lt;br /&gt;
to include in our study to be able to detect a clinically relevant difference between both&lt;br /&gt;
groups.&lt;br /&gt;
From previous studies in which temperature of healthy persons was measured, we estimate that the mean temperature in the control group will be 37o C, with a standard&lt;br /&gt;
deviation of 0.4. In our study we are interested in detecting the clinically relevant difference of 0.5&lt;br /&gt;
o C, which means we want to be able to detect if the CRS group has mean&lt;br /&gt;
temperature 37.5&lt;br /&gt;
o C or higher. We assume that the CRS and the nose surgery group have&lt;br /&gt;
comparable spread in temperature (common standard deviation of 0.4).&lt;br /&gt;
In nQuery we take the following steps:&lt;br /&gt;
1. We go to File → New.&lt;br /&gt;
2. We tick that we are comparing two means and that we want to test the difference&lt;br /&gt;
between these two means using a Student’s t-test assuming equal variances (Figure 1).&lt;br /&gt;
3. In the next screen we enter our study assumptions: significance level 0.05, 2 sided&lt;br /&gt;
test, group 1 mean 37, group 2 mean 37.5, common standard deviation 0.4, power&lt;br /&gt;
80% and see that nQuery calculates 12 persons per group to be tested (Figure 2).&lt;br /&gt;
4. To test the effect of slightly different assumptions on this calculation, we can alter&lt;br /&gt;
some settings and see that we need 17 persons per group to detect a difference of 0.4&lt;br /&gt;
o&lt;br /&gt;
C or to detect the difference 0.5&lt;br /&gt;
o C when standard deviation is higher (Figure 2).&lt;br /&gt;
Anticipating on a 10% attrition rate due to invalid measurements, we decide to include 19&lt;br /&gt;
(&lt;br /&gt;
17&lt;br /&gt;
0.9 = 18.9) persons per group, or 38 in total.&lt;br /&gt;
8&lt;br /&gt;
Figure 1: Standard settings for comparing two means (nQuery screenshot)&lt;br /&gt;
Figure 2: The assumptions for the CRS study (nQuery screenshot)&lt;br /&gt;
9&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2690</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2690"/>
		<updated>2020-01-29T15:18:13Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Software */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Several high quality computer programs exist for performing sample size calculations. The AMC has a license for the program nQuery Adviso and for more advanced study designs, the Helpdesk Statistics access to the program NCSS PASS 15. On the internet several free power programs exist. Reliability of these free programs is not always guaranteed.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2689</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2689"/>
		<updated>2020-01-29T15:11:33Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Advanced topics */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
&lt;br /&gt;
Several computer programs exist for performing sample size calculations. The AMC has a&lt;br /&gt;
license for the program nQuery Advisor, a user friendly application that supports several&lt;br /&gt;
study designs and types of data. For more advanced study designs, KEBB and CRU have access to the program NCSS PASS. On the&lt;br /&gt;
internet several free power programs exist. Reliability of these free programs is not always&lt;br /&gt;
ensured. We advise you to use nQuery for your power calculations and contact us when&lt;br /&gt;
the study design and/or planned analysis is not supported by nQuery.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Some study designs require other types of sample size calculations. Reseachers planning these types of studies should contact a statistician to discuss the calculations required. &lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, but to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:In some studies, patients are randomized inclusters instead of individually. Examples of clusters are physicians&#039; practices or hospital wards. In this type of study, the outcomes of patients within a cluster are not statistically independent of each other and the correlation between patients needs to be included in the sample size calculation. If multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2688</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2688"/>
		<updated>2020-01-29T15:03:51Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
&lt;br /&gt;
Several computer programs exist for performing sample size calculations. The AMC has a&lt;br /&gt;
license for the program nQuery Advisor, a user friendly application that supports several&lt;br /&gt;
study designs and types of data. For more advanced study designs, KEBB and CRU have access to the program NCSS PASS. On the&lt;br /&gt;
internet several free power programs exist. Reliability of these free programs is not always&lt;br /&gt;
ensured. We advise you to use nQuery for your power calculations and contact us when&lt;br /&gt;
the study design and/or planned analysis is not supported by nQuery.&lt;br /&gt;
&lt;br /&gt;
== Advanced topics ==&lt;br /&gt;
Several situations exist which call for more advanced sample size calculations. Here we&lt;br /&gt;
point out some of these situations to make you aware of the need for extra effort when the&lt;br /&gt;
situation occurs.&lt;br /&gt;
&lt;br /&gt;
; Equivalence design&lt;br /&gt;
: In an equivalence design you do not want to test for differences, instead you want to show equivalence. In such a design you will need to specify what your interpretation of similar is. Perfect equivalence can never be demonstrated. A limit has to be determined of which small difference between groups will be considered not meaningful and lead to the conclusion of equivalence, this is called the equivalence limit difference. Also the expected difference between groups has to be given. A special type of equivalence designs is a non-inferiority design. In this design one is interested in equivalence in only one test direction. For instance when a new, less invasive diagnostic procedure is compared to the current invasive one, the new procedure does not have to prove better than the current one. If it has at least similar diagnostic strength as the invasive one it would be preferred.&lt;br /&gt;
&lt;br /&gt;
;Clustered design &lt;br /&gt;
:When randomization of patients in not done individually but in clusters (e.g., per treating physician or per department), it is expected that the outcome of patients within a cluster are not independent of each other. In the sample size calculation the correlation between patients needs to be accounted for. Also when multiple observations per patient are obtained, the power calculation has to be suited to take along the correlation between measurements in the same patient.&lt;br /&gt;
&lt;br /&gt;
;Advanced analyses &lt;br /&gt;
:Planned statistical analyses such as survival analysis, regression analysis, and reliability analysis call for their own specific sample size calculation&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2687</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2687"/>
		<updated>2020-01-29T14:59:06Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
&lt;br /&gt;
Several computer programs exist for performing sample size calculations. The AMC has a&lt;br /&gt;
license for the program nQuery Advisor, a user friendly application that supports several&lt;br /&gt;
study designs and types of data. For more advanced study designs, KEBB and CRU have access to the program NCSS PASS. On the&lt;br /&gt;
internet several free power programs exist. Reliability of these free programs is not always&lt;br /&gt;
ensured. We advise you to use nQuery for your power calculations and contact us when&lt;br /&gt;
the study design and/or planned analysis is not supported by nQuery.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2686</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2686"/>
		<updated>2020-01-29T14:58:30Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Sources of information for sample size calculations ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
In this section we advice on how to determine or choose the necessary input values for a&lt;br /&gt;
sample size calculation.&lt;br /&gt;
Desired power of the study 80% is a common power level used in sample size calculations. It means that you accept a chance of 20% (one in five) of failing to detect an&lt;br /&gt;
effect in your study sample that is indeed present in the population (false negative).&lt;br /&gt;
If you want to reduce the change to miss out a certain effect, you should increase the&lt;br /&gt;
power level for instance to 90%. Increasing the power level will increase the sample&lt;br /&gt;
size.&lt;br /&gt;
Desired significance level 5% is a common significance level used in hypothesis testing.&lt;br /&gt;
This means that you accept a chance of 0.05 to detect an effect in your study that is&lt;br /&gt;
not present in the whole population (false positive). A reason to lower the significance&lt;br /&gt;
level might be that multiple tests are done and you do not want to detect an effect&lt;br /&gt;
just by increasing the odds of finding a false positive. Lowering the significance level&lt;br /&gt;
will increase sample size.&lt;br /&gt;
Desired test direction A two sided test is standard. It means that you test the possibility that treatment A is better than treatment B and the other option (treatment&lt;br /&gt;
B better than treatment A) simultaneously. A one sided test can only be considered&lt;br /&gt;
when a clear rationale is provided about why only one direction of the alternative&lt;br /&gt;
hypothesis is tested (ethical committees and journals are quite strict on this point,&lt;br /&gt;
some even reject all one sided tests). See e.g. Knottnerus (2001) or Peace (1989) for&lt;br /&gt;
considerations about using a one sided test for sample size calculation.&lt;br /&gt;
Clinically relevant (or expected) difference. Here you have to define the difference&lt;br /&gt;
that you would like to detect with your study. It can be the effect that has been&lt;br /&gt;
found in previous studies and that you would like to reproduce. Or in situations&lt;br /&gt;
where there are no previous studies, you can define a difference that you consider&lt;br /&gt;
clinically relevant. Information can be found in previous studies found in literature&lt;br /&gt;
or can be based on expectation from clinical practice. Since a small effect is more&lt;br /&gt;
&lt;br /&gt;
difficult to pick up than a large effect, decreasing the difference (or effect) will increase&lt;br /&gt;
sample size. Note: frequently, available time and resources do not allow the conduct&lt;br /&gt;
of a clinical trial large enough to reliably detect the smallest clinically relevant effect.&lt;br /&gt;
In these cases, one may choose a larger difference, with the realization that should&lt;br /&gt;
the trial result be negative, it will not reliably exclude the possibility of a smaller but&lt;br /&gt;
clinically-important treatment difference (Lewis, 2000). In general, you have to find a&lt;br /&gt;
balance between defining a large(r) effect that is easier to pick up (i.e. requiring fewer&lt;br /&gt;
subjects) and running the risk of obtaining a non-significant result if the difference&lt;br /&gt;
turns out smaller.&lt;br /&gt;
Expected variance / standard deviation. This should be based on pilot data or previous projects in your institute or comparable studies found in literature. When no&lt;br /&gt;
direct estimate of the standard deviation is available, nQuery (next Section) offers&lt;br /&gt;
some help tables. If high variation exists between subjects, a difference between&lt;br /&gt;
groups or an effect of intervention will be harder to pick up, so more spread in the&lt;br /&gt;
data will increase sample size.&lt;br /&gt;
Test to be used in the statistical analysis A power calculation will always be based&lt;br /&gt;
on one particular statistical analysis. Therefore, the sample size calculation forces&lt;br /&gt;
you to think about the planned data analysis in a very early phase of the study. Help&lt;br /&gt;
on the correct choice of analysis can for instance be found on the ’wiki biostatistiek’&lt;br /&gt;
(http://biostatistiek/mediawiki, available from the AMC network).&lt;br /&gt;
Attrition rate Previous studies in the same population will give an estimate of the expected number of included subjects who will not be available for analysis. This may&lt;br /&gt;
be caused by dropout or withdrawal from the study. Study burden, follow up length&lt;br /&gt;
and for instance age will influence the attrition rate. The simplest form of attrition,&lt;br /&gt;
i.e. attrition not related to the intervention or the outcome, can be easily corrected&lt;br /&gt;
for in the sample size calculation. After calculation of sample size, adjust so that&lt;br /&gt;
the number needed remains after expected loss of study subjects. For example: if an&lt;br /&gt;
attrition rate of 10% is expected, divide the number needed by 0.9 (1-attrition rate).&lt;br /&gt;
Since one never knows the exact difference, variation or attrition rate of a study on&lt;br /&gt;
beforehand, a sample size calculation remains a difficult exercise. Repeat the calculation&lt;br /&gt;
using slightly different input values and check the consequences of these modifications. If&lt;br /&gt;
absolutely no information is available for the estimation or the necessary input values, one&lt;br /&gt;
may consider doing a pilot study first.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2685</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2685"/>
		<updated>2020-01-29T14:58:00Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
== Information required to calculate a sample size ==&lt;br /&gt;
&lt;br /&gt;
To make a sample size calculation based on the power of a study one will need information&lt;br /&gt;
about each of the following values:&lt;br /&gt;
Desired power of the study 1 − β How much power do you want in the study? Or,&lt;br /&gt;
stated differently, how certain do you want to be of preventing a type II error?&lt;br /&gt;
Desired significance level α How certain do you want to be of preventing a type I error?&lt;br /&gt;
Desired test direction One or two sided test?&lt;br /&gt;
Clinically relevant (or expected) difference Which difference or which effect are you&lt;br /&gt;
trying to find?&lt;br /&gt;
&lt;br /&gt;
Expected variance / standard deviation How much variation is expected in subjects&lt;br /&gt;
belonging to the same study group?&lt;br /&gt;
Test to be used in statistical analysis How will the hypothesis test be performed in&lt;br /&gt;
the analysis phase of the study?&lt;br /&gt;
Attrition rate Anticipate on the number of included subjects who will not be available&lt;br /&gt;
for the study analysis.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2684</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2684"/>
		<updated>2020-01-29T14:57:39Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Power and statistical significance ==&lt;br /&gt;
The term ‘power’ pops up everywhere in medical research, certainly in sample size calculations. Often, the term power is interpreted as a synonym for the number of patients tested&lt;br /&gt;
in a study. ‘Our study did not have enough power to control for possible confounders’ is&lt;br /&gt;
understood as ‘you didn’t test enough patients to account for several effects’. ‘Our study&lt;br /&gt;
had 80% power to detect an OR of 1.1 at a significance level of 5%’ is understood as: ‘you&lt;br /&gt;
have tested enough patients to pick up a possible effect’. Although these interpretations are&lt;br /&gt;
not (absolutely) wrong, in order to use the concept of power in a sample size calculation,&lt;br /&gt;
we need to understand its exact meaning. Formally:&lt;br /&gt;
the power of a study testing the null hypothesis H0 against the alternative&lt;br /&gt;
hypothesis H1 is the probability that the test (based on a sample from this&lt;br /&gt;
population) rejects H0, given H0 is false (in the whole population).&lt;br /&gt;
So the power is the chance of correctly rejecting a null hypothesis (rejecting a null&lt;br /&gt;
hypothesis given it should be rejected). Since in most tests H0 is stated as ’no difference&lt;br /&gt;
between groups or no effect of intervention’, for example H0 = ’no difference in survival&lt;br /&gt;
between treated and control group’, rejecting H0 means you have reason to believe there&lt;br /&gt;
is a difference. In other words, the power reflects the ability to pick up an effect that is&lt;br /&gt;
present in a population using a test based on a sample from that population (true positive).&lt;br /&gt;
The power of a study is closely related to the so called type II error (β), the probability&lt;br /&gt;
of falsely accepting H0. The power of a study is 1 − β, so it is the probability of rightfully&lt;br /&gt;
rejecting H0 (see Table 1). In the table also the significance level α is stated. Alpha is the&lt;br /&gt;
probability of falsely rejecting H0, i.e., falsely picking up an effect (false positive). Note&lt;br /&gt;
that α only concerns about situations in which no true effect exists in the population.&lt;br /&gt;
In a sample size calculation one determines the number of patients needed to test the&lt;br /&gt;
hypothesis with large enough power and small enough significance level. In this way one&lt;br /&gt;
protects oneself against false negative and false positive conclusions.&lt;br /&gt;
Table 1: Possible conclusions and errors of a study in relation to the truth.&lt;br /&gt;
Whole population&lt;br /&gt;
effect exists no effect exists&lt;br /&gt;
H1 is true H0 is true&lt;br /&gt;
effect observed true positive false positive&lt;br /&gt;
Study H1 appears true power (1 − β) type I error (α)&lt;br /&gt;
conclusion no effect observed false negative true negative&lt;br /&gt;
H0 appears true type II error (β) (1 − α)&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2683</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2683"/>
		<updated>2020-01-29T14:56:54Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Why perform a sample size calculation? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, the subjects will be subjected to the risks of participating in the study in vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2682</id>
		<title>Power analysis (English)</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Power_analysis_(English)&amp;diff=2682"/>
		<updated>2020-01-29T14:47:10Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: Created page with &amp;quot;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinic...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;This text is an edited version of the AMC sample size calculation manual &amp;lt;cite&amp;gt;[geloven2009]&amp;lt;/cite&amp;gt;. It provides a practical guide into sample size calculations used in clinical research. After reading the manual, a researcher will know:&lt;br /&gt;
* why power analysis is used to plan and evaluate medical research&lt;br /&gt;
* what power and statistical significance mean&lt;br /&gt;
* what information is needed for a sample size calculation&lt;br /&gt;
* where to find the information needed&lt;br /&gt;
* how to perform a simple sample size calculation&lt;br /&gt;
* how to write down a power calculation.&lt;br /&gt;
In addition, the manual contains two practical examples of sample size calculations.&lt;br /&gt;
&lt;br /&gt;
== Why perform a sample size calculation? ==&lt;br /&gt;
The main reasons for perfomring a sample size calculation are ethical. If the number of subjects tested in a study is too small to detect the effect being investigated, pick up a possible effect in the population, study subjects are tested in&lt;br /&gt;
vain. &lt;br /&gt;
&lt;br /&gt;
The study will easily result in a false negative conclusion. On the other hand, testing too many subjects may also lead to undesirable situations. If an intervention turns out to&lt;br /&gt;
be effective, too many subjects have missed out on this intervention. If the intervention&lt;br /&gt;
is not effective, too many have been exposed to this ineffective intervention. For these&lt;br /&gt;
reasons a trial should always consider what number of subjects would be appropriate to&lt;br /&gt;
answer the study question. Sample size calculations prior to a study can help focus on the&lt;br /&gt;
number of subjects that is needed and sufficient for a study. Moreover, a sample size calculation helps one to focus on a clinically relevant effect, instead of the erroneous strategy&lt;br /&gt;
of testing as many subjects as needed to reach statistical significance of an irrelevant effect.&lt;br /&gt;
&lt;br /&gt;
The CONSORT statement (guideline for reporting clinical trials) states that&lt;br /&gt;
a researcher should calculate study size on beforehand and should report this calculation&lt;br /&gt;
in the methods section of the resulting scientific paper. The AMC Medical Ethics Board&lt;br /&gt;
(MEC) and the Animal Experiments Committee (DEC) also ask for a power calculations&lt;br /&gt;
in the approval process. The same holds for most study grant applications (e.g., ZonMW).&lt;br /&gt;
&lt;br /&gt;
Finally, the logistic planning of a study benefits from a sample size calculation.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#geloven2009 van Geloven N, Dijkgraaf M, Tanck M, Reitsma J. &#039;&#039;AMC biostatistics manual - Sample size calculation&#039;&#039;. 2009. Amsterdam: Academic Medical Center.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2681</id>
		<title>OVERZICHT</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2681"/>
		<updated>2020-01-29T14:32:20Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{| border =&amp;quot;2&amp;quot; style=&amp;quot;width:850px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;8&amp;quot;&lt;br /&gt;
! [[Poweranalyse]]!! Toetsen !! Statistische maten&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Power analysis (English)]]&lt;br /&gt;
*[[Poweranalyse#Wat is een poweranalyse|wat is een poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Wanneer heb ik een power analyse nodig?|wanneer heb ik een poweranalyse nodig]]&lt;br /&gt;
*[[Poweranalyse#Welke software is beschikbaar voor power analyse?|welke software is er voor poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Welke informatie heb ik nodig voor een power analyse?|welke informatie heb ik nodig]]&lt;br /&gt;
*[[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse?|waar vind ik de informatie]]&lt;br /&gt;
*[[Poweranalyse#Kan ik meerdere uitkomstmaten combineren in een poweranalyse?|meerdere uitkomstmaten]]&lt;br /&gt;
*[[Poweranalyse#Wanneer is een post hoc poweranalyse zinvol?|post hoc poweranalyses]]&lt;br /&gt;
*[[Poweranalyse#Poweranalyse in specifieke onderzoeksdesigns|specifieke onderzoeksdesigns]]&lt;br /&gt;
| &lt;br /&gt;
*[[Fisher&#039;s exact toets]] &lt;br /&gt;
*[[Chi-kwadraat toets]]&lt;br /&gt;
*[[McNemar toets]]&lt;br /&gt;
*[[T-toets]]&lt;br /&gt;
*[[Mann-Whitney U toets]]&lt;br /&gt;
*[[Wilcoxon signed rank toets]]&lt;br /&gt;
*[[one-way ANOVA]]&lt;br /&gt;
*[[Kruskal Wallis]]&lt;br /&gt;
*[[Friedman toets]]&lt;br /&gt;
*[[Tekentoets]]&lt;br /&gt;
*[[Cochran&#039;s Q toets]]&lt;br /&gt;
| &lt;br /&gt;
*[[gemiddelde en mediaan]]&lt;br /&gt;
*[[standaardfout/standard error]]&lt;br /&gt;
*[[betrouwbaarheidsinterval]]&lt;br /&gt;
*[[associatiematen 2x2 tabel]]&lt;br /&gt;
*[[z-scores]]&lt;br /&gt;
*[[effect maten]]&lt;br /&gt;
*[[model fit maten]]&lt;br /&gt;
*[[statistiek rapporteren]]&lt;br /&gt;
|-&lt;br /&gt;
! Regressieanalyse!! [[Herhaalde metingen]]!! [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
*[[lineaire regressie]]&lt;br /&gt;
*[[logistische regressie]]&lt;br /&gt;
*[[multivariabele regressie]]&lt;br /&gt;
*[[ANCOVA]]&lt;br /&gt;
*[[multinomiale logistische regressie]]&lt;br /&gt;
*[[ordinale logistische regressie]]&lt;br /&gt;
*[[risicoscores gebaseerd op regressiemodellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[repeated measures ANOVA]]&lt;br /&gt;
*[[generalized estimating equations]]&lt;br /&gt;
*[[mixed effects modellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[Survival analyse#kaplan meier analyse|Kaplan Meier]]&lt;br /&gt;
*[[Survival analyse#cox regressie|Cox regressie]]&lt;br /&gt;
*[[competing risk analyse]]&lt;br /&gt;
|-&lt;br /&gt;
! [[Correlatie]]!! Studieontwerp!! Overig&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Correlatie#Pearson&#039;s r|Pearson&#039;s r]]&lt;br /&gt;
*[[Correlatie#Spearman’s rho|Spearman&#039;s rho]]&lt;br /&gt;
*[[Cohen&#039;s kappa]]&lt;br /&gt;
*[[intraclass correlatie coefficient]]&lt;br /&gt;
| &lt;br /&gt;
*[[observationeel onderzoek]]&lt;br /&gt;
*[[diagnostisch onderzoek]]&lt;br /&gt;
*[[systematische reviews]]&lt;br /&gt;
*[[meta-analyse]]&lt;br /&gt;
*[[equivalentie design]]&lt;br /&gt;
| &lt;br /&gt;
*[[interimanalyse]]&lt;br /&gt;
*[[matchen]]&lt;br /&gt;
*[[multiple testing]]&lt;br /&gt;
*[[missing values]]&lt;br /&gt;
*[[outliers]]&lt;br /&gt;
*[[randomiseren]]&lt;br /&gt;
*[[statistische software]]&lt;br /&gt;
*[[grafieken]]&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar de pagina [[KEUZE TOETS]] gaan voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. De helpdesk statistiek biedt statistische ondersteuning aan  onderzoekers van het Amsterdam UMC, locatie AMC, bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm AMC intranet site van de CRU] statistische ondersteuning aanvragen.&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Template:Onderschrift&amp;diff=2674</id>
		<title>Template:Onderschrift</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Template:Onderschrift&amp;diff=2674"/>
		<updated>2019-12-27T13:39:58Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amc.uva.nl) ondersteuning aanvragen. Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=KEUZE_TOETS&amp;diff=2673</id>
		<title>KEUZE TOETS</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=KEUZE_TOETS&amp;diff=2673"/>
		<updated>2019-12-27T13:38:19Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Schema welke toets bij welke vergelijking =&lt;br /&gt;
{| border =&amp;quot;2&amp;quot; cellpadding=&amp;quot;8&amp;quot; align=&amp;quot;center&amp;quot; &lt;br /&gt;
! colspan=&amp;quot;3&amp;quot; rowspan=&amp;quot;3&amp;quot;|&lt;br /&gt;
! style=&amp;quot;background:#d0e5f5;&amp;quot; colspan=&amp;quot;5&amp;quot; |type vergelijking&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot;| 1 groep&lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot; colspan=&amp;quot;2&amp;quot;|2 groepen &lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot; colspan=&amp;quot;2&amp;quot;|&amp;gt;2 groepen&lt;br /&gt;
|-&lt;br /&gt;
! vs. referentie&lt;br /&gt;
! gepaard&lt;br /&gt;
! ongepaard&lt;br /&gt;
! gepaard&lt;br /&gt;
! ongepaard&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;background:#d0e5f5;&amp;quot; rowspan=&amp;quot;4&amp;quot; width=&amp;quot;60&amp;quot; | type data&lt;br /&gt;
!style=&amp;quot;background:#efefef;&amp;quot; rowspan=&amp;quot;2&amp;quot; width=&amp;quot;50&amp;quot;|numeriek (continu)&lt;br /&gt;
!style= width=&amp;quot;50&amp;quot; height=&amp;quot;100&amp;quot; |normaal&lt;br /&gt;
verdeeld&lt;br /&gt;
|style=&amp;quot;&amp;quot; width=&amp;quot;100&amp;quot; | [[T-toets#one sample t-toets|1 sample t-toets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; width=&amp;quot;100&amp;quot; | [[T-toets#gepaarde t-toets|gepaarde t-toets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; width=&amp;quot;100&amp;quot; |&lt;br /&gt;
[[T-toets#ongepaarde t-toets|ongepaarde t-toets]]&lt;br /&gt;
&lt;br /&gt;
|style=&amp;quot;&amp;quot; width=&amp;quot;100&amp;quot; |[[Herhaalde metingen#linear mixed models|linear mixed models]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; width=&amp;quot;100&amp;quot; |[[One-way ANOVA]]&lt;br /&gt;
|-&lt;br /&gt;
!style= height=&amp;quot;100&amp;quot; |niet normaal&lt;br /&gt;
verdeeld&lt;br /&gt;
|style=&amp;quot;&amp;quot; |[[tekentoets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; |[[Wilcoxon signed rank toets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; |[[Mann-Whitney U toets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; |[[Friedman toets]]&lt;br /&gt;
|style=&amp;quot;&amp;quot; |[[Kruskal Wallis]]&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot; rowspan=&amp;quot;2&amp;quot;| categorisch (discreet)&lt;br /&gt;
! style= height=&amp;quot;100&amp;quot; | binair&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[z-test voor proporties]]&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[McNemar toets]]&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[Chi-kwadraat toets]]/&lt;br /&gt;
[[Fisher&#039;s exact toets]]&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[Cochran&#039;s Q toets]]&lt;br /&gt;
| style=&amp;quot;&amp;quot;| [[Chi-kwadraat toets]]/[[Fisher%27s_exact_toets#Ik_heb_meer_dan_twee_categorie.C3.ABn._Kan_ik_dan_ook_Fisher.27s_exact_toets_gebruiken.3F | Fisher-Freeman-Halton exact toets]]&lt;br /&gt;
|-&lt;br /&gt;
! style= height=&amp;quot;100&amp;quot; |nominaal / &lt;br /&gt;
ordinaal&lt;br /&gt;
| style=&amp;quot;&amp;quot; |x&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[McNemar toets]] /&lt;br /&gt;
[[Wilcoxon signed rank toets]]&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[Chi-kwadraat toets]] (trend)&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[Herhaalde metingen|GLMM / GEE]]&lt;br /&gt;
| style=&amp;quot;&amp;quot; |[[Chi-kwadraat toets]] (trend)  &lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
= Schema welke analyse bij welke associatie =&lt;br /&gt;
{| border =&amp;quot;2&amp;quot; cellpadding=&amp;quot;8&amp;quot; align=&amp;quot;center&amp;quot; &lt;br /&gt;
! colspan=&amp;quot;3&amp;quot; rowspan =&amp;quot;3&amp;quot;|&lt;br /&gt;
! style=&amp;quot;background:#faecc8;&amp;quot; colspan=&amp;quot;4&amp;quot; |type associatie&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot; colspan=&amp;quot;2&amp;quot; | crosssectioneel&lt;br /&gt;
! style=&amp;quot;background:#efefef;&amp;quot; colspan=&amp;quot;2&amp;quot; |longitudinaal &lt;br /&gt;
|-&lt;br /&gt;
!width=&amp;quot;100&amp;quot; |een onafhankelijke variabele&lt;br /&gt;
!width=&amp;quot;100&amp;quot; |meer onafhankelijke variabelen&lt;br /&gt;
!width=&amp;quot;100&amp;quot; |een onafhankelijke variabele&lt;br /&gt;
!width=&amp;quot;100&amp;quot; |meer onafhankelijke variabelen&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;background:#faecc8;&amp;quot; rowspan=&amp;quot;5&amp;quot; width=&amp;quot;60&amp;quot; | type data&lt;br /&gt;
!style=&amp;quot;background:#efefef;&amp;quot; rowspan=&amp;quot;2&amp;quot; width=&amp;quot;50&amp;quot; |numeriek (continu)&lt;br /&gt;
!height=&amp;quot;100&amp;quot; width=&amp;quot;50&amp;quot;| normaal&lt;br /&gt;
verdeeld&lt;br /&gt;
|[[Correlatie#Pearson&#039;s rho|Pearson&#039;s rho]]/[[lineaire regressie|enkelvoudige lineaire regressie]]&lt;br /&gt;
 &lt;br /&gt;
|[[lineaire regressie|meervoudige lineaire regressie]]&lt;br /&gt;
|colspan=&amp;quot;2&amp;quot; rowspan=&amp;quot;2&amp;quot;| [[herhaalde metingen]]&lt;br /&gt;
|-&lt;br /&gt;
!height=&amp;quot;100&amp;quot; |niet normaal&lt;br /&gt;
verdeeld&lt;br /&gt;
|[[Correlatie#Spearman&#039;s rho|Spearman&#039;s rho]]&lt;br /&gt;
|x&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;background:#efefef;&amp;quot; rowspan=&amp;quot;1&amp;quot; | gecensureerd numeriek &lt;br /&gt;
!| &lt;br /&gt;
|&lt;br /&gt;
|&lt;br /&gt;
|[[survival analyse|Kaplan Meier analyse]]&lt;br /&gt;
|[[survival analyse#Cox regressie|Cox regressie]]&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;background:#efefef;&amp;quot; rowspan=&amp;quot;2&amp;quot; | categorisch (discreet)&lt;br /&gt;
!height=&amp;quot;100&amp;quot; |binair &lt;br /&gt;
|[[Associatiematen_2x2_tabel#Odds ratio|OR]]/ [[Associatiematen_2x2_tabel#Relatief_risico|RR]]/ [[Associatiematen_2x2_tabel#Relatieve risicoreductie|RRR]] / [[Associatiematen_2x2_tabel#Absolute_risicoreductie|ARR]] / [[Associatiematen_2x2_tabel#Number Needed to Treat|NNT]]&lt;br /&gt;
|[[logistische regressie]]&lt;br /&gt;
|colspan=&amp;quot;2&amp;quot; rowspan=&amp;quot;2&amp;quot; |[[herhaalde metingen|GLMM / GEE]]&lt;br /&gt;
|-&lt;br /&gt;
!height=&amp;quot;100&amp;quot;| nominaal&lt;br /&gt;
/ordinaal&lt;br /&gt;
|x&lt;br /&gt;
|[[multinomiale logistische regressie|multinomiale]]&lt;br /&gt;
/ [[ordinale logistische regressie]]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
= Van welk type is mijn data?=&lt;br /&gt;
&lt;br /&gt;
==Continue variabelen==&lt;br /&gt;
Het belangrijkste onderscheid naar type data is dat tussen continue en discrete variabelen. Een continue variabele kan in een bepaald interval iedere waarde aannemen. Lengte, gewicht en temperatuur zijn continue variabelen (bijvoorbeeld 37.3 graden Celsius).&lt;br /&gt;
&lt;br /&gt;
==Discrete variabelen==&lt;br /&gt;
Voor discrete variabelen wordt onderscheid gemaakt tussen kwalitatieve en kwantitatieve variabelen. De waarden die kwalitatieve variabelen kunnen aannemen zijn geen getallen, maar kenmerken. We spreken ook wel van categorische variabelen. Kwalitatieve variabelen zijn per definitie discrete variabelen. Een voorbeeld van een kwalitatieve variabele is de bepaling van de bloedgroepen A, B, AB en 0.&lt;br /&gt;
&lt;br /&gt;
Kwantitatieve discrete variabelen zijn gehele getallen. Een telling van het aantal polibezoeken van een patient is bijvoorbeeld een kwantitatieve discrete variabele. Als kwantitatieve discrete variabelen veel verschillende mogelijke waardes hebben (bijvoorbeeld het aantal CD4+ T cellen), worden ze vaak geanalyseerd als continue variabelen (er wordt dan wel eens gesproken over semi-continue data). Zijn er daarentegen maar een beperkt aantal uitkomstwaarden, dan zijn andere analysetechnieken vereist. &lt;br /&gt;
&lt;br /&gt;
Voor de statistische analyse van kwalitatieve data en van kwantitatieve discrete variabelen met een beperkt aantal uitkomstmaten, wordt onderscheid gemaakt tussen binaire, nominale en ordinale discrete variabelen.&lt;br /&gt;
&lt;br /&gt;
===Binaire variabelen===&lt;br /&gt;
Een binaire (of dichotome) uitkomstmaat heeft slechts 2 mogelijke uitkomsten of waarden. Voorbeelden zijn geslacht (man of vrouw), overleving (dood of levend) of hersteld (wel of niet).&lt;br /&gt;
&lt;br /&gt;
===Nominale variabelen===&lt;br /&gt;
Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen. Voorbeeld. &#039;Bloedgroep&#039; met als waarden A, B, AB en O of &#039;Behandeld vat&#039; met als waarden LAD, LM, RCA en RCx.&lt;br /&gt;
&lt;br /&gt;
===Ordinale variabelen===&lt;br /&gt;
Op ordinaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën wel in een vaste en zinvolle volgorde zijn te plaatsen. Bijvoorbeeld een stelling in een vragenlijst, zoals &#039;ik heb de laatste tijd vaak sombere gedachtes&#039;, met als antwoordcategorieen: &#039;geheel mee eens&#039;, &#039;mee eens&#039;, &#039;geen mening&#039;, &#039;niet mee eens&#039; en &#039;geheel niet mee eens&#039;. (Discrete) numerieke variabelen zijn per definitie ordinaal (door het numerieke karakter is er een ordening in de getallen).&lt;br /&gt;
&lt;br /&gt;
= Heb ik gepaarde of ongepaarde data?=&lt;br /&gt;
&lt;br /&gt;
Data zijn gepaard als er twee (of meer) maal bij dezelfde personen een meting gedaan is. Als er sprake is van aparte, onafhankelijke groepen, dan zijn data ongepaard. &lt;br /&gt;
&lt;br /&gt;
*Voorbeeld 1 &#039;&#039;Wij hebben bij varkens een ziekte opgewekt. Daarna hebben bij de ene groep VROEG een interventie gedaan, en bij een andere groep LAAT een interventie gedaan. Welke statistische test moet ik gebruiken als ik: 1. Binnen een groep het verschil van VOOR en NA de interventie wil testen? 2. Het verschil tussen de 2 groepen (na de interventie) wil testen?&#039;&#039; -&amp;gt; In het eerste geval zal er een gepaarde toets gedaan moeten worden, in het tweede geval een ongepaarde toets.&lt;br /&gt;
&lt;br /&gt;
*Voorbeeld 2 &#039;&#039;Er is een nieuw apparaat op de markt dat bloeddruk kan meten. Wij willen dit apparaat vergelijken met de huidige gouden standaard van bloeddrukbepalingen mbv een bloeddrukband. We hebben bij 30 patienten de bloeddruk bepaald, gelijkertijd met het nieuwe apparaat als met de gangbare bloeddrukband. Ik wil de gemiddelden van deze twee metingen, van dezelfde 30 patienten met elkaar vergelijken. Kan dit met een ongepaarde toets? Zijn dit wel onafhankelijke metingen?&#039;&#039; -&amp;gt; Indien de metingen van het apparaat en de gouden standaard band betrekking hebben op dezelfde patienten (en op hetzelfde moment), dan zijn het geen onafhankelijke metingen. Je hebt dan gepaarde metingen en als je het verschil in gemiddelde waarden wilt vergelijken zul je een gepaarde toets moeten doen.&lt;br /&gt;
&lt;br /&gt;
== Ik heb deels gepaarde en deels ongepaarde proporties, hoe kan ik deze vergelijken? ==&lt;br /&gt;
&#039;&#039;Ik vergelijk de uitkomsten van kwaliteitsindicatoren in twee verschillende databronnen. Mijn patiënten hebben een &amp;quot;partial overlap&amp;quot;: sommige kon ik matchen in beide databronnen, en sommige staan slechts in een van de twee bronnen. Dus zijn zij niet &amp;quot;paired&amp;quot; en ook niet &amp;quot;unpaired&amp;quot;. Hoe kan ik de kwaliteitsindicatoren (binaire variabelen) met elkaar vergelijken?&lt;br /&gt;
&lt;br /&gt;
De patienten die in beide bronnen voorkomen kun je vergelijken mbv een gepaarde [[McNemar toets]]. De patienten die slechts in een van de twee bronnen voorkomen kun je vergelijken met een ongepaarde [[Chi-kwadraat toets]]. Er zijn ook methoden om beide patientgroepen tegelijk te vergelijken. Zie daarvoor de volgende referenties:&lt;br /&gt;
&lt;br /&gt;
*[http://www.ncbi.nlm.nih.gov/pubmed/7481184 Thomson PC. A hybrid paired and unpaired analysis for the comparison of proportions. Stat Med. 1995 Jul 15;14(13):1463-70]&lt;br /&gt;
*[http://www-users.york.ac.uk/~mb55/overlap.pdf Comparing proportions in overlapping samples. An unpublished paper by J Martin Bland and Barbara K Butland]&lt;br /&gt;
&lt;br /&gt;
= Hoe beoordeel ik de normaliteit van mijn data? =&lt;br /&gt;
Je kunt beoordelen of de studie sample afkomstig kan zijn uit een [http://nl.wikipedia.org/wiki/Normale_verdeling normaal verdeelde populatie] door naar het histogram en naar de normaliteitsplot kijken. Ook kan er een formele toets gedaan worden. Bijvoorbeeld de Kolmogorov-Smirnoff toets of de Shapiro-Wilk toets (in SPSS 16: Analyze- Descriptive Statistics-&amp;gt;Explore, klik onder het &amp;quot;Plots&amp;quot; kopje &#039;Histogram&#039; en &#039;Normality plots with tests&#039; aan, geef eventueel de groepsvariabele op onder &amp;quot;Factor List&amp;quot;). Let er echter op dat bij grote aantallen deze tests reeds een kleine (voor de beoogde analyse mogelijk irrelevante) afwijking van normaliteit significant kan worden terwijl er bij kleine aantallen grove afwijkingen van normaliteit niet statistisch significant uit de bus komen. Baseer je beoordeling dus nooit op enkel deze testen, maak ook een grafische inschatting en weeg de aantallen mee.&lt;br /&gt;
&lt;br /&gt;
===Wanneer concludeert de Shapiro Wilk test dat data niet normaal verdeeld is?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik dacht dat een Shapiro-Wilk test met p&amp;lt;0.05 betekende dat de data niet normaal verdeeld zijn. Nu heb ik van een collega een syntax ingekeken waar een grens van 0.9 wordt aangehouden. Wat is nou waar?&lt;br /&gt;
&lt;br /&gt;
Formeel gezien, moet je bij een p&amp;lt;0.05 de nul hypothese verwerpen. In jouw geval, zou je dus op basis van de p-waarde moeten besluiten om de data als niet normaal te zien. &lt;br /&gt;
Echter, wanneer je voldoende data hebt, kun je zelfs een irrelevant, maar statistisch significante afwijking van de normale verdeling vinden. De test statistic W van de Shapiro-Wilk test loopt van 0 tot 1, waarbij 1 betekent dat de data perfect normaal verdeeld zijn. Vaak wordt meer naar deze waarde gekeken, dan naar de p-waarde, waarbij voor de W een ondergrens van 0.90 gehanteerd wordt. Als de test-stastistic W groter is dan 0.90 kan de data als normaal verdeeld beschouwd worden. (Er zijn veel voorbeelden waarbij de W &amp;gt; 0.99 is, terwijl de p &amp;lt; 0.05 is.) Soms wordt daarom aangeraden grote samples niet de Shaprio-Wilk maar de Kolmogorov-Smirnoff toets te gebruiken.&lt;br /&gt;
&lt;br /&gt;
===De Kolmogorov-Smirnoff toets uit de Explore functie geeft niet hetzelfde antwoord als die uit de &#039;Nonparametric Tests&#039; menu.===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De Kolmogorov-Smirnoff lijkt op twee manieren te kunnen via SPSS, namelijk via Explore -&amp;gt; Normality plots with tests of via Nonparametric tests -&amp;gt;1 sample K-S. Bij deze twee methoden komen er ‘omgekeerde’ resultaten uit, zo lijkt het bij mijn data.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Scherpe observatie dat de twee K-S testen niet tot dezelfde conclusie komen. Ik citeer uit de help van SPSS behorend bij de non-parametric command:&lt;br /&gt;
&lt;br /&gt;
&amp;quot;The power of the test to detect departures from the hypothesized distribution may be seriously diminished. For testing against a normal distribution with estimated parameters, consider the adjusted K-S Lilliefors test (available in the Explore procedure).&amp;quot;&lt;br /&gt;
&lt;br /&gt;
Blijkbaar is de &#039;gewone&#039; K-S test (onder de non-parametric opties) niet goed in staat om bij kleine samples een afwijking van normaliteit te vinden. Er is een correctie op de test die geimplementeerd is onder de Explore functie. (zie bijv http://en.wikipedia.org/wiki/Lilliefors_test voor details). &lt;br /&gt;
&lt;br /&gt;
Gebruik dus niet de K-S test uit de nonparametric tests opties. Beter nog: gebruik bij relatief kleine samples de Shapiro-Wilk test, deze zal als eerste een afwijking van normaliteit bemerken.&lt;br /&gt;
&lt;br /&gt;
===Hoe beoordeel ik normaliteit bij een klein aantal observaties?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voor een artikel wat ik aan het schrijven ben moet ik enkele statistische analyses doen waarbij het voor mij onduidelijk is hoe ik moet beoordelen of de te gebruiken data wel of niet normaal verdeeld zijn. Het betreft kleine aantallen proefpersonen (&amp;lt;10 patienten met voor en nameting gezien zeldzame ziektebeeld). Hierbij gaat het om algemene zaken als lichaamsgewicht en cholesterolinname en om specifiekere zaken als uitslagen van PET/CT- en MRI-scans. Een plot of histogram zegt hierbij denk ik niet zo veel (lijkt niet normaal, maar gewicht in de populatie is dat bijvoorbeeld wel). Kunt u mij vertellen hoe ik bij dit soort getallen kan beoordelen of iets wel of niet normaal verdeeld is? Is hier een stelregel voor bij kleine getallen? &lt;br /&gt;
&lt;br /&gt;
Bij twijfel over het mogen aannemen van een normale verdeling in het algemeen kan inderdaad kennis over de verdeling in de totale populatie doorslag geven. In geval van kleine aantallen echter speelt er een ander probleem. Er zal bij kleine aantallen geen betrouwbare schatting gemaakt kunnen worden van het gemiddelde en de standaard deviatie. Dus ook al is er een onderliggende normale verdeling, zal met de beschikbare data niet goed de parameters van die verdeling geschat kunnen worden. Om die reden is het bij twijfel over normaliteit en (echt) kleine aantallen aan te raden om geen normaliteit aan te nemen uit te wijken naar non-parametrische toetsen.&lt;br /&gt;
&lt;br /&gt;
=Hoe kan ik in SPSS mijn data transformeren?=&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil mijn uitkomstmaat graag transformeren om te zien of hij dan wel normaal verdeeld is. Hoe doe ik dat in SPSS?&lt;br /&gt;
&lt;br /&gt;
Dat kan onder Transform -&amp;gt; Compute Variable. Hier kun je een nieuwe variabele aanmaken die een tranformatie is van een oude variabele. Onder &#039;Target Variable&#039; type je de naam van de nieuw te maken variabele in en onder &#039;Numeric Expression&#039; type je hoe de variabele gemaakt kan worden. Bijvoorbeeld Lg10(VAROUD), om de 10 log van de variable VAROUD te nemen. &lt;br /&gt;
&lt;br /&gt;
==Ik heb een probleem met log transformatie vanwege nullen in de data==&lt;br /&gt;
&#039;&#039;Er is nog iets waar ik over struikel in de log transformaties van mijn niet-normaal verdeelde continue uitkomstmaten (een aantal schalen voor psychische klachten). Bij het &#039;computen&#039; van de log variabelen zegt SPSS iets van: &amp;quot;The argument for the Logbase 10 function is less or equal to 10 on the indicate command. The result has been set to the system missing value.&amp;quot; Ik begrijp dus dat alle 0 waarden uit de oorspronkelijk variabele niet getransformeerd kunnen worden en daarom geen waarde krijgen in de getransformeerde variabele. Is hier iets aan te doen?&lt;br /&gt;
&lt;br /&gt;
De log van 0 is inderdaad niet uit te rekenen (minus oneindig). Wat meestal gehanteerd wordt is dat er voor de transformatie bij (alle, dus ook degene die  niet nul zijn) waarden een vast getal wordt opgeteld (bijv 1). Op die manier ontwijk je de rekenproblemen met log 0 en hou je de afstand tussen de waardes in ere. De transformatie die je dan gebruikt  is eigenlijk log(x+1).&lt;br /&gt;
&lt;br /&gt;
==Wat is beter: een Mann Whitney U op niet normaal verdeelde data of een ongepaarde t-test op de log schaal van deze data welke wel normaal verdeeld zijn?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Of maakt het niet uit welke je kiest? Het verschil is klein (4 cijfers achter de komma), maar de T test komt iets significanter uit.&lt;br /&gt;
&lt;br /&gt;
Het is altijd fijn als de analysemethode het resultaat niet beinvloedt en dat er dus hetzelfde uitkomt. Een verschil in p-waarde 4 cijfers achter de komma is totaal irrevant (daarop letten veinst een nauwkeurigheid die je in het algemeen niet hebt).De voor/na delen in het algemeen zijn:&lt;br /&gt;
&lt;br /&gt;
-[[Mann-Whitney U toets]]: resultaat niet afhankelijk van aannames, non-parametrisch wordt in het algemeen als zeer objectief/betrouwbaar gezien&lt;br /&gt;
&lt;br /&gt;
-[[t-toets]]: bij normaal verdeelde data (of na transformatie normaal verdeelde data) is er in theorie meer power om iets als significant aan te kunnen duiden&lt;br /&gt;
&lt;br /&gt;
Verder zou ik letten op consistentie in het manuscript. Als je bij andere analyses wel normaliteit van de log getransformeerde data gebruikt (bijv omdat je ook [[multivariabele regressie|multivariabele analyses]] doet), is het raadzaam die lijn aan te houden.&lt;br /&gt;
&lt;br /&gt;
==Geen normaliteit na log-transformatie, wat nu?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Mijn data zijn niet niet-normaal verdeeld. Na een logaritmische transformatie blijkt nu dat de data nog steeds niet normaal verdeeld zijn. Is het zo dat men een logaritmische transformatie uitvoert om testen te kunnen uitvoeren voor normaal verdeelde data? Zo ja, heeft het dan wel zin om in mijn geval een logaritmische transformatie uit te voeren en met die getallen te werken, terwijl ik nog steeds testen met moet gebruiken voor niet-normaal verdeelde data? &lt;br /&gt;
&lt;br /&gt;
Inderdaad, de transformatie wordt iha toegepast om testen/analyses te kunnen gebruiken die normaal verdeelde data vereisen. Indien de logaritmische transformatie geen verbetering van de verdeling oplevert, dan heeft het geen zin deze te gebruiken. Indien je uitkomt qua geplande testen met non-parametrische varianten (die geen normale verdeling vereisen), dan zou ik gewoon de niet getransformeerde data gebruiken. Als normaliteit vereist is voor je doelen (bijvoorbeeld multivariabele analyse) dan zou je een andere transformatie dan de logtransformatie kunnen gebruiken.&lt;br /&gt;
&lt;br /&gt;
==Hoe maak ik in SPSS een rangvolgorde van mijn scheef verdeelde data?==&lt;br /&gt;
&lt;br /&gt;
Om een nieuwe variabele te maken die de rangnummers van de waarden van een scheef verdeelde variabele bevat, kun je gebruik maken van de &#039;Rank Cases&#039; procedure in het &#039;Transform&#039; menu.&lt;br /&gt;
&lt;br /&gt;
=Hoe ga ik om met waarden onder of boven een detectielimiet?=&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb een aantal keer de D-dimeer waarde van personen gemeten en de ondergrens van wat meetbaar is is 0.17. Daarom heb ik een aantal keer &amp;lt;0.17 in mijn database staan. Moet ik nu 0, 0.17, of een waarde ertussen neerzetten voor de analyse? Daarnaast doen we een andere test: de clot-lysis test. Bij 3 deelnemers is het zo dat ze niet lyseren en de waarde dus eigenlijk op oneindig staat (het is een waarde die in tijd tot lyseren wordt uitgedrukt). Er staat nu: &#039;no lysis&#039;. Kan ik deze deelnemers excluderen van de analyse of moet ik bijv. de bovengrens van wat nog meetbaar is neerzetten?&lt;br /&gt;
&lt;br /&gt;
Dat hangt er erg vanaf welke analyses je met de data wilt gaan doen. Waarschijnlijk zal SPSS een waarde &amp;lt;0.17 niet herkennen als een getal en mogelijk dat hij deze waardes zelfs zou verwijderen in een analyse. Indien je een niet-parametrische analyse (bijv [[Kruskal Wallis]] of [[Mann-Whitney U toets]]) gaat doen, dan kun je voor deze ‘undetectable’ waardes iedere willekeurige waarde lager dan het eerste wel gemeten getal invullen. Het maakt voor een niet-parametrische toets namelijk niet uit wat de waarde zelf is, alleen de onderlinge volgordes (ranks) van de waardes tellen. Het is dus wel van belang dat iedereen die &amp;lt;0.17 scoort dezelfde waarde krijgt.&lt;br /&gt;
&lt;br /&gt;
Voor de tweede test hangt het ook weer van de analyse af. Als je de tijd tot lyseren zou analyseren als een ‘tijd tot event’ uitkomst (bijv met [[Survival analyse|Kaplan Meier analyse of Cox regressie]]), dan zou je hen de laatste tijd moeten geven wanneer je nog zeker was dat ze niet gelyseerd waren (de laatste keer dat je dat hebt gecontroleerd). In een tweede statusvariabele zet je dan een 1 voor degenen die wel en een 0 voor degenen die niet gelyseerd waren. Als je met een non-parametrische toets aan de slag gaat, kun je weer paralel aan eerste casus een willekeurig groot (maar gelijk) getal invullen. &lt;br /&gt;
&lt;br /&gt;
Als je deze deelnemers excludeert van analyse, dan gelden je conclusies alleen voor deelnemers waarbij er lysis optreedt/bij wie D-dimeer detecteerbaar is. Dat is mogelijk zonde, want niet generaliseerbaar naar alle personen bij wie de test wordt gedaan.&lt;br /&gt;
&lt;br /&gt;
=Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?=&lt;br /&gt;
&#039;&#039;Wij hebben een bepaalde eiwit in 20 gezonde proefpersonen, 60 patiënten met ziekte A en 60 patiënten met ziekte B gemeten. De waarde van de eiwit was in 9 (45%) van de gezonde proefpersonen, 22 (37%) van de patiënten met ziekte A en 33 (55%) van de patiënten met ziekte B onder de detectielimiet. Ik heb één waarde (assigned value) onder de detectielimiet toegewezen aan alle deelnemers die onder de detectielimiet zaten. Vervolgens heb ik een Wilcoxon-signed-rank toets uitgevoerd. Is dit een valide methode? &lt;br /&gt;
&lt;br /&gt;
Als een kleine aantal waardes (dus zeg tot 5%) onder de detectie limiet vallen, kan je een assigned value gebruiken. Echter als de percentage waardes onder de detectie limiet stijgt, is het de vraag of je waardes bij elkaar nog echt continu zijn. Dit is omdat een groot aantal waardes dezelfde waarde hebben (de een &#039;assigned value&#039;). De data zijn dan niet meer echt continu, maar een mix van continu en categorisch. Dan voldoen je data niet meer aan de aannames van de Wilcoxon-signed-rank toets. Dit is zeker het geval is als 46% (64/140) van je data onder de detectie limiet vallen.&lt;br /&gt;
&lt;br /&gt;
Een optie om eenvoudig een toets hierop uit te voeren is om de uitkomst van de Granzyme B per patient als onder (0) of boven (1) de detectielimiet te classificeren. Dan kan je een [[Chi-kwadraat_toets | chi-kwadraat toets]] uitvoeren. Ik vraag me echter af of dit een goede marker is als bijna de helft van de metingen onder de detectielimiet vallen. Verder is er een uitgebreide literatuur op dit vlak, waaronder [https://dx.doi.org/10.4103%2F1477-3163.79681 deze review].&lt;br /&gt;
&lt;br /&gt;
=Referenties=&lt;br /&gt;
&lt;br /&gt;
*[http://www.bmj.com/content/312/7039/1153 Statistics Notes: The use of transformation when comparing two means. MJ Bland, DG Altman. BMJ 1996;312:1153]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of ga terug naar de [[Main_Page|startpagina]]. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt, werkt een link niet of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. De Clinical Research Unit biedt statistische ondersteuning aan AMC onderzoekers bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] statistische ondersteuning aanvragen.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2672</id>
		<title>OVERZICHT</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2672"/>
		<updated>2019-12-27T13:36:26Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{| border =&amp;quot;2&amp;quot; style=&amp;quot;width:850px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;8&amp;quot;&lt;br /&gt;
! [[Poweranalyse]]!! Toetsen !! Statistische maten&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Poweranalyse#AMC biostatistics manual - Sample size calculation|manual sample size calculation (Engels)]]&lt;br /&gt;
*[[Poweranalyse#Wat is een poweranalyse|wat is een poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Wanneer heb ik een power analyse nodig?|wanneer heb ik een poweranalyse nodig]]&lt;br /&gt;
*[[Poweranalyse#Welke software is beschikbaar voor power analyse?|welke software is er voor poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Welke informatie heb ik nodig voor een power analyse?|welke informatie heb ik nodig]]&lt;br /&gt;
*[[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse?|waar vind ik de informatie]]&lt;br /&gt;
*[[Poweranalyse#Kan ik meerdere uitkomstmaten combineren in een poweranalyse?|meerdere uitkomstmaten]]&lt;br /&gt;
*[[Poweranalyse#Wanneer is een post hoc poweranalyse zinvol?|post hoc poweranalyses]]&lt;br /&gt;
*[[Poweranalyse#Poweranalyse in specifieke onderzoeksdesigns|specifieke onderzoeksdesigns]]&lt;br /&gt;
| &lt;br /&gt;
*[[Fisher&#039;s exact toets]] &lt;br /&gt;
*[[Chi-kwadraat toets]]&lt;br /&gt;
*[[McNemar toets]]&lt;br /&gt;
*[[T-toets]]&lt;br /&gt;
*[[Mann-Whitney U toets]]&lt;br /&gt;
*[[Wilcoxon signed rank toets]]&lt;br /&gt;
*[[one-way ANOVA]]&lt;br /&gt;
*[[Kruskal Wallis]]&lt;br /&gt;
*[[Friedman toets]]&lt;br /&gt;
*[[Tekentoets]]&lt;br /&gt;
*[[Cochran&#039;s Q toets]]&lt;br /&gt;
| &lt;br /&gt;
*[[gemiddelde en mediaan]]&lt;br /&gt;
*[[standaardfout/standard error]]&lt;br /&gt;
*[[betrouwbaarheidsinterval]]&lt;br /&gt;
*[[associatiematen 2x2 tabel]]&lt;br /&gt;
*[[z-scores]]&lt;br /&gt;
*[[effect maten]]&lt;br /&gt;
*[[model fit maten]]&lt;br /&gt;
*[[statistiek rapporteren]]&lt;br /&gt;
|-&lt;br /&gt;
! Regressieanalyse!! [[Herhaalde metingen]]!! [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
*[[lineaire regressie]]&lt;br /&gt;
*[[logistische regressie]]&lt;br /&gt;
*[[multivariabele regressie]]&lt;br /&gt;
*[[ANCOVA]]&lt;br /&gt;
*[[multinomiale logistische regressie]]&lt;br /&gt;
*[[ordinale logistische regressie]]&lt;br /&gt;
*[[risicoscores gebaseerd op regressiemodellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[repeated measures ANOVA]]&lt;br /&gt;
*[[generalized estimating equations]]&lt;br /&gt;
*[[mixed effects modellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[Survival analyse#kaplan meier analyse|Kaplan Meier]]&lt;br /&gt;
*[[Survival analyse#cox regressie|Cox regressie]]&lt;br /&gt;
*[[competing risk analyse]]&lt;br /&gt;
|-&lt;br /&gt;
! [[Correlatie]]!! Studieontwerp!! Overig&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Correlatie#Pearson&#039;s r|Pearson&#039;s r]]&lt;br /&gt;
*[[Correlatie#Spearman’s rho|Spearman&#039;s rho]]&lt;br /&gt;
*[[Cohen&#039;s kappa]]&lt;br /&gt;
*[[intraclass correlatie coefficient]]&lt;br /&gt;
| &lt;br /&gt;
*[[observationeel onderzoek]]&lt;br /&gt;
*[[diagnostisch onderzoek]]&lt;br /&gt;
*[[systematische reviews]]&lt;br /&gt;
*[[meta-analyse]]&lt;br /&gt;
*[[equivalentie design]]&lt;br /&gt;
| &lt;br /&gt;
*[[interimanalyse]]&lt;br /&gt;
*[[matchen]]&lt;br /&gt;
*[[multiple testing]]&lt;br /&gt;
*[[missing values]]&lt;br /&gt;
*[[outliers]]&lt;br /&gt;
*[[randomiseren]]&lt;br /&gt;
*[[statistische software]]&lt;br /&gt;
*[[grafieken]]&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar de pagina [[KEUZE TOETS]] gaan voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de helpdesk statistiek van het Amsterdam UMC, locatie AMC. De helpdesk statistiek biedt statistische ondersteuning aan  onderzoekers van het Amsterdam UMC, locatie AMC, bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. Medewerkers van het Amsterdam UMC, locatie AMC kunnen via de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm AMC intranet site van de CRU] statistische ondersteuning aanvragen.&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Meeschrijven&amp;diff=2671</id>
		<title>Meeschrijven</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Meeschrijven&amp;diff=2671"/>
		<updated>2019-12-27T13:34:27Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__NOTOC__ &lt;br /&gt;
Deze Wiki Biostatistiek is een initiatief van de helpdesk statistiek van [https://www.amc.nl/web/Research/ResearchAMC/Research-Support.htm Het Amsterdam UMC, locatie AMC] en is gebaseerd op [http://www.mediawiki.org Mediawiki], dezelfe software die gebruikt wordt door de [http://www.wikipedia.org Wikipedia] encyclopedia. De helpdesk statistiek biedt statistische ondersteuning aan onderzoekers verbonden aan het Amsterdam UMC, locatie AMC bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. De helpdesk statistiek kan geen ondersteuning bieden bij het schrijven van een bachelorthesis of tijdens de wetenschappelijke stage van de opleiding geneeskunde of aan andere studenten. Bent u student? Dan kunt u uw vragen aan uw begeleider of de stagecoördinator stellen. De helpdesk statistiek biedt geen ondersteuning aan derden.&lt;br /&gt;
&lt;br /&gt;
Iedereen is welkom on deze website te verbeteren. Hiervoor is wel een gebruikers account nodig. Heeft u opmerkingen over of wilt u meeschrijven aan de wikistatistiek? Mail dan naar statistiek@amc.nl. &lt;br /&gt;
&lt;br /&gt;
Bent u ingelogd onder een account, klik dan op &#039;&#039;&#039;&#039;bewerken&#039;&#039;&#039;&#039; om te kunnen schrijven. U belandt in een bewerkingsscherm van de pagina waar u zich dan bevindt. Lees deze [http://nl.wikipedia.org/wiki/Help:Uitleg handleiding] en onderstaande codes om te leren hoe u de leesbaarheid van uw aanpassingen kan vergroten. Alle aanpassingen zijn direct voor iedereen zichtbaar nadat u op &#039;pagina opslaan&#039; heeft geklikt. Aanpassingen worden gemodereerd door een statisticus. Lees over het [[auteurschap]] op onze site.&lt;br /&gt;
&lt;br /&gt;
==Uitproberen?==&lt;br /&gt;
De [[Zandbak|&#039;zandbak&#039;]] is een speciale pagina om het bewerken van pagina&#039;s een keer uit te proberen.&lt;br /&gt;
&lt;br /&gt;
==Lay-out codes==&lt;br /&gt;
&lt;br /&gt;
Hieronder een &amp;quot;cheatsheet&amp;quot; met daarin veel voorkomende layout trucs. Overgenomen van [http://nl.ecgpedia.org/wiki/Hoofdpagina ECGpedia].&lt;br /&gt;
&lt;br /&gt;
{|align=&amp;quot;center&amp;quot; style=&amp;quot;width:100%; border:2px #a3b1bf solid; background:#f5faff; text-align:left;&amp;quot;&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; align=&amp;quot;center&amp;quot; style=&amp;quot;background:#cee0f2; text-align:center;&amp;quot; |&lt;br /&gt;
&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:.5em; margin-top:.1em; margin-bottom:.1em; border-bottom:0; font-weight:bold;&amp;quot;&amp;gt;Cheatsheet&amp;lt;/h2&amp;gt;&lt;br /&gt;
|-&amp;lt;!--COLUMN HEADINGS--&amp;gt;&lt;br /&gt;
| width=&amp;quot;25%&amp;quot; style=&amp;quot;background:#cee0f2; padding:0.3em; text-align:center;&amp;quot;|&#039;&#039;&#039;Description&#039;&#039;&#039;&lt;br /&gt;
| style=&amp;quot;background:#cee0f2; padding:0.3em; text-align:center;&amp;quot;|&#039;&#039;&#039;You type&#039;&#039;&#039; &lt;br /&gt;
| width=&amp;quot;25%&amp;quot; style=&amp;quot;background:#cee0f2; padding:0.3em; text-align:center;&amp;quot;|&#039;&#039;&#039;You get&#039;&#039;&#039;&lt;br /&gt;
|-&amp;lt;!--1ST HEADING--&amp;gt;&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;background:#E6F2FF; padding: 0.2em; font-family: sans-serif; font-size: 0.9em; text-align:center;&amp;quot; | Applies anywhere&lt;br /&gt;
|-&amp;lt;!--1ST ROW 1ST COLUMN--&amp;gt;&lt;br /&gt;
|[[w:How_to_edit_a_page#Character_formatting|Italicise text]]&lt;br /&gt;
|&amp;lt;!--2ND COLUMN--&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;&#039;&#039;italic&#039;&#039;&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&amp;lt;!--3RD COLUMN--&amp;gt;&lt;br /&gt;
&#039;&#039;italic&#039;&#039;&lt;br /&gt;
|-&amp;lt;!--HORIZONTAL LINE--&amp;gt;&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&amp;lt;!--2ND ROW 1ST COLUMN--&amp;gt;&lt;br /&gt;
|[[w:How_to_edit_a_page#Character_formatting|Bold text]]&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;&#039;&#039;&#039;bold&#039;&#039;&#039;&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
&#039;&#039;&#039;bold&#039;&#039;&#039;&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|[[w:How_to_edit_a_page#Character_formatting|Bold and italic]]&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;&#039;&#039;&#039;&#039;&#039;bold &amp;amp; italic&#039;&#039;&#039;&#039;&#039;&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
&#039;&#039;&#039;&#039;&#039;bold &amp;amp; italic&#039;&#039;&#039;&#039;&#039;&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
||[[w:How_to_edit_a_page#Links_and_URLs|Internal link]]&amp;lt;br /&amp;gt;&lt;br /&gt;
(within Wikipedia)&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;[[Name of page]]&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;[[Name of page|display text]]&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
[[Name of page]]&amp;lt;br /&amp;gt;&lt;br /&gt;
[[Name of page|display text]]&amp;lt;br /&amp;gt;&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|[[w:How_to_edit_a_page#Links_and_URLs|Redirect to another page]]&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;#REDIRECT [[Target page]]&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
[[Target page]]&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|[[w:How_to_edit_a_page#Links_and_URLs|External link]]&amp;lt;br /&amp;gt;&lt;br /&gt;
(to other websites)&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;[http://www.example.org]&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;[http://www.example.org display text]&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;http://www.example.org&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
[http://www.example.org]&amp;lt;br /&amp;gt;&lt;br /&gt;
[http://www.example.org display text]&amp;lt;br /&amp;gt;&lt;br /&gt;
http://www.example.org&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
Sign your posts &amp;lt;br /&amp;gt;&lt;br /&gt;
on talk pages&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;~~~~&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
[[Special:Mypage|Your username]] {{CURRENTTIME}}, &amp;lt;br /&amp;gt;&lt;br /&gt;
{{CURRENTDAY}} {{CURRENTMONTHNAME}} {{CURRENTYEAR}} (UTC) &lt;br /&gt;
|-&amp;lt;!--2ND HEADING--&amp;gt;&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;background:#E6F2FF; padding: 0.2em; font-family: sans-serif; font-size: 0.9em; text-align:center;&amp;quot; | Applies only at the beginning of the line&lt;br /&gt;
|-&lt;br /&gt;
|Headings&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;span style=&amp;quot;font-size:0.9em;&amp;quot;&amp;gt;&#039;&#039;A Table of Contents will automatically be generated when four headings are added to an article.&#039;&#039;&amp;lt;/span&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;== Level 1 ==&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;=== Level 2 ===&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;==== Level 3 ====&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;===== Level 4 =====&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;&amp;lt;nowiki&amp;gt;====== Level 5 ======&amp;lt;/nowiki&amp;gt;&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
== Level 1 ==&lt;br /&gt;
=== Level 2 ===&lt;br /&gt;
==== Level 3 ====&lt;br /&gt;
===== Level 4 =====&lt;br /&gt;
====== Level 5 ======&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;* One&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;* Two&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;** Two point one&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;* Three&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
* One&lt;br /&gt;
* Two&lt;br /&gt;
** Two point one&lt;br /&gt;
* Three&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&lt;br /&gt;
|-&lt;br /&gt;
|[[w:Help:List|Numbered list]]&lt;br /&gt;
|&lt;br /&gt;
&amp;lt;tt&amp;gt;# One&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;# Two&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;## Two point one&amp;lt;/tt&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
&amp;lt;tt&amp;gt;# Three&amp;lt;/tt&amp;gt;&lt;br /&gt;
|&lt;br /&gt;
# One&lt;br /&gt;
# Two&lt;br /&gt;
## Two point one&lt;br /&gt;
# Three&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot; style=&amp;quot;border-top:1px solid #cee0f2;&amp;quot;|&amp;amp;nbsp;&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2670</id>
		<title>Wiki Statistiek</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2670"/>
		<updated>2019-12-27T13:31:23Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:0px;margin-bottom:15px;background-color:#D1DAEB;font-size:120%;font-weight:bold;border:1px solid #faf5ff;text-align:left;color:#000;padding:0.2em 0.4em;&amp;quot;&amp;gt;&amp;lt;font color=&amp;quot;black&amp;quot;&amp;gt;&amp;lt;big&amp;gt;&#039;&#039;&#039;Welkom op de wiki biostatistiek van het [https://www.amc.nl/ Amsterdam UMC, locatie AMC.]&#039;&#039;&#039;&amp;lt;/big&amp;gt;&amp;lt;/font&amp;gt;&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In deze wiki worden antwoorden gegeven op veelgestelde vragen over statistiek in medisch onderzoek. Start uw zoektocht langs een van onze twee overzichtspagina&#039;s:&lt;br /&gt;
&lt;br /&gt;
*Via het &#039;&#039;&#039;[[OVERZICHT]]&#039;&#039;&#039; ziet u snel alle statistische onderwerpen op deze wiki.  &lt;br /&gt;
&lt;br /&gt;
*Op de pagina &#039;&#039;&#039;[[KEUZE TOETS]]&#039;&#039;&#039; kunt u kijken welke toets of analyse geschikt is voor uw data.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt; &lt;br /&gt;
&#039;&#039;&#039;Populaire pagina&#039;s&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;1&#039;&#039;&#039; || [[poweranalyse|Poweranalyse]]             || &#039;&#039;&#039;6&#039;&#039;&#039; || [[Cohen&#039;s kappa]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;2&#039;&#039;&#039; || [[lineaire regressie|Lineaire regressie]] || &#039;&#039;&#039;7&#039;&#039;&#039; || [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;3&#039;&#039;&#039; || [[herhaalde metingen|Herhaalde metingen]] || &#039;&#039;&#039;8&#039;&#039;&#039; ||[[Randomiseren]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;4&#039;&#039;&#039; || [[Logistische regressie]]                || &#039;&#039;&#039;9&#039;&#039;&#039; || [[Chi-kwadraat toets]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;5&#039;&#039;&#039; || [[t-toets|T-toets]]                 || &#039;&#039;&#039;10&#039;&#039;&#039; || [[Intraclass correlatie coefficient]]&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Laatste toevoegingen:&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;[[Systematische_reviews | De methodologie van systematische reviews]]&lt;br /&gt;
*&#039;&#039;[[Mann-Whitney_U_toets#Welke_effectmaat_kan_ik_rapporteren_als_ik_een_Mann-Whitney_U_toets_doe.3F | Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoe_bereken_ik_de_steekproefgrootte_voor_een_studie_met_.C3.A9.C3.A9n_groep.2C_waarbij_de_uitkomst_een_proportie_is.3F | Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?]]&lt;br /&gt;
*&#039;&#039;[[KEUZE_TOETS#Hoe_ga_ik_ermee_om_als_ik_veel_waarden_onder_of_boven_een_detectielimiet_heb.3F | Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F | Hoeveel patienten heb ik nodig om een predictie model te bouwen?]]&lt;br /&gt;
*&#039;&#039;[[T-toets#Wanneer_kunnen_we_gelijke_varianties_aannemen_in_de_t-toets.3F | Wanneer kunnen we gelijke varianties aannemen in de t-toets?]]&lt;br /&gt;
*&#039;&#039;[[Fisher%27s_exact_toets#Kan_ik_Fisher.27s_exact_toets_ook_bij_grotere_steekproeven_gebruiken.3F | Kan ik Fisher&#039;s exact toets ook bij grotere steekproeven gebruiken?]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&#039;&#039;&#039;Over de wiki biostatistiek&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de help desk statistiek van het Amsterdam UMC, locatie AMC. Medewerkers van het Amsterdam UMC, locatie AMC, kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amc.uva.nl) ondersteuning aanvragen.  Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2669</id>
		<title>Wiki Statistiek</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2669"/>
		<updated>2019-12-27T13:30:11Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:0px;margin-bottom:15px;background-color:#D1DAEB;font-size:120%;font-weight:bold;border:1px solid #faf5ff;text-align:left;color:#000;padding:0.2em 0.4em;&amp;quot;&amp;gt;&amp;lt;font color=&amp;quot;black&amp;quot;&amp;gt;&amp;lt;big&amp;gt;&#039;&#039;&#039;Welkom op de wiki biostatistiek van het [https://www.amc.nl/ Academisch Medisch Centrum.]&#039;&#039;&#039;&amp;lt;/big&amp;gt;&amp;lt;/font&amp;gt;&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In deze wiki worden antwoorden gegeven op veelgestelde vragen over statistiek in medisch onderzoek. Start uw zoektocht langs een van onze twee overzichtspagina&#039;s:&lt;br /&gt;
&lt;br /&gt;
*Via het &#039;&#039;&#039;[[OVERZICHT]]&#039;&#039;&#039; ziet u snel alle statistische onderwerpen op deze wiki.  &lt;br /&gt;
&lt;br /&gt;
*Op de pagina &#039;&#039;&#039;[[KEUZE TOETS]]&#039;&#039;&#039; kunt u kijken welke toets of analyse geschikt is voor uw data.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt; &lt;br /&gt;
&#039;&#039;&#039;Populaire pagina&#039;s&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;1&#039;&#039;&#039; || [[poweranalyse|Poweranalyse]]             || &#039;&#039;&#039;6&#039;&#039;&#039; || [[Cohen&#039;s kappa]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;2&#039;&#039;&#039; || [[lineaire regressie|Lineaire regressie]] || &#039;&#039;&#039;7&#039;&#039;&#039; || [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;3&#039;&#039;&#039; || [[herhaalde metingen|Herhaalde metingen]] || &#039;&#039;&#039;8&#039;&#039;&#039; ||[[Randomiseren]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;4&#039;&#039;&#039; || [[Logistische regressie]]                || &#039;&#039;&#039;9&#039;&#039;&#039; || [[Chi-kwadraat toets]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;5&#039;&#039;&#039; || [[t-toets|T-toets]]                 || &#039;&#039;&#039;10&#039;&#039;&#039; || [[Intraclass correlatie coefficient]]&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Laatste toevoegingen:&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;[[Systematische_reviews | De methodologie van systematische reviews]]&lt;br /&gt;
*&#039;&#039;[[Mann-Whitney_U_toets#Welke_effectmaat_kan_ik_rapporteren_als_ik_een_Mann-Whitney_U_toets_doe.3F | Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoe_bereken_ik_de_steekproefgrootte_voor_een_studie_met_.C3.A9.C3.A9n_groep.2C_waarbij_de_uitkomst_een_proportie_is.3F | Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?]]&lt;br /&gt;
*&#039;&#039;[[KEUZE_TOETS#Hoe_ga_ik_ermee_om_als_ik_veel_waarden_onder_of_boven_een_detectielimiet_heb.3F | Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F | Hoeveel patienten heb ik nodig om een predictie model te bouwen?]]&lt;br /&gt;
*&#039;&#039;[[T-toets#Wanneer_kunnen_we_gelijke_varianties_aannemen_in_de_t-toets.3F | Wanneer kunnen we gelijke varianties aannemen in de t-toets?]]&lt;br /&gt;
*&#039;&#039;[[Fisher%27s_exact_toets#Kan_ik_Fisher.27s_exact_toets_ook_bij_grotere_steekproeven_gebruiken.3F | Kan ik Fisher&#039;s exact toets ook bij grotere steekproeven gebruiken?]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&#039;&#039;&#039;Over de wiki biostatistiek&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de help desk statistiek van het Amsterdam UMC, locatie AMC. Medewerkers van het Amsterdam UMC, locatie AMC, kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amc.uva.nl) ondersteuning aanvragen.  Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Poweranalyse&amp;diff=2663</id>
		<title>Poweranalyse</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Poweranalyse&amp;diff=2663"/>
		<updated>2019-07-01T08:43:17Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Jan Binnekade|dr. J.M. Binnekade]]&lt;br /&gt;
|coauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
Een power analyse berekent het benodigd aantal proefpersonen (sample size) van een studie om een vooraf gedefinieerd minimaal klinisch relevant verschil met een bepaalde kans (power) waar te nemen.&lt;br /&gt;
&lt;br /&gt;
==AMC biostatistics manual - Sample size calculation==&lt;br /&gt;
&lt;br /&gt;
Zie hier de [[Media:Biostatistics manual sample size.pdf |AMC biostatistics manual - Sample size calculation]]: een praktische handleiding met uitgewerkte voorbeelden voor het uitvoeren van een sample size berekening (Engelstalig).&lt;br /&gt;
&lt;br /&gt;
==Waarom doe ik een power analyse of steekproefgrootte berekening?==&lt;br /&gt;
Een van de meest gestelde vragen vooraf aan een studie is: hoeveel patiënten, proefpersonen of proefdieren heb ik in deze studie nodig? Een belangrijke vraag; een verkeerde steekproefgrootte kan ethische bezwaren opleveren. Een onderschatting van de steekproefgrootte kan er toe leiden dat een werkelijk effect niet door de studie gedetecteerd wordt en deelnemers dus voor niets zijn getest. De studie zal dan tot een fout negatieve conclusie leiden. Een te grote steekproefgrootte kan ook tot bezwaren leiden. Als de interventie effectief blijkt, worden er onnodig veel deelnemers in de controlegroep behandeld. Als de interventie niet werkzaam blijkt, worden te veel deelnemers blootgesteld aan een ineffectieve interventie &amp;lt;cite&amp;gt;[jones2003 , florey1993]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Wanneer heb ik een power analyse nodig?==&lt;br /&gt;
Voor de uitvoering en rapportage van (vergelijkend) onderzoek gelden regels. In het [http://www.consort-statement.org/ CONSORT statement], waarin je deze regels terug vindt, staat dat een onderzoeker voordat een studie wordt uitgevoerd een sample size moet berekenen en deze in de methode sectie van het artikel moet rapporteren. Een Randomized Controlled Trial (RCT) moet inclusief sample size berekening vooraf aan de uitvoering geregistreerd worden. Bovendien krijg je zonder een goede sample size berekening geen positieve beoordeling van de Medisch Ethische Commissie. Verder is het bij de economische onderbouwing van een subsidie aanvraag en voor de logistieke planning van een studie van belang.&lt;br /&gt;
&lt;br /&gt;
==Welke software is beschikbaar voor een power analyse?==&lt;br /&gt;
Voor het berekenen van de sample size is binnen het AMC het programma [[statistische software#nQuery Advisor|nQuery Advisor]] beschikbaar. nQuery is een gevalideerd en gebruikersvriendelijk programma waarmee je voor diverse onderzoeksdesigns en data typen de groepsgrootte en statistische power kunt berekenen. nQuery is in het AMC via de &#039;&#039;softwarewinkel&#039;&#039; in de CDW voor alle medewerkers beschikbaar. Voor meer geavanceerde onderzoeksdesigns hebben een beperkte aantal medewerkers van de CRU een licentie voor het programma PASS 15. &lt;br /&gt;
&lt;br /&gt;
Andere programma&#039;s die powerberekeningen aanbieden zijn bijvoorbeeld [[statistische software#SAS|SAS]] of [[statistische software#Stata|Stata]]. Op het internet zijn bovendien meerdere gratis power programma&#039;s beschikbaar, deze zijn echter niet altijd betrouwbaar.&lt;br /&gt;
&lt;br /&gt;
==Wat is de power van een studie?==&lt;br /&gt;
&lt;br /&gt;
In de studie proberen we te bepalen of de groepen hetzelfde zijn (nul hypothese) of verschillend zijn (alternatieve hypothese) &amp;lt;cite&amp;gt;[#park2010]&amp;lt;/cite&amp;gt;. We kunnen hierbij twee typen fouten maken: een type I fout (α) en een type II fout (β). We maken een type I fout als we ten onrechte de nul hypothese verwerpen (fout positief). We maken een type II fout als we ten onrechte de nul hypothese accepteren (fout negatief). De power van een studie is 1 - β. Het is dus 1 minus de kans op het ten onrechte accepteren van de nulhypothese. Grof gezegd is het de kans om een werkelijk effect in de populatie op te pikken in de studie.&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|&lt;br /&gt;
|&lt;br /&gt;
|colspan=&amp;quot;2&amp;quot; align=&amp;quot;center&amp;quot;|Totale populatie&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;left&amp;quot; |&lt;br /&gt;
|align=&amp;quot;center&amp;quot;|&lt;br /&gt;
|width=&amp;quot;120&amp;quot; align=&amp;quot;center&amp;quot;|werkelijk effect&lt;br /&gt;
H1 waar&lt;br /&gt;
|width=&amp;quot;120&amp;quot; align=&amp;quot;center&amp;quot;|werkelijk geen effect&lt;br /&gt;
H0 waar&lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot; align=&amp;quot;center&amp;quot;|Studie&lt;br /&gt;
resultaat&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | effect gemeten&lt;br /&gt;
H1 waar&lt;br /&gt;
|align=&amp;quot;center&amp;quot; style=&amp;quot;background:#faecc8&amp;quot;  | terecht positief&lt;br /&gt;
power (1-β)&lt;br /&gt;
&lt;br /&gt;
80%&lt;br /&gt;
|align=&amp;quot;center&amp;quot; |fout positief&lt;br /&gt;
type I fout (α)&lt;br /&gt;
&lt;br /&gt;
5%&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | geen effect gemeten&lt;br /&gt;
H0 waar&lt;br /&gt;
|align=&amp;quot;center&amp;quot; | fout negatief&lt;br /&gt;
type II fout (β)&lt;br /&gt;
&lt;br /&gt;
20%&lt;br /&gt;
|align=&amp;quot;center&amp;quot; |terecht negatief&lt;br /&gt;
(1-α)&lt;br /&gt;
&lt;br /&gt;
95%&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==Welke informatie heb ik nodig voor een power analyse?==&lt;br /&gt;
Een sample size berekening is gebaseerd op (beredeneerde) aannames. Je hebt informatie nodig over de volgende onderwerpen ([[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse? |meer uitleg per onderwerp]]):&lt;br /&gt;
&lt;br /&gt;
*De gewenste power van de studie (1-β). De keuze voor het power niveau bepaalt hoe zeker je kan zijn dat een type II fout vermeden wordt.&amp;lt;br /&amp;gt;&lt;br /&gt;
*Het gewenste significantie niveau (α). Dit α niveau laat zien welke kans je accepteert om een type I fout te maken. &amp;lt;br /&amp;gt;&lt;br /&gt;
*Eenzijdige of tweezijdige toets. Toets je het verschil slechts een kant op, of hou je er rekening mee dat een studiearm zowel slechter als beter kan presteren dan de andere?&lt;br /&gt;
*Verwacht of klinisch relevant verschil. Naar welk verschil of welk effect wordt er gezocht?&lt;br /&gt;
*Verwachte spreiding / standaard deviatie. Hoeveel variatie verwacht je in de proefpersonen van dezelfde studiegroep?&amp;lt;br /&amp;gt;&lt;br /&gt;
*Welke statistische toets. Welke toets wordt gebruikt tijdens de analyse van de studie?&amp;lt;br /&amp;gt;&lt;br /&gt;
*Lost to follow up. Maak een inschatting hoeveel proefpersonen verloren zullen gaan voor de analyse zodat je hiervoor kunt corrigeren in de sample size berekening.&lt;br /&gt;
&lt;br /&gt;
==Waar vind ik de benodigde informatie voor een power analyse?==&lt;br /&gt;
&lt;br /&gt;
*De gewenste power van de studie (1-β)&lt;br /&gt;
De power geeft de kans op het vinden van een verschil dat werkelijk bestaat (in de populatie). Ofwel: de kans dat nul hypothese terecht wordt verworpen. Een gebruikelijke keuze voor de power is 1-β = 0,80. Dit betekent dat je een kans van 0.20 accepteert om een werkelijk aanwezig effect te missen in de studie. Wil je zekerder zijn om een verschil op te kunnen merken in de studie, dan zou je een hogere power (bijvoorbeeld 0,90 of 0,95) moeten gebruiken. Het verhogen van de power zal leiden tot een grotere sample size. Bijvoorbeeld: het verhogen van de power naar 0,90 bij een α van 0,05 zal je sample size ongeveer 30% doen toenemen.&lt;br /&gt;
&lt;br /&gt;
*Het gewenste significantie niveau (α)&lt;br /&gt;
De gebruikelijke keuze voor α is 0,05, je accepteert dan een kans van 5% dat je conclusie over een verschil tussen beide groepen fout positief is. In tabel 1 zie je de samenhang tussen de hypothesen en conclusies uit de studie uitgedrukt in een 2 x 2 tabel. Een reden om de α te verlagen zou kunnen zijn dat er gecorrigeerd wordt voor [[multiple testing]]. Een lager significantieniveau zal leiden tot een grotere sample size. Bijvoorbeeld: je verlaagt α naar 0,01 bij een power van 0,80 dan zal je benodigde sample size met ± 50% toenemen. De kans op een fout positieve conclusie is dan nog maar 1 procent. Als een effectief middel wordt vergeleken met een goedkoper alternatief kun je er ook voor kiezen om minder kans te lopen op een fout positieve conclusie, dus een lager α level te nemen. Je wilt geen effectief middel ten onrechte inruilen voor een niet effectief middel. In dit zelfde voorbeeld zou je wellicht ook de power te verlagen, je maakt je minder zorgen om een effectieve behandeling te missen, die heb je al. &lt;br /&gt;
&lt;br /&gt;
*Eenzijdig of tweezijdige toets&lt;br /&gt;
Je moet beslissen of er één dan wel tweezijdig getoetst gaat worden in de analyse. Gangbaar is tweezijdig. Eenzijdig toetsen is alleen verdedigbaar als het effect van een interventie onmogelijk anders kan zijn dan verwacht. Hierover is dan een uitgebreide verklaring nodig in een MEC-aanvraag of een publicatie. Bij sommige studies zijn er toch geldige overwegingen om éénzijdig te toetsen &amp;lt;cite&amp;gt;[knottnerus2001 , peace1989]&amp;lt;/cite&amp;gt;. Tweezijdig toetsen geeft een hogere sample size dan eenzijdig toetsen. &lt;br /&gt;
&lt;br /&gt;
*Verwacht of klinisch relevant effect dat je wilt kunnen aantonen&lt;br /&gt;
Bij een studie die twee groepen vergelijkt, bijvoorbeeld een controle en experimentele groep, is dit bijvoorbeeld het verschil tussen de groepen in fractie successen (dichotome uitkomst maat: succes/falen) of het verschil tussen twee gemiddelden bij een continue uitkomstmaat (verschil in gemiddelde bloeddruk). Maar het kan ieder type effect zijn, afhankelijk van wat je studie primair beoogt te schatten. De grootte van het effect dat je gebruikt in je sample size berekening is leidend voor welk effect je straks met voldoende statistische zekerheid kunt schatten/aantonen. Er zijn twee manieren om tot je keuze te komen. &lt;br /&gt;
&lt;br /&gt;
Ten eerste kun je nadenken over wat je verwacht dat het effect zal zijn. Een inschatting kun je mede maken op basis van eerdere bevindingen (literatuur of het resultaat van pilot studies). Let wel: het hoeft niet zo te zijn dat als 1 of 2 kleine studies een (positief) effect hebben beschreven, dat deze studies ook direct de meest realistische inschatting van de grootte van het werkelijke effect geven. Meestal is er sprake van enige vorm van publicatiebias (positieve resultaten vallen het meest op, worden het snelst gepubliceerd). Het kan dus verstandig om voor een reele inschatting van het effect iets lager in te zetten. Zie ook dit artikel dat uitleg geeft over hoe puntschattingen uit eerdere kleine pilotstudies niet altijd de beste raadgever zijn voor het plannen van een grote nieuwe studie &amp;lt;cite&amp;gt;[westlund2016]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Ten tweede kun je kun je de power baseren op het kleinste verschil dat je nog relevant zou vinden. Het (behandel)effect dat je gebruikt in de sample size berekening geeft dan het kleinste klinisch relevante verschil weer. Idee hierbij is dat als het werkelijke effect kleiner zou zijn, het niet de moeite is om de studie uit te voeren, omdat het dan niet tot verandering van praktijk zou leiden. Als je sterke aanwijzingen hebt dat het werkelijke effect groter te verwachten is dan het minimaal relevante effect, dan kun je ook voor dat grotere verwachte effect kiezen &amp;lt;cite&amp;gt;[EMAE9]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Het is verstandig beide aspecten in het oog te houden: het gekozen effect moet zowel relevant zijn (dus niet te klein, het moet wel uitmaken) alsook realistisch (dus niet te optimistisch groot ingeschat).&lt;br /&gt;
&lt;br /&gt;
*Verwachte spreiding / standaard deviatie&lt;br /&gt;
De inschatting van de spreiding wordt gebaseerd op eerdere bevindingen (literatuur of pilot study). Wanneer er geen directe schatting van de standaard deviatie aanwezig is, kan er met [[statistische software#nQuery Advisor|nQuery]] een schatting gemaakt worden op basis van wel bekende gegevens. &lt;br /&gt;
Als een waarneming gepaard gaat met veel variatie wordt het moeilijker om een verschil tussen groepen aan te tonen. Je hebt dan dus meer proefpersonen nodig om een verschil te vinden. Dit wordt wel vergeleken met de ruis die je op de radio hoort, hoe meer ruis (variatie) hoe moeilijker het wordt om het echte signaal (effect) te horen. &lt;br /&gt;
&lt;br /&gt;
*Welke statistische toets&lt;br /&gt;
Een sample size berekening is altijd gebaseerd op een type statistische analyse. Je moet dus al een idee hebben hoe jou data uiteindelijk geanalyseerd gaan worden. Hulp bij het maken van een keuze voor een geschikte toets staat op de pagina [[KEUZE TOETS]] van deze wiki.&lt;br /&gt;
&lt;br /&gt;
*Wat te doen als ik onvoldoende informatie heb?&lt;br /&gt;
Als er helemaal geen informatie in de literatuur te vinden is over de benodigde inschatingen, kan een pilot studie overwogen worden. Hierbij wordt een klein aantal proefpersonen getest. Met de informatie uit de pilot studie kan vervolgens een betere inschatting gemaakt worden van het totaal aantal personen nodig om de onderzoeksvraag te beantwoorden. Voor de grootte van de pilot studie spelen vaak punten als invasiviteit, maar ook kosten een rol.&lt;br /&gt;
&lt;br /&gt;
==Er is nog nooit eerder naar onze uitkomst gekeken, hoe kom ik aan een inschatting van de effectmaat?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Van een aantal uitkomsten in ons onderzoek is nog niets bekend over hoeveelheden (gemiddelden, standaarddeviaties) in onze setting (wij gaan dit voor het eerst testen en er is hier dus geen literatuur over bekend) en zodoende denk ik dat ik de effectgrootte niet kan berekenen. Hoe kan ik hier mee om gaan?&lt;br /&gt;
&lt;br /&gt;
Het is bij sample size berekening lang niet altijd nodig om een reeds in de literatuur beschreven effect te hebben. Je kunt plannen op effecten die je relevant vindt. Je wilt voldoende patiënten hebben om een relevant verschil te kunnen vinden. Je kunt op basis van externe kennis redeneren wat een relevant verschil is. &lt;br /&gt;
&lt;br /&gt;
==Kan ik meerdere uitkomstmaten combineren in een poweranalyse?==&lt;br /&gt;
Een poweranalyse kan maar op een uitkomstmaat van de studie gebaseerd worden. Meestal is dit het primaire eindpunt van de studie. &lt;br /&gt;
Echter, voor de secundaire eindpunten kan de berekende sample size onvoldoende zijn. Je kunt voor de secundaire eindpunten apart een power analyse doen en de sample size baseren op het hoogste aantal personen. Let wel op dat het uiteindelijke criterium waar de sample size op gebaseerd is nog voldoende relevant is om de (extra) personen op te testen. Ruw gezegd zijn er dus twee aanpakken mogelijk: &lt;br /&gt;
&lt;br /&gt;
- je kiest 1 van de uitkomsten (en een van de vergelijkingen) uit als de belangrijkste, de primaire uitkomstparameter. De sample size wordt dan zo gekozen dat er voldoende aantallen zijn voor deze primaire uitkomst. De andere vergelijkingen die gedaan worden in het onderzoek zijn ‘secundair’. Dat betekent dat je er niet per se voor gepowered was. Als je geen significantie vindt, kan dat liggen aan te kleine groepsgroottes. Ook als je wel significantie vindt, kun je niet al te harde conclusies verbinden, omdat je onderzoek niet gepland was op deze vergelijking, het is een soort ‘bijproduct’. &lt;br /&gt;
&lt;br /&gt;
- je berekent de benodigde groepsgrootte voor alle gewenste vergelijkingen en kiest de grootst benodigde groepsgrootte uit. Hiermee ben je op alles gepowered en zou je dus ook alles als ‘primaire uitkomstmaat’ bestempelen. Indien er meerdere vergelijkingen zijn, is het waarschijnlijk nodig om te corrigeren voor [[multiple testing]] om de fout positieve kans over je hele onderzoek/experiment onder controle te houden.&lt;br /&gt;
&lt;br /&gt;
==Corrigeert een correcte sample size berekening voor meetfouten?==&lt;br /&gt;
Een sample size berekening houdt rekening met de invloed van niet systematische fouten ofwel random variatie in de steekproef. Voor andere fouten geeft een sample size berekening geen oplossing. Dan moet je denken aan systematische fouten (bijvoorbeeld slechte ijking van meetapparatuur). Dit geldt ook voor de (ongewenste) invloed van andere variabelen op de studie uitkomsten (bijvoorbeeld confounders). Voor systematische bias moet in de studie opzet en/of in de analysefase gecorrigeerd worden.&lt;br /&gt;
&lt;br /&gt;
== Wanneer is een post hoc poweranalyse zinvol? ==&lt;br /&gt;
Een poweranalyse wordt vooraf aan een onderzoek gedaan. Echter, wanneer er bij de analyse van een studie geen significant verschil wordt gevonden en er vooraf geen poweranalyse is gedaan, kan een post hoc poweranalyse helpen de studieuitkomst te interpreteren. De powerberekening geeft dan aan of het niet significante resultaat (p waarde groter dan 0.05) te maken heeft met te weinig power, of dat je wel voldoende power had om een effect te vinden, maar het effect er gewoon niet is. In dat laatste geval is er sprake van een &amp;quot;true negative&amp;quot; resultaat, terwijl bij een te lage power je niet kan uitsluiten dat je met een &amp;quot;false negative&amp;quot; resultaat te maken hebt.&lt;br /&gt;
Bij een significant studieresultaat is het niet meer relevant om naar de power van een studie te kijken. Er is een effect opgemerkt in de studie, de kans op het missen van een aanwezig effect is niet meer aan de orde &amp;lt;cite&amp;gt;[levine2001 , goodman1994 , lenth2001]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Hoe doe ik een post hoc poweranalyse? ==&lt;br /&gt;
&lt;br /&gt;
Bij een post-hoc powerberekening probeer je achteraf (na statistische analyse) nog iets te zeggen over de power die je vooraf aan de studie had. Hierbij wil je niet weten wat de power van je studie is bij gevonden verschil, maar je wilt weten hoeveel power je had om een wellicht aanwezig verschil aan te kunnen tonen in jouw studiepopulatie. Je berekent welk effect je met bijvoorbeeld 80% power had kunnen testen met het huidige aantal proefpersonen. Een opmerking zou er als volgt uit kunnen zien: &amp;quot;Considering the number of included patients, this study would have 80% power to pick up a mean difference of &amp;gt;= ... between pre and post medication.&amp;quot;&lt;br /&gt;
&lt;br /&gt;
Vervolgens is het interessant om het verschil waarvoor je 80% power had te vergelijken met wat je een (klinisch) relevant verschil vindt. Dit zegt iets over of je voldoende power had relevante verschillen op te pikken.&lt;br /&gt;
&lt;br /&gt;
==Poweranalyse in specifieke onderzoeksdesigns==&lt;br /&gt;
&lt;br /&gt;
===Hoe doe ik een poweranalyse bij een equivalentiestudie?===&lt;br /&gt;
In een equivalentiestudie probeer je aan te tonen dat groepen hetzelfde zijn. Ook in deze groepen zal variatie in de waarnemingen aanwezig zijn. Daarom moet worden aangegeven welk (klein) verschil tussen de groepen verwaarloosbaar is, ofwel bij welk verschil zie je de groepen nog als gelijk (equivalence limit difference). Verder moet worden aangegeven welk verschil wordt verwacht (expected difference). De expected difference zal in de regel kleiner zijn dan de gehanteerde equivalence limit difference. Voor de power wordt vaak 90% gekozen, je loopt dan minder kans dat je ten onrechte de nul hypothese verwerpt, wat bij een equivalentie studie betekent dat je ten onrechte het bestaan van een verschil tussen de groepen verwerpt.&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een sample size voor een kappa coëfficiënt?===&lt;br /&gt;
Hoe vaak moeten twee beoordelaars een object beoordelen om een valide uitspraak over de [[Cohen&#039;s kappa|kappa]] te kunnen doen? In het geval van een dichotome beoordeling (bijv. ziekte is aanwezig of afwezig), kun je met [[statistische software#nQuery Advisor|nQuery]] op de volgende manier een sample size berekenen: Selecteer in het scherm Study Goal and Design (File -&amp;gt; New) onder Goal: Make Conclusion Using “Agreement”, onder Number of Groups “one” en onder Analysis Method “test”. Selecteer vervolgens Kappa (binary outcome). &lt;br /&gt;
&lt;br /&gt;
Nadat een nieuwe tabel is aangemaakt moeten de volgende gegevens worden ingevuld:&lt;br /&gt;
*Test significance level, α (bijvoorbeeld 0,05) &lt;br /&gt;
*1 or 2 sided test (meestal 2 sided)&lt;br /&gt;
*Proportion successes (verwacht percentage positieve testen)&lt;br /&gt;
*Null hypothesis agreement, geef hier een waarde op hoger dan 0 (bijv. 0,40) want je verwacht meer overeenkomst dan op basis van toeval&lt;br /&gt;
*Alternative agreement, geef de Kappa die je wilt detecteren (bijv. 0,70)&lt;br /&gt;
*Power (meestal 80% of 90%)&lt;br /&gt;
&lt;br /&gt;
nQuery berekent op basis van deze gegevens de sample size.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een steekproefgrootte voor een Fleiss kappa coëfficiënt voor meerdere categorieën en raters? ===&lt;br /&gt;
&#039;&#039;Ik wil een onderzoek uitvoeren waarbij een nog onbekende aantal raters patiënten op basis van filmbeelden beoordelen. De raters zullen de patiënten in drie of vier categorieën indelen. Hoe bereken ik hoeveel patiënten ik nodig heb?&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
Je kunt deze berekening met de R package [http://cran.r-project.org/web/packages/kappaSize/kappaSize.pdf kappaSize] uitvoeren.&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik een steekproefgrootte voor intraclass correlatie coefficient? ===&lt;br /&gt;
De methoden hiervoor worden in dit artikel beschreven &amp;lt;cite&amp;gt;[zou2012]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoe wordt een groepsgrootte berekening aangepast bij een ‘clustered’ trial?===&lt;br /&gt;
In een &#039;clustered&#039; trial randomiseer je groepen (clusters) in plaats van individuen. Groepen zijn bijvoorbeeld afdelingen in een ziekenhuis. De patiënten in de studie worden per afdeling gerandomiseerd dus krijgen per afdeling dezelfde interventie. Het voordeel van dit studie design is dat patiënten die verschillende interventies loten elkaar niet kunnen beinvloeden (contamineren). Het nadeel is dat je in een clustered trial meer patiënten nodig hebt dan in een &#039;gewone&#039; trial. &lt;br /&gt;
Er is een relatie tussen het aantal proefpersonen in een cluster en het aantal clusters dat je nodig hebt. Hoe meer proefpersonen zich in een cluster bevinden,  hoe minder clusters je nodig hebt.  Een voorbeeld betreft huisartspraktijken &amp;lt;cite&amp;gt;[kerry1998]&amp;lt;/cite&amp;gt;:&lt;br /&gt;
&lt;br /&gt;
:Na interventie (placebo/experiment) wil men bij patienten een gemiddelde afname van 0,1 mmol/L cholesterol met een power van 90% en een significantie van 5% aantonen. De interventie wordt gerandomiseerd over huisartspraktijken. Bij 10 patienten per praktijk zijn 558 praktijken nodig (4% meer patienten dan in een trial waarbij per patient gerandomiseerd wordt). Bij 50 patienten per praktijk heb ik 126 praktijken nodig (17% meer patienten dan een gewone trial). Bij 500 patienten per praktijk ben ik met 32 clusters klaar, maar ik heb bijna 3 keer zoveel patienten nodig als in een gewone gerandomiseerde trial. De extra patienten t.g.v. het cluster effect noemt men het design effect of de inflatiefactor.&lt;br /&gt;
&lt;br /&gt;
Je hebt de voor de berekening van de sample size bij een cluster gerandomiseerde trial de volgende gegevens nodig: significantie niveau; power; standaard deviatie; klinisch relevant verschil; het aantal patienten per cluster (k); correlatie tussen patienten in hetzelfde cluster &amp;lt;math&amp;gt;\rho&amp;lt;/math&amp;gt; (gebruikelijk is &amp;lt;math&amp;gt;\rho &amp;gt; 0,05&amp;lt;/math&amp;gt;). Bij de berekening van steekproefgrootte bij cluster randomized trials wordt vaak aangeraden een zogenaamde inflatiefactor van &amp;lt;math&amp;gt;1+(n-1)\rho&amp;lt;/math&amp;gt; te gebruiken met n = de gemiddelde clustergrootte en &amp;lt;math&amp;gt;\rho&amp;lt;/math&amp;gt; de [[intraclass correlatie coefficient]]. Er is een stap voor stap uitleg hierover verschenen &amp;lt;cite&amp;gt; [mccarthy2007]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoe kan ik een sample size berekening doen in een hiërarchisch design?===&lt;br /&gt;
&lt;br /&gt;
Voor de sample size berekening in een hiërarchisch design kunnen vaak de [[Poweranalyse#Hoe_wordt_een_groepsgrootte_berekening_aangepast_bij_een_.E2.80.98clustered.E2.80.99_trial.3F | simpele aanpassingsmethoden zoals bij een clustered design]] worden gebruikt. Er zijn ook geavanceerdere aanpakken waarbij je meer verwachte relaties kunt meenemen in de berekening. Neem hiervoor contact met een statisticus op.&lt;br /&gt;
&lt;br /&gt;
===Kan ik bij een diagnostische studie een poweranalyse doen?===&lt;br /&gt;
&lt;br /&gt;
Bij een diagnostische studie wordt vaak de [[diagnostisch onderzoek#Wat wordt bedoeld met sensitiviteit en specificiteit?|sensitiviteit en specificiteit]] van een diagnostisch instrument geanalyseerd. Uit een powerberekening vind je hoeveel positieve en negatieve mensen je nodig hebt om sensitiviteit en specificiteit met een bepaalde power te kunnen toetsen. Afhankelijk van hoe vaak beide typen voorkomen in de populatie heb je dan een bepaalde steekproefgrootte nodig. Je kunt je voorstellen dat het aantal van de meest zeldzame soort bepalend is voor de steekproefgrootte. Sample size voor sensitiviteit en specificiteit bereken je apart. &lt;br /&gt;
In [[statistische software#nQuery Advisor |nQuery]] kun voor een poweranalyse op de sensitiviteit bijvoorbeeld het volgende doen. Bereken de sample size voor 1 proportie (kies: Proportions – one Group – Confidence Interval). De &#039;expected proportion&#039; kun je opvatten als de beoogde sensitiviteit terwijl je met de &#039;distance from proportion to limit&#039; de gewenste breedte (1 kant op) van het betrouwbaarheidsinterval rond de sensitiviteit aangeeft. De zo berekende sample size heeft betrekking op het aantal patienten dat positief scoort op de gouden standaard. Stel je verwacht in je studiepopulatie een &#039;prevalentie&#039; van 0,33 dan moet je berekende sample size met (1/0,33=3) vermenigvuldigen voor het totaal benodigd aantal personen. Er zijn voorbeelden van dit soort berekeningen gepubliceerd &amp;lt;cite&amp;gt;[lameris2007]&amp;lt;/cite&amp;gt;, ook zijn hiervoor nomograms gepubliceerd &amp;lt;cite&amp;gt;[carley2005]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Welke informatie heb ik nodig voor een poweranalyse als ik een niet-parametrische test gebruik?===&lt;br /&gt;
Voor een steekproefgrootte berekening gebaseerd op een non-parametrische toets, bijvoorbeeld de [[Mann-Whitney U toets]] kan via een omweg toch gebruik gemaakt worden van de gemiddelde en standaard deviatie van beide groepen om de power of steekproefgrootte te bepalen. Tijdens een berekening in [[statistische software#nQuery Advisor|nQuery]] wordt de kans gevraagd dat een observatie in groep 1 kleiner is dan in groep 2 (P1 = P(X&amp;lt;Y)) als de alternatieve hypothese waar is. Dit kun je inschatten met behulp van het tabblad &#039;assistants&#039; en vervolgens te kiezen voor de optie &#039;calculate effect size&#039;. Hierin wordt gevraagd naar de gemiddelde en standaard deviatie van beide groepen. De door de assistant berekende effect size voer je vervolgens in het vorige scherm in. De rest van de berekening wijst zichzelf.&lt;br /&gt;
&lt;br /&gt;
Indien er pilot data aanwezig is, dan kan er nog preciezer een schatting gemaakt worden van de gevraagde kans (P1 = P(X&amp;lt;Y)), er kan dan namelijk gewoon geteld worden bij hoeveel van de observatieparen (meting 1 groep 1 vs meting 1 groep 2, meting 1 groep 1 vs meting 2 groep 2 etc) de meting in groep 1 kleiner was dan die in groep 2. Dit aantal gedeeld door het totaal aantal paren geeft dan de gevraagde kans.&lt;br /&gt;
&lt;br /&gt;
===Welke informatie heb ik nodig voor een poweranalyse als ik een multivariabele lineaire regressie ga doen?===&lt;br /&gt;
Een vuistregel voor sample size van een [[multivariabele regressie|multivariabele lineaire regressie]] analyse is dat per predictor (onafhankelijke variabele in het model) je minstens 10-20 patienten in je studie moet hebben. [[statistische software#nQuery Advisor|nQuery]] kan de sample size berekenen voor een multivariabel regressie model met meerdere continue predictoren. nQuery test R2=0 (geen verklaarde variantie in het model) voor normaal verdeelde covariaten. Kies in nQuery onder &#039;study goal and design&#039; voor &#039;regression&#039;, &#039;one group&#039; en voor &#039;test&#039; en bij type test voor &#039;linear regression, multiple covariates&#039;. Vervolgens geef je de volgende waarden op: test significance level (0,05); number of variables k = aantal predictors in je model; squared multiple correlation R2, wat is de verwachte verklaarde variantie ; en de power (meestal 80%). Met deze waarden kan een sample size worden berekend.&lt;br /&gt;
&lt;br /&gt;
===Is een poweranalyse zinvol bij een tevredenheidsenquete?===&lt;br /&gt;
&#039;&#039;Ik ben bezig met het plannen van een onderzoek met vragenlijsten over het gebruik en de tevredenheid van fysiotherapie bij patienten met rugklachten. Omdat het hier niet per definitie om een vergelijkend onderzoek gaat vroeg ik mij af of het nodig is om een powerberekening uit te voeren. Mocht een powerberekening niet nodig zijn, is er dan nog een andere manier om het benodigde aantal deelnemers te bepalen? Of is het in dit geval zo dat er gewoon zoveel mogelijk patiënten moeten deelnemen om een goed beeld van de huidige situatie te krijgen?&lt;br /&gt;
&lt;br /&gt;
Ook bij niet vergelijkend onderzoek is het raadzaam om een sample size berekening te doen. Want ook dan wil je verzekeren dat je de resultaten uit de studie met voldoende zekerheid kunt omkleden. Bijv zul je bij 5 van de 10 tevreden patienten een heel andere mate van bewijs hebben dan als je 50 van de 100 tevreden patienten hebt verzameld. Ook vanuit andere kant bekeken geldt dat het goed is om te kijken naar een maximum benodigd aantal, omdat je daarmee patienten (en jezelf) onnodige moeite kan besparen. Ook hier geldt dus dat er bepaald moet worden wat de belangrijkste uitkomstparameters van het onderzoek zijn, wat de verwachting hiervan is en met welke mate van precisie (bijv breedte betrouwbaarheidsinterval) de wens is hierover te rapporteren.&lt;br /&gt;
&lt;br /&gt;
===Ik bereken de sample size voor het vergelijken van twee proporties, moet ik de continuity corrected chi-square versie gebruiken?===&lt;br /&gt;
&#039;&#039;Wij willen de sample size berekening doen voor een vergelijking van 2 proporties. We verwachten 2% events in de ene groep en 30% event in de andere groep. In nQuery vind ik een optie voor chi-square test en een optie voor &amp;quot;continuity corrected&amp;quot; chi-square test. Wanneer moet ik die correctie gebruiken?&lt;br /&gt;
&lt;br /&gt;
De berekening van nQuery gebruikt (op de achtergrond, te zien in de help file) een z test voor het berekenen vna de aantallen voor het vergelijken van 2 proporties. Je kunt je voorstellen dat het er bij de omzetting van een proportie naar zo&#039;n (continue) z-verdeling een approximatie wordt gedaan. Bij relatief grote aantallen gaat dat wel goed. Bij wat kleinere aantallen is de benadering minder precies. Hiervoor is er de &#039;continuity corrected&#039; versie. Deze maakt een aanpassing om er rekening mee te houden dat de proporties bij kleine aantallen niet &#039;glad&#039; overgezet kunnen worden in een z-verdeling en zorgt voor een wat conservatievere (grotere) sample size. Er zijn helaas geen absolute grenzen vanaf waar je de continuity correctie &#039;moet&#039; gebruiken. Een grens van (totale) sample size tot 100 wordt wel eens aangehouden.&lt;br /&gt;
&lt;br /&gt;
In jullie geval waarbij er naast relatief kleine aantallen (totale n blijft ruim onder de 100) ook in 1 groep een heel kleine event rate verwacht wordt, zou ik altijd proberen te zorgen voor een veilige sample size door wel met de continuity corrected versie te werken.&lt;br /&gt;
&lt;br /&gt;
===Ik bereken de sample size voor het schatten van een enkele proportie en merk dat ik meer personen nodig heb als het % dichter bij 50% ligt, klopt dat wel?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik doe een sample size berekening voor het schatten van een enkele proportie waarbij ik een vaste wens voor de breedte van het betrouwbaarheidsinterval rondom die proportie wens. Wat mij verbaast is dat de aantallen patienten groter worden richting een verwacht percentage van 50% en hierna weer afneemt. Dit snap ik niet helemaal. Is hier een logische verklaring voor??&lt;br /&gt;
&lt;br /&gt;
Dat klopt. De verklaring daarvoor is dat het makkelijker is om een laag percentage te schatten dan een percentage dat richting de 50% gaat. Intuitief kun je hier als volgt over denken:&lt;br /&gt;
&lt;br /&gt;
Stel je hebt een (gewonen 1-6) dobbelsteen en weet niet wat er voor een punten op deze dobbelsteen staan. &lt;br /&gt;
- Je gaat eerst kijken hoe vaak de 1 voorkomt. Je gooit heel vaak met de dobbelsteen en telt hoe vaak er een 1 boven komt. Je zult hierbij al vrij snel doorhebben dat de 1 niet vaak voorkomt. Het valt snel op dat dit een laag percentage moet zijn. Een schatting van tussne 0 en 25% is snel te maken. &lt;br /&gt;
- Stel je wilt kijken hoe vaak er een even getal (2 4 of 6) boven komt. Weer ga je vaak gooien. Maar nu is het lastiger om te bepalen wat het percentage even getallen is. De ene keer komt het vaak (achter elkaar) voor, dan weer niet. Je schommelt met je schatting, bijvoorbeeld tussen de 25% en 75%. &lt;br /&gt;
&lt;br /&gt;
Je ziet dat in het tweede geval, bij een werkelijk percentage van 50% het moeilijker is om dit percentage met smalle betrouwbaarheidsband te melden dan bij het eerste geval.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patiënten heb ik bij een pilot studie nodig? ===&lt;br /&gt;
Er zijn geen duidelijke regels over hoeveel patiënten je meeneemt als je een pilot studie uitvoert. Als de doel van de pilot studie is om een schatting van de gemiddelde en standaard deviatie te krijgen, raden sommige statistici 12 patiënten per groep aan &amp;lt;cite&amp;gt;[julios2005]&amp;lt;/cite&amp;gt;. Als je een schatting van een proportie, Pearson&#039;s correlatie coëfficiënt, Cronbach&#039;s alpha coëfficiënt of de effect size wilt maken zijn andere aantallen nodig &amp;lt;cite&amp;gt;[hertzog2008]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patienten heb ik minder nodig als ik een cross-over studie doe ipv een studie met paralelle groepen?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik doe onderzoek bij gezonde proefpersonen; omdat ik ze blootstel aan straling, willen we het aantal proefpersonen beperken. Daarom overwegen we een cross-over design. In hoeverre kunnen we met dit ontwerp de groepsgrootte beperken?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende rekenregel toepassen  om het contrast in steekproefomvang  tussen het parallelle en cross-over design te bepalen &amp;lt;cite&amp;gt;[bonten2012]&amp;lt;/cite&amp;gt; &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
n_{cross-over} = \frac{((1-r) * n_{parallel})}{2}&lt;br /&gt;
&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Hierbij is r de [[Correlatie|correlatie]] tussen metingen binnen dezelfde personen. Bezwaar van een cross-over studie kan wel zijn dat de totale stralingsbelasting per patiënt hoger zal zijn. Je moet goed kunnen motiveren waarom minder patiënten meer straling geven beter is dan iedereen dezelfde straling geven. En verder moet er geen sprake zijn van carry-over of cumulerende effecten.&lt;br /&gt;
&lt;br /&gt;
===nQuery en PASS berekenen ieder een andere groepsgrootte voor mijn geplande logistische regressie, welke kan ik gebruiken?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;In mijn studie wil ik het kijken naar het verband tussen een continue uitslag van een diagnostische test en een dichotome uitkomst (gouden standaard). Ik wil daarvoor een [[logistische regressie]] te gebruiken en denk nu na over benodigde sample size. Ik heb verschillende aannames ingevoerd in zowel [[statistische software|nQuery]] als [[statistische software|PASS]], maar beide programma&#039;s geven verschillende benodigde groepsgroottes terug. Welke moet ik van uit gaan?&lt;br /&gt;
&lt;br /&gt;
Ik heb de door nQuery &amp;lt;cite&amp;gt;[hsieh1989]&amp;lt;/cite&amp;gt; en PASS &amp;lt;cite&amp;gt;[hsieh1998]&amp;lt;/cite&amp;gt; genoemde referenties erbij genomen. Hieruit blijkt dat de berekening van nQuery een ‘upper bound’ benadering gebruikt waardoor die doorgaans hogere groepsgroottes zal berekenen dan benodigd. Ik raad je dus aan om voor jouw berekening niet nQuery te gebruiken, maar PASS of om de juiste formules &amp;lt;cite&amp;gt;[hsieh1998]&amp;lt;/cite&amp;gt;zelf toe te passen.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patienten heb ik nodig voor een genome wide associatie studie?===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil in een groot cohort whole genome SNP array doen. Ik ben vooral geïnteresseerd in de meest relevante nonsynSNP met MAF &amp;gt;5%. Dit betekent dat ik in DNA van patiënten 100.000-en SNPs ga meten mbv genome wide association zoals &#039;genome wide human SNP array&#039;. Ik neem een van-te-voren geselecteerde groep patienten, bijvoorbeeld 300 waarvan 50% goede nierfunctie heeft en 50% slechte nierfunctie. Ik vroeg me af of het mogelijk is om van te voren een idee te hebben hoeveel patiënten je moet gebruiken voor voldoende power?&lt;br /&gt;
&lt;br /&gt;
De standaard poweranalyse voor GWAS is vergelijkbaar met die van een studie waar u naar 1 SNP kijkt, behalve dan dat het significantie-niveau wordt verlaagd. Meestal gebruiken we een [[Multiple_testing|Bonferroni correctie]], dus het significantie niveau wordt dan 0.05 gedeeld door het aantal SNPs. Dus als u een 250K chip gebruikt en 200K SNPs voldoen aan alle kwaliteitscriteria dan wordt het significantie niveau 0.05/200,000 = 0.00000025. Als u een groter platform gaat gebruiken met, zeg, 1,000,000 SNPs of als u SNPs gaat imputeren naar GONL of 1000genomes, dan gebruiken we de zogenaamde &amp;quot;genomewide significance&amp;quot; van 8.5x10^9. Als u de analyse beperkt tot nonsynonymous SNPs met MAF&amp;gt;5%, dan beperkt u het aantal enorm. Ik denk dat de meeste algemene platforms heel weinig van dergelijke SNPs bevatten en zelfs dedicated platforms (zoals de cardiochip, metabochip of kankerchips) hebben heel weinig van dergelijke SNPs met mAF&amp;gt;5%. Ook dan is het significantie-niveau gelijk aan 0.05/aantal resterende SNPs.&lt;br /&gt;
&lt;br /&gt;
De vergelijking die u gaat maken betreft de genotyperingen van een SNP in de groepen patienten met goede of minder goede nierfunctie. Stel dat u gaat kijken naar het percentage patienten met genotypes AA of Aa versus het genotype aa, dan kunt u die percentages &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; noemen. Over die &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; moet u uitspraken doen en daarna kunt u de standaard steekproefgrootte formule gebruiken:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
N_{\rm{per\, &lt;br /&gt;
groep}} = \frac{(z_{\alpha} + z_{\beta})^2 * (p_1*(1-p_1)+p_2*(1-p_2))}{(p_1-p_2)^2}&lt;br /&gt;
&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;\beta&amp;lt;/math&amp;gt; = 1-power en als power 80% is, dan is &amp;lt;math&amp;gt;z_{\beta}&amp;lt;/math&amp;gt;=0.84 (als power 90% is, dan is &amp;lt;math&amp;gt;z_{\beta}&amp;lt;/math&amp;gt;=1.28). &lt;br /&gt;
&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; = significantie niveau en als &amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt;=0.05, dan is  &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=1.96. Als &amp;lt;math&amp;gt;\alpha=\frac{0.05}{200000}&amp;lt;/math&amp;gt;, dan is &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=5.16 en als &amp;lt;math&amp;gt;\alpha=&amp;lt;/math&amp;gt;0.000000085 dan is &amp;lt;math&amp;gt;z_{\alpha}&amp;lt;/math&amp;gt;=5.36.&lt;br /&gt;
&lt;br /&gt;
Stel je neemt aan dat in de &amp;quot;gezonde&amp;quot; populatie het AA+Aa genotype in 10% van de personen voorkomt, dan geldt dat &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt;=0.10. Stel verder dat de [[Associatiematen_2x2_tabel#Odds_ratio|odds ratio]] van deze SNP voor het hebben van minder goede nierfunctie gelijk is aan 2.5. Dan verwacht je dat &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt; ongeveer gelijk is aan 0.10*2.5 = 0.25 (je kunt het iets preciezer uitrekenen). Om 80% power te hebben om zo&#039;n SNP significante te vinden als je 200,000 SNPs toets, dan heb je &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;&lt;br /&gt;
N_{\rm{per\, groep}} = \frac{(5.16+0.84)^2 * (0.10*(1-0.10)+0.25*(1-0.25))} {(0.10-0.25)^2} = 444&lt;br /&gt;
&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
patienten met slechte en 444 patienten met goede nier functie nodig. &lt;br /&gt;
&lt;br /&gt;
Overigens zien we zelden zulke sterke associaties bij SNPs, meestal zijn de [[Associatiematen_2x2_tabel#Odds_ratio|odds ratio&#039;s]] 1.1 of 1.2 of zoiets en dan toets je &amp;lt;math&amp;gt;p_1&amp;lt;/math&amp;gt;=0.10 versus &amp;lt;math&amp;gt;p_2&amp;lt;/math&amp;gt;=0.11 of 0.12 en zul je zien dat je heel erg veel patienten nodig hebt.&lt;br /&gt;
&lt;br /&gt;
===Hoeveel patiënten heb ik nodig om een predictie model te bouwen?===&lt;br /&gt;
&#039;&#039;Ik wil een predictie model voor een binaire (0/1) uitkomst bouwen. Van hoeveel patiënten heb ik data nodig?&#039;&#039;&lt;br /&gt;
In deze situatie gaat het niet om het aantal patienten, maar om het aantal events (&amp;quot;1&amp;quot;) en non-events (&amp;quot;0&amp;quot;). Per parameter dat je in je predictiemodel schat, heb je minimaal 20 events en minimaal 20 non-events nodig &amp;lt;cite&amp;gt;[ogundimu2016]&amp;lt;/cite&amp;gt;. Je hebt dus zoveel patiënten nodig dat het aannemelijk is dat je minimaal 20 events (bijvoorbeeld ziekenhuissterfte) en 20 non-events (bijvoorbeeld levend uit het ziekenhuis ontslagen) per parameter die je wil schatten. Maar om een goede schatting van de benodigde aantal kan het nodig zijn om ook andere factoren mee te nemen &amp;lt;cite&amp;gt;[smeden2018]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil een predictie model voor een continue uitkomst bouwen. Van hoeveel patiënten heb ik data nodig?&#039;&#039;&lt;br /&gt;
Het antwoord hierop is vrij complex, er zijn wel een aantal artikelen die handvatten rondom het aantal benodigde patiënten kunnen geven &amp;lt;cite&amp;gt;[knofczynski2007 , brooks2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Denk bij het plannen van een studie om een predictie model te bouwen ook aan de eventueel benodigde data voor het (intern)valideren van het model!&lt;br /&gt;
&lt;br /&gt;
===Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?===&lt;br /&gt;
&#039;&#039;Ik wil de steekproef voor een studie met één groep patiënten berekenen. De patiënten worden op een nieuwe manier geopereerd. Ik wil de proportie patiënten met een bepaalde complicatie bij de nieuwe operatie vergelijken met de proportie patiënten met deze complicatie bij de huidige standaard operatie. De proportie complicaties bij de huidige standaard operatie is uit de literatuur bekend en bedraagt 0,52. Ik verwacht dat de proportie complicaties bij de nieuwe manier van opereren 0,42 zal zijn. Hoe kan ik voor deze studie een steekproefgrootte berekenen?&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
In deze type studie schat je op basis van de data van patiënten uit één groep een proportie. Vervolgens vergelijk je deze proportie met een vooraf gestelde waarde van de proportie. Deze vergelijking kan je met een chi-kwadrat toets voor één proportie uitvoeren. &lt;br /&gt;
In nQuery kan je in het menu File de optie New kiezen. Vervolgens klik je bij “Goals: make conclusions using” de optie “proportions”, bij “Number of Groups” de optie “One” en bij “Analysis Method” de optie “test” aan. Vervolgens klik je in de scherm daaronder op het “+”teken naast de tekst “Single proportion”. Kies “One sample Chi-squared” en het rekenscherm verschijnt. Vul de gewenste waardes voor alpha (meestal 0,05), één of tweezijdige toets (meestal tweezijdig), de “null hypothesis proportion” (hier 0,52) , de “Alternative proportion” (hier 0,42) en de gewenste power (meestal 80%) in. Klik dan op “Enter” op je toetsenbord en de benodigde aantal patiënten in de onderzoeksgroep zal in de rij “n” verschijnen. In deze voorbeeld is dat 195.&lt;br /&gt;
&lt;br /&gt;
Als je met andere properties werkt, kan het nodig zijn om de optie &amp;quot;Exact test for single proportion&amp;quot; te gebruiken.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#park2010 Park HM. Hypothesis Testing and Statistical Power of a Test. 2010. [http://hdl.handle.net/2022/19738 Link]&lt;br /&gt;
&lt;br /&gt;
#knottnerus2001 Knottnerus JA, Bouter LM. The ethics of sample size: Two-sided testing and one-sided thinking. Journal of Clinical Epidemiology. 2001 Feb; 54(2): 109-110. [https://doi.org/10.1016/S0895-4356(00)00276-6 DOI]&lt;br /&gt;
&lt;br /&gt;
#westlund2016 Westlund E, Stuart EA. The Nonuse, Misuse, and Proper Use of Pilot Studies in Experimental Evaluation Research. American Journal of Evaluation. 2017 38(2), 246–261. [https://doi.org/10.1177/1098214016651489 DOI]&lt;br /&gt;
&lt;br /&gt;
#EMAE9 European Medicines Agency. Note for guidance on statistical principles for clinical trials (CPMP/ICH/363/96). [https://www.ema.europa.eu/documents/scientific-guideline/ich-e-9-statistical-principles-clinical-trials-step-5_en.pdf download from ema website]&lt;br /&gt;
&lt;br /&gt;
#peace1989 Peace KE. The alternative hypothesis: One-sided or two-sided? Journal of Clinical Epidemiology. 1989 42(5): 473-476. [https://doi.org/10.1016/0895-4356(89)90137-6 DOI]&lt;br /&gt;
&lt;br /&gt;
#levine2001 Levine M, Ensom MHH. Post Hoc Power Analysis: An Idea Whose Time Has Passed? Pharmacotherapy. 2001 21(4):405-409. [https://doi.org/10.1592/phco.21.5.405.34503 DOI]&lt;br /&gt;
&lt;br /&gt;
#goodman1994 Goodman SN, Berlin JA. The Use of Predicted Confidence Intervals When Planning Experiments and the Misuse of Power When Interpreting the Results. Annals Internal Medicine. 1994 121(3): 200-206. [https://doi.org/10.7326/0003-4819-121-3-199408010-00008 DOI]&lt;br /&gt;
&lt;br /&gt;
#lenth2001 Lenth RV. Some Practical Guidelines for Effective Sample Size Determination. The American Statistician. 2001 55(3): 187-193. [https://www.jstor.org/stable/2685797 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#mccarthy2007  McCarthy WF. Assessment of Sample Size and Power for the Analysis of Clustered Matched-Pair Data. COBRA Preprint Series. Working Paper 28. July 2007. [http://biostats.bepress.com/cobra/art28 DOI].&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#lameris2007 Lameris W, van Randen A, Dijkgraaf MGW, Bossuyt PMM, Stoker J, Boermeester MA. Optimization of diagnostic imaging use in patients with acute abdominal pain (OPTIMA): Design and rationale. BMC Emerg Med. 2007 7: 9.  [https://dx.doi.org/10.1186%2F1471-227X-7-9 DOI].&lt;br /&gt;
&lt;br /&gt;
#carley2005 Carley S, Dosman S, Jones SR, Harrison M. Simple nomograms to calculate sample size in diagnostic studies. Emergency Medicine Journal 2005 22(5) 180-181. [http://dx.doi.org/10.1136/emj.2003.011148 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#julios2005 Julious SA. Sample size of 12 per group rule of thumb for a pilot study. Pharmaceutical Statistics. 2005 4(4) 287-291. [https://doi.org/10.1002/pst.185 DOI].&lt;br /&gt;
&lt;br /&gt;
#hertzog2008 Hertzog MA. Considerations in determining sample size for pilot studies. Research in Nursing and Health. 2008 31(2) 180-191. [https://doi.org/10.1002/nur.20247 DOI]. &lt;br /&gt;
&lt;br /&gt;
#bonten2012 Bonten TN, Siegerink B, van der Bom JG. Cross-overstudies. Ned Tijdschr Geneeskd. 2012 156:A5542. [https://www.ntvg.nl/artikelen/cross-overstudies Link]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#hsieh1989 Hsieh FY. Sample size tables for logistic regression. Statistics in Medicine. 1989 8(7) 795-802. [https://doi.org/10.1002/sim.4780080704 DOI] &lt;br /&gt;
&lt;br /&gt;
#hsieh1998 Hsieh FY, Bloch DA, Larsen MD. A simple method of sample size calculation for linear and logistic regression. Statistics in Medicine. 1998 17(14) 1623-1634. [https://doi.org/10.1002/(SICI)1097-0258(19980730)17:14&amp;lt;1623::AID-SIM871&amp;gt;3.0.CO;2-S DOI]&lt;br /&gt;
&lt;br /&gt;
#ogundimu2016 Ogundimu EO, Altman DG, Collins GS. Adequate sample size for developing prediction models is not simply related to events per variable. Journal of Clinical Epidemiology. 2016 76 175-182. [https://doi.org/10.1016/j.jclinepi.2016.02.031 DOI]&lt;br /&gt;
&lt;br /&gt;
# smeden2018 van Smeden M, Moons KGM, de Groot JAH, Collins GS, Altman DG, Eijkemans MJC, Reitsma JB. Sample size for binary logistic prediction models: Beyond events per variable criteria. Statistical Methods in Medical Research 2018. [https://doi.org/10.1177/0962280218784726 DOI]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
#knofczynski2007 Knofczynski GT, Mundfrom D. Sample Sizes When Using Multiple Linear Regression for Prediction. Educational and Psychological Measurement. 2007 68(3). [https://doi.org/10.1177/0013164407310131 DOI]&lt;br /&gt;
&lt;br /&gt;
#brooks2012 Brooks GP, Barcikowski RS. The PEAR Method for Sample Sizes in Multiple Linear Regression. Multiple Linear Regression Viewpoints. 2012 38(2) 1-16. [http://www.glmj.org/archives/articles/Brooks_v38n2.pdf Link]&lt;br /&gt;
&lt;br /&gt;
#florey1993 Florey CD. Sample size for beginners. BMJ 1993 306 1181-4 [https://doi.org/10.1136/bmj.306.6886.1181 DOI]&lt;br /&gt;
&lt;br /&gt;
#kerry1998 Kerry SM, Bland JM, Statistics notes: sample size in cluster randomization. BMJ 1998 volume 316(5):549. [https://doi.org/10.1136/bmj.316.7130.549 DOI]&lt;br /&gt;
&lt;br /&gt;
#jones2003 Jones SR, Carley S, Harrison M.  An introduction to power and sample size estimation, Emergency Medicine Journal, 2003 20(5):453-458 [http://dx.doi.org/10.1136/emj.20.5.453 DOI]&lt;br /&gt;
&lt;br /&gt;
#zou2012 Zou GY. Sample size formulas for estimating intraclass correlation coefficients with precision and assurance. Stat Med. 2012 31(29):3972-81. [http://dx.doi.org/10.1002/sim.5466 DOI] &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2662</id>
		<title>Wiki Statistiek</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2662"/>
		<updated>2019-07-01T08:42:40Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:0px;margin-bottom:15px;background-color:#D1DAEB;font-size:120%;font-weight:bold;border:1px solid #faf5ff;text-align:left;color:#000;padding:0.2em 0.4em;&amp;quot;&amp;gt;&amp;lt;font color=&amp;quot;black&amp;quot;&amp;gt;&amp;lt;big&amp;gt;&#039;&#039;&#039;Welkom op de wiki biostatistiek van het [https://www.amc.nl/ Academisch Medisch Centrum.]&#039;&#039;&#039;&amp;lt;/big&amp;gt;&amp;lt;/font&amp;gt;&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In deze wiki worden antwoorden gegeven op veelgestelde vragen over statistiek in medisch onderzoek. Start uw zoektocht langs een van onze twee overzichtspagina&#039;s:&lt;br /&gt;
&lt;br /&gt;
*Via het &#039;&#039;&#039;[[OVERZICHT]]&#039;&#039;&#039; ziet u snel alle statistische onderwerpen op deze wiki.  &lt;br /&gt;
&lt;br /&gt;
*Op de pagina &#039;&#039;&#039;[[KEUZE TOETS]]&#039;&#039;&#039; kunt u kijken welke toets of analyse geschikt is voor uw data.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt; &lt;br /&gt;
&#039;&#039;&#039;Populaire pagina&#039;s&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;1&#039;&#039;&#039; || [[poweranalyse|Poweranalyse]]             || &#039;&#039;&#039;6&#039;&#039;&#039; || [[Cohen&#039;s kappa]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;2&#039;&#039;&#039; || [[lineaire regressie|Lineaire regressie]] || &#039;&#039;&#039;7&#039;&#039;&#039; || [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;3&#039;&#039;&#039; || [[herhaalde metingen|Herhaalde metingen]] || &#039;&#039;&#039;8&#039;&#039;&#039; ||[[Randomiseren]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;4&#039;&#039;&#039; || [[Logistische regressie]]                || &#039;&#039;&#039;9&#039;&#039;&#039; || [[Chi-kwadraat toets]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;5&#039;&#039;&#039; || [[t-toets|T-toets]]                 || &#039;&#039;&#039;10&#039;&#039;&#039; || [[Intraclass correlatie coefficient]]&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Laatste toevoegingen:&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;[[Systematische_reviews | De methodologie van systematische reviews]]&lt;br /&gt;
*&#039;&#039;[[Mann-Whitney_U_toets#Welke_effectmaat_kan_ik_rapporteren_als_ik_een_Mann-Whitney_U_toets_doe.3F | Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoe_bereken_ik_de_steekproefgrootte_voor_een_studie_met_.C3.A9.C3.A9n_groep.2C_waarbij_de_uitkomst_een_proportie_is.3F | Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?]]&lt;br /&gt;
*&#039;&#039;[[KEUZE_TOETS#Hoe_ga_ik_ermee_om_als_ik_veel_waarden_onder_of_boven_een_detectielimiet_heb.3F | Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F | Hoeveel patienten heb ik nodig om een predictie model te bouwen?]]&lt;br /&gt;
*&#039;&#039;[[T-toets#Wanneer_kunnen_we_gelijke_varianties_aannemen_in_de_t-toets.3F | Wanneer kunnen we gelijke varianties aannemen in de t-toets?]]&lt;br /&gt;
*&#039;&#039;[[Fisher%27s_exact_toets#Kan_ik_Fisher.27s_exact_toets_ook_bij_grotere_steekproeven_gebruiken.3F | Kan ik Fisher&#039;s exact toets ook bij grotere steekproeven gebruiken?]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&#039;&#039;&#039;Over de wiki biostatistiek&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de [https://www.amc.nl/web/Research/ResearchAMC/Research-Support.htm AMC Clinical Research Unit]. De Clinical Research Unit biedt o.a. statistische ondersteuning aan onderzoekers van het AMC. Medewerkers van het AMC, locatie Meiberdreef kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amc.uva.nl) ondersteuning aanvragen.  Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2658</id>
		<title>Wiki Statistiek</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Wiki_Statistiek&amp;diff=2658"/>
		<updated>2019-06-21T07:54:24Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&amp;lt;div style=&amp;quot;background:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;h2 style=&amp;quot;margin:0px;margin-bottom:15px;background-color:#D1DAEB;font-size:120%;font-weight:bold;border:1px solid #faf5ff;text-align:left;color:#000;padding:0.2em 0.4em;&amp;quot;&amp;gt;&amp;lt;font color=&amp;quot;black&amp;quot;&amp;gt;&amp;lt;big&amp;gt;&#039;&#039;&#039;Welkom op de wiki biostatistiek van het [https://www.amc.nl/ Academisch Medisch Centrum.]&#039;&#039;&#039;&amp;lt;/big&amp;gt;&amp;lt;/font&amp;gt;&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In deze wiki worden antwoorden gegeven op veelgestelde vragen over statistiek in medisch onderzoek. Start uw zoektocht langs een van onze twee overzichtspagina&#039;s:&lt;br /&gt;
&lt;br /&gt;
*Via het &#039;&#039;&#039;[[OVERZICHT]]&#039;&#039;&#039; ziet u snel alle statistische onderwerpen op deze wiki.  &lt;br /&gt;
&lt;br /&gt;
*Op de pagina &#039;&#039;&#039;[[KEUZE TOETS]]&#039;&#039;&#039; kunt u kijken welke toets of analyse geschikt is voor uw data.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt; &lt;br /&gt;
&#039;&#039;&#039;Populaire pagina&#039;s&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;1&#039;&#039;&#039; || [[poweranalyse|Poweranalyse]]             || &#039;&#039;&#039;6&#039;&#039;&#039; || [[Cohen&#039;s kappa]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;2&#039;&#039;&#039; || [[lineaire regressie|Lineaire regressie]] || &#039;&#039;&#039;7&#039;&#039;&#039; || [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;3&#039;&#039;&#039; || [[herhaalde metingen|Herhaalde metingen]] || &#039;&#039;&#039;8&#039;&#039;&#039; ||[[Randomiseren]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;4&#039;&#039;&#039; || [[Logistische regressie]]                || &#039;&#039;&#039;9&#039;&#039;&#039; || [[Chi-kwadraat toets]]&lt;br /&gt;
|-&lt;br /&gt;
| &#039;&#039;&#039;5&#039;&#039;&#039; || [[t-toets|T-toets]]                 || &#039;&#039;&#039;10&#039;&#039;&#039; || [[Intraclass correlatie coefficient]]&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Laatste toevoegingen:&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;[[Systematische_reviews | De methodologie van systematische reviews]]&lt;br /&gt;
*&#039;&#039;[[Mann-Whitney_U_toets#Welke_effectmaat_kan_ik_rapporteren_als_ik_een_Mann-Whitney_U_toets_doe.3F | Welke effectmaat kan ik rapporteren als ik een Mann-Whitney U toets doe?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoe_bereken_ik_de_steekproefgrootte_voor_een_studie_met_.C3.A9.C3.A9n_groep.2C_waarbij_de_uitkomst_een_proportie_is.3F | Hoe bereken ik de steekproefgrootte voor een studie met één groep, waarbij de uitkomst een proportie is?]]&lt;br /&gt;
*&#039;&#039;[[KEUZE_TOETS#Hoe_ga_ik_ermee_om_als_ik_veel_waarden_onder_of_boven_een_detectielimiet_heb.3F | Hoe ga ik ermee om als ik veel waarden onder of boven een detectielimiet heb?]]&lt;br /&gt;
*&#039;&#039;[[Poweranalyse#Hoeveel_pati.C3.ABnten_heb_ik_nodig_om_een_predictie_model_te_bouwen.3F | Hoeveel patienten heb ik nodig om een predictie model te bouwen?]]&lt;br /&gt;
*&#039;&#039;[[T-toets#Wanneer_kunnen_we_gelijke_varianties_aannemen_in_de_t-toets.3F | Wanneer kunnen we gelijke varianties aannemen in de t-toets?]]&lt;br /&gt;
*&#039;&#039;[[Fisher%27s_exact_toets#Kan_ik_Fisher.27s_exact_toets_ook_bij_grotere_steekproeven_gebruiken.3F | Kan ik Fisher&#039;s exact toets ook bij grotere steekproeven gebruiken?]]&lt;br /&gt;
*&#039;&#039;[[Meta-analyse#Hoe_kan_ik_een_meta-analyse_op_kwaliteit_van_leven_uitvoeren.3F | Hoe kan ik een meta-analyse op kwaliteit van leven uitvoeren?]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#fcfcfc; margin:0.5em; padding:1em; border:1px solid #960018;&amp;quot;&amp;gt;&lt;br /&gt;
&#039;&#039;&#039;Over de wiki biostatistiek&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de [https://www.amc.nl/web/Research/ResearchAMC/Research-Support.htm AMC Clinical Research Unit]. De Clinical Research Unit biedt o.a. statistische ondersteuning aan onderzoekers van het AMC. Medewerkers van het AMC, locatie Meiberdreef kunnen via [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm intranet] (e-mailadres statistiek@amc.uva.nl) ondersteuning aanvragen.  Ondersteuning aan studenten of derden is niet mogelijk!&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar het [[OVERZICHT]] van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2657</id>
		<title>Systematische reviews</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2657"/>
		<updated>2019-06-13T09:33:50Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Referenties */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Een systematisch review is een samenvatting van de literatuur over een specifiek onderwerp waarin op een transparante en gestructureerde wijze data verzameld en beschreven wordt om vertekening te voorkomen. Een systematische review kan kwalitatieve en/of kwantitatieve onderzoeken beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Systematische reviews en meta-analyses ==&lt;br /&gt;
Er zijn verschillende fases bij het uitvoeren van een systematische review: &lt;br /&gt;
# het definiëren van de onderzoeksvraag&lt;br /&gt;
# het gestructureerd zoeken in elektronische literatuur-databases en het hanteren van de gekozen in- en exclusiecriteria om de benodigde literatuur te selecteren&lt;br /&gt;
# het op methodologische kwaliteit beoordelen van de publicaties, &lt;br /&gt;
# de extractie van de benodigde gegevens uit de gekozen artikelen, &lt;br /&gt;
# het gestructureerd samenvatten van de uitkomsten van de studies en &lt;br /&gt;
# het rapporteren van de resultaten van de systematische review. &lt;br /&gt;
&lt;br /&gt;
Bij een systematische review van prognostische studies, kan een andere indeling van deze fases nuttig zijn &amp;lt;cite&amp;gt;[riley2019]&amp;lt;/cite&amp;gt;. Bij sommige systematische reviews wordt ook een [[Meta-analyse | meta-analyse]] uitgevoerd om de resultaten uit verschillende, maar methodologisch vergelijkbare studies statistisch samen te vatten &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Cochrane is een internationale organisatie die zorgverleners, beleidsmakers en patiënten helpt bij het nemen van beslissingen over gezondheidszorg. Deze organisatie doet dit door informatie over de effectiviteit van de gezondheidszorg in de vorm van systematische reviews te presenteren. Cochrane Reviews en de protocollen hiervan worden in The Cochrane Library gepubliceerd.&lt;br /&gt;
&lt;br /&gt;
== Een onderzoeksprotocol schrijven en publiceren of archiveren ==&lt;br /&gt;
Voordat onderzoekers een systematische review uitvoeren, is het aan te raden om een onderzoeksprotocol op te stellen. Zo leggen onderzoekers de onderzoeksdoelen, vraagstelling en methoden helder vast voordat zij het onderzoek uitvoeren. Bij het opstellen van het onderzoeksprotocol gebruikt men het liefst de Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols (PRISMA-P) checklijst om te controleren of alle benodigde informatie in het document is opgenomen &amp;lt;cite&amp;gt;[moher2015]&amp;lt;/cite&amp;gt;. Het is aan te raden om al bij het schrijven van het protocol contact op te nemen met een gespecialiseerd methodoloog, klinisch informatie specialist en statisticus. Het is in deze fase ook aan te raden om afspraken te maken over wie de auteurs worden en in welke volgorde zij zullen staan op de uiteindelijke publicatie.&lt;br /&gt;
Zodra het protocol is opgesteld, is het aan te raden om het protocol te publiceren of openbaar te archiveren. Onderzoekers kunnen een protocol aanmelden bij PROSPERO (International prospective register of systematic reviews) om het openbaar te archiveren. Door het protocol te publiceren of openbaar te archiveren, laat men in een latere fase aan peer-reviewers van tijdschriften zien dat de gekozen onderzoeksmethoden al vóór het uitvoeren van de review zijn vastgesteld en dat er niet zomaar is “gevist” naar een aantrekkelijk resultaat met een leuke p-waarde. Ook laat men daarmee aan andere onderzoekers zien waarmee men momenteel bezig is, hetgeen de kans verkleint op het verschijnen van systematische reviews die zeer vergelijkbaar zijn. &lt;br /&gt;
&lt;br /&gt;
== Het definiëren van de onderzoeksvraag ==&lt;br /&gt;
Bij een systematische review is het belangrijk om de vraagstelling eenduidig op te schrijven. Dit kan door de vraagstelling op basis van PICOS (Population, Interventions, Comparators, Outcomes, Study designs) te definiëren. Sommige methodologen raden oaan om hierin ook het onderdeel ‘Timeframe’ mee te nemen. Dit onderdeel geeft aan binnen welke tijdsperiode de behandeling, blootstelling of uitkomst heeft plaatsgevonden. Het is van belang om bij elk onderdeel van PICOS(T) voldoende specifiek te zijn. Een op PICOS(T) gebaseerde gedetailleerde uitwerking van de vraagstelling geeft concrete richting aan de uitvoer van het systematisch review, zoals de zoekstrategie, in- en exclusiecriteria en data-extractie. &lt;br /&gt;
&lt;br /&gt;
Als een onderzoeker een vraagstelling heeft opgesteld, is het aan te raden om in de literatuur te controleren of iemand al eerder een vergelijkbare systematische review heeft gepubliceerd of een vergelijkbaar protocol in PROPERSO heeft gearchiveerd. Als er een vergelijkbare systematische review bestaat of in voorbereiding is, moet de onderzoeker zich kritisch afvragen of zijn/haar voorgenomen systematische review een betekenisvolle toevoeging geeft aan de wetenschappelijke literatuur. &lt;br /&gt;
&lt;br /&gt;
== Het zoeken naar literatuur en het hanteren van de gekozen in- en exclusiecriteria ==&lt;br /&gt;
Na het definiëren van de onderzoeksvraag worden in- en exclusie criteria geformuleerd. Deze criteria dienen voor het opzetten van de zoekactie en het selecteren van de studies die een antwoord geven op de onderzoeksvraag. Aan de hand van de in- en exclusie criteria wordt gestructureerd en sensitief naar literatuur gezocht. Veel gebruikte bibliografische databases van wetenschappelijke publicaties zijn PubMed en Embase. Het gebruik van meerdere databases en bronnen, van zowel gepubliceerde studies als grijze literatuur, wordt aangeraden om het risico op vertekening in de dataset te voorkomen. Dit resulteert echter vaak in een groot aantal studies. &lt;br /&gt;
&lt;br /&gt;
De studies die door middel van de zoekactie gevonden zijn worden naast de in- en exclusie criteria gelegd om zo de studies te selecteren die de review vraag beantwoorden. Het is aan te raden dit selectieproces door tenminste twee leden van de onderzoeksgroep onafhankelijk van elkaar uit te voeren. &lt;br /&gt;
&lt;br /&gt;
Een klinisch informatie specialist, vaak verbonden aan de medische bibliotheek, kan ondersteuning bieden bij het op de juiste wijze omzetten van de onderzoeksvraag naar een zoekopdracht &amp;lt;cite&amp;gt;[mcgowan2016]&amp;lt;/cite&amp;gt;. Hij of zij kan ook adviseren over hoe de in- en exclusie van studies op juiste en efficiënte wijze in een zoekstrategie kunnen worden vertaald.&lt;br /&gt;
&lt;br /&gt;
== Het beoordelen van de methodologische kwaliteit ==&lt;br /&gt;
Als de onderzoeker de studies heeft geselecteerd om in de review mee te nemen, wordt een geschikte vragenlijst gebruikt om de methodologische kwaliteit hiervan te beoordelen. De juiste keuze van een vragenlijst hangt af van het onderzoeksdesign van de geïncludeerde studies. Zo zijn bijvoorbeeld vragenlijsten ontworpen voor gerandomiseerde en niet-gerandomiseerde interventie studies &amp;lt;cite&amp;gt;[higgins2011]&amp;lt;/cite&amp;gt;, diagnostische studies &amp;lt;cite&amp;gt;[whiting2011]&amp;lt;/cite&amp;gt;, case-studies &amp;lt;cite&amp;gt;[murad2018]&amp;lt;/cite&amp;gt;, en vragenlijsten voor het beantwoorden van etiologische en prognostisch onderzoeksvragen en predictiemodellen. Een gespecialiseerd methodoloog kan adviseren bij het kiezen van de juiste vragenlijst.&lt;br /&gt;
&lt;br /&gt;
== De extractie van de data en het omrekenen van de uitkomstparameters ==&lt;br /&gt;
In deze fase worden de gerapporteerde onderzoeksgegevens uit de geïncludeerde studies geëxtraheerd en in een database opgeslagen. In het AMC kan dit bijvoorbeeld in Castor. Het is af te raden om de data in Excel op te slaan, te bewerken of te analyseren omdat het in dit pakket niet mogelijk is te werken met syntaxen, hetgeen een statistische voorwaarde is van goed onderzoek doen. Het is aan te raden dat twee onderzoekers onafhankelijk van elkaar de gegevens uit de studies extraheren (double data entry). Daarna worden de twee resulterende databestanden onderling vergeleken. Als er verschillen zijn, dan worden de gegevens nogmaals met de brondocumenten vergeleken en worden de fouten gecorrigeerd. &lt;br /&gt;
&lt;br /&gt;
Tijdens het extractieproces zal soms ook besloten moeten worden welke getallen er precies uit een artikel overgenomen moeten worden. Het kan bijvoorbeeld zijn dat een getal in een tabel afwijkt van het getal in de tekst. Het is aan te raden om bij dit soort beslissingen te overleggen met de medeauteurs en te noteren wáárom voor een bepaalde waarde is gekozen. &lt;br /&gt;
Het is mogelijk dat bij het extraheren van de onderzoeksgegevens niet alle gewenste parameters in de artikelen worden gevonden. Soms is het mogelijk om deze parameters op basis van andere informatie in het artikel te berekenen. Een voorbeeld hiervan is als de &#039;[[Standaardfout/standard_error|standard error]]&#039; wordt gerapporteerd, maar de onderzoeker de standaarddeviatie nodig heeft. Afhankelijk van de beschikbare informatie kan een statisticus helpen bij het omrekenen. Maar soms is er simpelweg onvoldoende informatie beschikbaar. Dan kan men overwegen om de corresponding author te mailen om te vragen of de ontbrekende informatie elders te vinden is, dan wel die informatie op te sturen. &lt;br /&gt;
&lt;br /&gt;
== Presenteren en interpreteren van resultaten ==&lt;br /&gt;
De resultaten van de systematische review worden gepresenteerd in de vorm van tabellen en figuren, zoals een PRISMA flowchart voor het weergeven van de resultaten van de zoekstrategie. Een ‘Summary of Findings’ - tabel geeft een kort en krachtig overzicht van de hoeveelheid ‘evidence’, de kwaliteit van dat bewijs en de grootte van de effecten. Voor het beoordelen van de bewijskracht is GRADE de aangewezen methode. &lt;br /&gt;
&lt;br /&gt;
Een [[Meta-analyse | meta-analyse]] is een statistische techniek waarbij de resultaten van verschillende studies gecombineerd worden tot een &#039;overall&#039; resultaat &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;. Een belangrijke voorwaarde voor het uitvoeren van een meta-analyse is dat de studies voldoende op elkaar lijken. Het is in het algemeen af te raden om een meta-analyse uit te voeren op resultaten van een combinatie van gerandomiseerde trials, observationele cohorten en case-series. Ook is het af te raden om zeer kleine studies of studies met een “slechte” methodologische kwaliteit mee te nemen. Verder is aan te raden om na te gaan of het aannemelijk is dat elke individu slechts één keer in de meta-analyse meegenomen wordt. Dit is vooral van belang als er meerdere artikelen zijn die één gerandomiseerde trial, cohort of registratie beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Resultaten rapporteren ==&lt;br /&gt;
Bij het rapporteren of publiceren van de systematische review is het belangrijk om alle benodigde informatie hierin op te nemen. De PRISMA-richtlijnen geven hierbij een goede leidraad &amp;lt;cite&amp;gt;[moher2009]&amp;lt;/cite&amp;gt;. Soms is het voldoende om alleen de PRISMA-richtlijnen te gebruiken. Maar er zijn ook uitbreidingen hiervan gepubliceerd. Deze uitbreidingen van de PRISMA-richtlijnen geven specifieke aanwijzingen over welke informatie in bepaalde typen systematische reviews opgenomen dient te worden. Zo zijn er richtlijnen voor reviews over diagnostische studies &amp;lt;cite&amp;gt;[mcinnes2018]&amp;lt;/cite&amp;gt;, bijwerkingen &amp;lt;cite&amp;gt;[zorzela2016]&amp;lt;/cite&amp;gt; en reviews die gebruik maken van een netwerk meta-analyse &amp;lt;cite&amp;gt;[hutton2015]&amp;lt;/cite&amp;gt; of data op het niveau van de individuele patiënt &amp;lt;cite&amp;gt;[stewart2015]&amp;lt;/cite&amp;gt;. Voor reviews van kwantitatieve onderzoeken is de ENTREQ richtlijn opgesteld &amp;lt;cite&amp;gt;[tong2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Tot slot is het belangrijk om in de rapportage of publicatie duidelijk en met de betreffende referentie te vermelden dat vóór het uitvoeren van de systematische review een protocol geschreven.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
## riley2019 Riley RD, Moons KGM, Snell KIE, Ensor J, Hooft L, Altman DG, Hayden J, Collins GS, Debray TPA. A guide to systematic review and meta-analysis of prognostic factor studies. BMJ. 2019 Jan 30;364:k4597. [http://dx.doi.org/10.1136/bmj.k4597 DOI 10.1136/bmj.k4597]&lt;br /&gt;
&lt;br /&gt;
#field2010 Field AP, Gillett R. How to do a meta-analysis. Br J Math Stat Psychol. 2010 Nov;63(Pt 3):665-94. [http://dx.doi.org/10.1348/000711010X502733 DOI 10.1348/000711010X502733] &lt;br /&gt;
&lt;br /&gt;
#moher2015 Moher D, Shamseer L, Clarke M, Ghersi D, Liberati A, Petticrew M, Shekelle P, Stewart LA; PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Syst Rev. 2015 Jan 1;4:1. [http://dx.doi.org/10.1186/2046-4053-4-1 DOI 10.1186/2046-4053-4-1].&lt;br /&gt;
&lt;br /&gt;
#mcgowan2016 McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol. 2016 Jul;75:40-6.[http://dx.doi.org/10.1016/j.jclinepi.2016.01.021 DOI 10.1016/j.jclinepi.2016.01.021]. &lt;br /&gt;
&lt;br /&gt;
#higgins2011 Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, Savovic J, Schulz KF, Weeks L, Sterne JA; Cochrane Bias Methods Group; Cochrane Statistical Methods Group. The Cochrane Collaboration&#039;s tool for assessing risk of bias in randomised trials. BMJ. 2011 Oct 18;343:d5928. [http://dx.doi.org/10.1136/bmj.d5928 DOI 10.1136/bmj.d5928].&lt;br /&gt;
&lt;br /&gt;
#whiting2011 Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, Leeflang MM, Sterne JA, Bossuyt PM; QUADAS-2 Group. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011 Oct 18;155(8):529-36. [http://dx.doi.org/10.7326/0003-4819-155-8-201110180-00009 DOI 10.7326/0003-4819-155-8-201110180-00009].&lt;br /&gt;
&lt;br /&gt;
#murad2018 Murad MH, Sultan S, Haffar S, Bazerbachi F. Methodological quality and synthesis of case series and case reports. BMJ Evid Based Med. 2018 Apr;23(2):60-63. [http://dx.doi.org/10.1136/bmjebm-2017-110853 DOI 10.1136/bmjebm-2017-110853]. &lt;br /&gt;
&lt;br /&gt;
#moher2009 Moher D, Liberati A, Tetzlaff J, Altman DG; PRISMA Group. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. J Clin Epidemiol. 2009 Oct;62(10):1006-12. [http://dx.doi.org/10.1016/j.jclinepi.2009.06.005 DOI 10.1016/j.jclinepi.2009.06.005].&lt;br /&gt;
&lt;br /&gt;
#mcinnes2018 McInnes MDF, Moher D, Thombs BD, McGrath TA, Bossuyt PM; the PRISMA-DTA Group, Clifford T, Cohen JF, Deeks JJ, Gatsonis C, Hooft L, Hunt HA, Hyde CJ, Korevaar DA, Leeflang MMG, Macaskill P, Reitsma JB, Rodin R, Rutjes AWS, Salameh JP, Stevens A, Takwoingi Y, Tonelli M, Weeks L, Whiting P, Willis BH. Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement. JAMA. 2018 Jan 23;319(4):388-396. [http://dx.doi.org/10.1001/jama.2017.19163 DOI 10.1001/jama.2017.19163].&lt;br /&gt;
&lt;br /&gt;
#zorzela2016 Zorzela L, Loke YK, Ioannidis JP, Golder S, Santaguida P, Altman DG, Moher D, Vohra S; PRISMAHarms Group. PRISMA harms checklist: improving harms reporting in systematic reviews. BMJ. 2016 Feb 1;352:i157. [http://dx.doi.org/10.1136/bmj.i157 DOI 10.1136/bmj.i157].&lt;br /&gt;
&lt;br /&gt;
#hutton2015 Hutton B, Salanti G, Caldwell DM, Chaimani A, Schmid CH, Cameron C, Ioannidis JP, Straus S, Thorlund K, Jansen JP, Mulrow C, Catalá-López F, Gøtzsche PC, Dickersin K, Boutron I, Altman DG, Moher D. The PRISMA extension statement for reporting of systematic reviews incorporating network meta-analyses of health care interventions: checklist and explanations. Ann Intern Med. 2015 Jun 2;162(11):777-84. [http://dx.doi.org/10.7326/M14-2385 DOI 10.7326/M14-2385].&lt;br /&gt;
&lt;br /&gt;
#stewart2015 Stewart LA, Clarke M, Rovers M, Riley RD, Simmonds M, Stewart G, Tierney JF; PRISMA-IPD Development Group. Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement. JAMA. 2015 Apr 28;313(16):1657-65. [http://dx.doi.org/10.1001/jama.2015.3656 DOI 10.1001/jama.2015.3656].&lt;br /&gt;
&lt;br /&gt;
#tong2012 Tong A, Flemming K, McInnes E, Oliver S, Craig J. Enhancing transparency in reporting the synthesis of qualitative research: ENTREQ. BMC Med Res Methodol. 2012 Nov 27;12:181. [http://dx.doi.org/10.1186/1471-2288-12-181 DOI 10.1186/1471-2288-12-181].&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Informatie op andere websites ==&lt;br /&gt;
* [https://netherlands.cochrane.org/ Cochrane Netherlands] is één van de centra die wereldwijd het werk van Cochrane vertegenwoordigt.&lt;br /&gt;
* [http://handbook-5-1.cochrane.org/ The Cochrane Handbook for Systematic Reviews].&lt;br /&gt;
* Cochrane Reviews en de protocollen hiervan worden in [https://www.cochranelibrary.com/ The Cochrane Library] gepubliceerd.&lt;br /&gt;
* Onderzoekers kunnen een protocol aanmelden bij [https://www.crd.york.ac.uk/prospero/ PROSPERO] international prospective register of systematic reviews om het openbaar te archiveren.&lt;br /&gt;
* The [http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp Newcastle-Ottawa Scale] (NOS) for assessing the quality of nonrandomised studies in meta-analyses.&lt;br /&gt;
* [https://methods.cochrane.org/prognosis/our-publications Cochrane Methods Prognosis Review Group Tools].&lt;br /&gt;
* [https://methods.cochrane.org/qi/welcome Cochrane Qualitative and Implementation Methods Group] &lt;br /&gt;
* [https://www.equator-network.org/ The Equator Network] heeft een bibliotheek van richtlijnen over welke informatie in een wetenschappelijke artikel hoort te zijn.&lt;br /&gt;
* [http://www.gradeworkinggroup.org/ The GRADE working group].&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2656</id>
		<title>Systematische reviews</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2656"/>
		<updated>2019-06-13T09:30:51Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Systematische reviews en meta-analyses */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Een systematisch review is een samenvatting van de literatuur over een specifiek onderwerp waarin op een transparante en gestructureerde wijze data verzameld en beschreven wordt om vertekening te voorkomen. Een systematische review kan kwalitatieve en/of kwantitatieve onderzoeken beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Systematische reviews en meta-analyses ==&lt;br /&gt;
Er zijn verschillende fases bij het uitvoeren van een systematische review: &lt;br /&gt;
# het definiëren van de onderzoeksvraag&lt;br /&gt;
# het gestructureerd zoeken in elektronische literatuur-databases en het hanteren van de gekozen in- en exclusiecriteria om de benodigde literatuur te selecteren&lt;br /&gt;
# het op methodologische kwaliteit beoordelen van de publicaties, &lt;br /&gt;
# de extractie van de benodigde gegevens uit de gekozen artikelen, &lt;br /&gt;
# het gestructureerd samenvatten van de uitkomsten van de studies en &lt;br /&gt;
# het rapporteren van de resultaten van de systematische review. &lt;br /&gt;
&lt;br /&gt;
Bij een systematische review van prognostische studies, kan een andere indeling van deze fases nuttig zijn &amp;lt;cite&amp;gt;[riley2019]&amp;lt;/cite&amp;gt;. Bij sommige systematische reviews wordt ook een [[Meta-analyse | meta-analyse]] uitgevoerd om de resultaten uit verschillende, maar methodologisch vergelijkbare studies statistisch samen te vatten &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Cochrane is een internationale organisatie die zorgverleners, beleidsmakers en patiënten helpt bij het nemen van beslissingen over gezondheidszorg. Deze organisatie doet dit door informatie over de effectiviteit van de gezondheidszorg in de vorm van systematische reviews te presenteren. Cochrane Reviews en de protocollen hiervan worden in The Cochrane Library gepubliceerd.&lt;br /&gt;
&lt;br /&gt;
== Een onderzoeksprotocol schrijven en publiceren of archiveren ==&lt;br /&gt;
Voordat onderzoekers een systematische review uitvoeren, is het aan te raden om een onderzoeksprotocol op te stellen. Zo leggen onderzoekers de onderzoeksdoelen, vraagstelling en methoden helder vast voordat zij het onderzoek uitvoeren. Bij het opstellen van het onderzoeksprotocol gebruikt men het liefst de Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols (PRISMA-P) checklijst om te controleren of alle benodigde informatie in het document is opgenomen &amp;lt;cite&amp;gt;[moher2015]&amp;lt;/cite&amp;gt;. Het is aan te raden om al bij het schrijven van het protocol contact op te nemen met een gespecialiseerd methodoloog, klinisch informatie specialist en statisticus. Het is in deze fase ook aan te raden om afspraken te maken over wie de auteurs worden en in welke volgorde zij zullen staan op de uiteindelijke publicatie.&lt;br /&gt;
Zodra het protocol is opgesteld, is het aan te raden om het protocol te publiceren of openbaar te archiveren. Onderzoekers kunnen een protocol aanmelden bij PROSPERO (International prospective register of systematic reviews) om het openbaar te archiveren. Door het protocol te publiceren of openbaar te archiveren, laat men in een latere fase aan peer-reviewers van tijdschriften zien dat de gekozen onderzoeksmethoden al vóór het uitvoeren van de review zijn vastgesteld en dat er niet zomaar is “gevist” naar een aantrekkelijk resultaat met een leuke p-waarde. Ook laat men daarmee aan andere onderzoekers zien waarmee men momenteel bezig is, hetgeen de kans verkleint op het verschijnen van systematische reviews die zeer vergelijkbaar zijn. &lt;br /&gt;
&lt;br /&gt;
== Het definiëren van de onderzoeksvraag ==&lt;br /&gt;
Bij een systematische review is het belangrijk om de vraagstelling eenduidig op te schrijven. Dit kan door de vraagstelling op basis van PICOS (Population, Interventions, Comparators, Outcomes, Study designs) te definiëren. Sommige methodologen raden oaan om hierin ook het onderdeel ‘Timeframe’ mee te nemen. Dit onderdeel geeft aan binnen welke tijdsperiode de behandeling, blootstelling of uitkomst heeft plaatsgevonden. Het is van belang om bij elk onderdeel van PICOS(T) voldoende specifiek te zijn. Een op PICOS(T) gebaseerde gedetailleerde uitwerking van de vraagstelling geeft concrete richting aan de uitvoer van het systematisch review, zoals de zoekstrategie, in- en exclusiecriteria en data-extractie. &lt;br /&gt;
&lt;br /&gt;
Als een onderzoeker een vraagstelling heeft opgesteld, is het aan te raden om in de literatuur te controleren of iemand al eerder een vergelijkbare systematische review heeft gepubliceerd of een vergelijkbaar protocol in PROPERSO heeft gearchiveerd. Als er een vergelijkbare systematische review bestaat of in voorbereiding is, moet de onderzoeker zich kritisch afvragen of zijn/haar voorgenomen systematische review een betekenisvolle toevoeging geeft aan de wetenschappelijke literatuur. &lt;br /&gt;
&lt;br /&gt;
== Het zoeken naar literatuur en het hanteren van de gekozen in- en exclusiecriteria ==&lt;br /&gt;
Na het definiëren van de onderzoeksvraag worden in- en exclusie criteria geformuleerd. Deze criteria dienen voor het opzetten van de zoekactie en het selecteren van de studies die een antwoord geven op de onderzoeksvraag. Aan de hand van de in- en exclusie criteria wordt gestructureerd en sensitief naar literatuur gezocht. Veel gebruikte bibliografische databases van wetenschappelijke publicaties zijn PubMed en Embase. Het gebruik van meerdere databases en bronnen, van zowel gepubliceerde studies als grijze literatuur, wordt aangeraden om het risico op vertekening in de dataset te voorkomen. Dit resulteert echter vaak in een groot aantal studies. &lt;br /&gt;
&lt;br /&gt;
De studies die door middel van de zoekactie gevonden zijn worden naast de in- en exclusie criteria gelegd om zo de studies te selecteren die de review vraag beantwoorden. Het is aan te raden dit selectieproces door tenminste twee leden van de onderzoeksgroep onafhankelijk van elkaar uit te voeren. &lt;br /&gt;
&lt;br /&gt;
Een klinisch informatie specialist, vaak verbonden aan de medische bibliotheek, kan ondersteuning bieden bij het op de juiste wijze omzetten van de onderzoeksvraag naar een zoekopdracht &amp;lt;cite&amp;gt;[mcgowan2016]&amp;lt;/cite&amp;gt;. Hij of zij kan ook adviseren over hoe de in- en exclusie van studies op juiste en efficiënte wijze in een zoekstrategie kunnen worden vertaald.&lt;br /&gt;
&lt;br /&gt;
== Het beoordelen van de methodologische kwaliteit ==&lt;br /&gt;
Als de onderzoeker de studies heeft geselecteerd om in de review mee te nemen, wordt een geschikte vragenlijst gebruikt om de methodologische kwaliteit hiervan te beoordelen. De juiste keuze van een vragenlijst hangt af van het onderzoeksdesign van de geïncludeerde studies. Zo zijn bijvoorbeeld vragenlijsten ontworpen voor gerandomiseerde en niet-gerandomiseerde interventie studies &amp;lt;cite&amp;gt;[higgins2011]&amp;lt;/cite&amp;gt;, diagnostische studies &amp;lt;cite&amp;gt;[whiting2011]&amp;lt;/cite&amp;gt;, case-studies &amp;lt;cite&amp;gt;[murad2018]&amp;lt;/cite&amp;gt;, en vragenlijsten voor het beantwoorden van etiologische en prognostisch onderzoeksvragen en predictiemodellen. Een gespecialiseerd methodoloog kan adviseren bij het kiezen van de juiste vragenlijst.&lt;br /&gt;
&lt;br /&gt;
== De extractie van de data en het omrekenen van de uitkomstparameters ==&lt;br /&gt;
In deze fase worden de gerapporteerde onderzoeksgegevens uit de geïncludeerde studies geëxtraheerd en in een database opgeslagen. In het AMC kan dit bijvoorbeeld in Castor. Het is af te raden om de data in Excel op te slaan, te bewerken of te analyseren omdat het in dit pakket niet mogelijk is te werken met syntaxen, hetgeen een statistische voorwaarde is van goed onderzoek doen. Het is aan te raden dat twee onderzoekers onafhankelijk van elkaar de gegevens uit de studies extraheren (double data entry). Daarna worden de twee resulterende databestanden onderling vergeleken. Als er verschillen zijn, dan worden de gegevens nogmaals met de brondocumenten vergeleken en worden de fouten gecorrigeerd. &lt;br /&gt;
&lt;br /&gt;
Tijdens het extractieproces zal soms ook besloten moeten worden welke getallen er precies uit een artikel overgenomen moeten worden. Het kan bijvoorbeeld zijn dat een getal in een tabel afwijkt van het getal in de tekst. Het is aan te raden om bij dit soort beslissingen te overleggen met de medeauteurs en te noteren wáárom voor een bepaalde waarde is gekozen. &lt;br /&gt;
Het is mogelijk dat bij het extraheren van de onderzoeksgegevens niet alle gewenste parameters in de artikelen worden gevonden. Soms is het mogelijk om deze parameters op basis van andere informatie in het artikel te berekenen. Een voorbeeld hiervan is als de &#039;[[Standaardfout/standard_error|standard error]]&#039; wordt gerapporteerd, maar de onderzoeker de standaarddeviatie nodig heeft. Afhankelijk van de beschikbare informatie kan een statisticus helpen bij het omrekenen. Maar soms is er simpelweg onvoldoende informatie beschikbaar. Dan kan men overwegen om de corresponding author te mailen om te vragen of de ontbrekende informatie elders te vinden is, dan wel die informatie op te sturen. &lt;br /&gt;
&lt;br /&gt;
== Presenteren en interpreteren van resultaten ==&lt;br /&gt;
De resultaten van de systematische review worden gepresenteerd in de vorm van tabellen en figuren, zoals een PRISMA flowchart voor het weergeven van de resultaten van de zoekstrategie. Een ‘Summary of Findings’ - tabel geeft een kort en krachtig overzicht van de hoeveelheid ‘evidence’, de kwaliteit van dat bewijs en de grootte van de effecten. Voor het beoordelen van de bewijskracht is GRADE de aangewezen methode. &lt;br /&gt;
&lt;br /&gt;
Een [[Meta-analyse | meta-analyse]] is een statistische techniek waarbij de resultaten van verschillende studies gecombineerd worden tot een &#039;overall&#039; resultaat &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;. Een belangrijke voorwaarde voor het uitvoeren van een meta-analyse is dat de studies voldoende op elkaar lijken. Het is in het algemeen af te raden om een meta-analyse uit te voeren op resultaten van een combinatie van gerandomiseerde trials, observationele cohorten en case-series. Ook is het af te raden om zeer kleine studies of studies met een “slechte” methodologische kwaliteit mee te nemen. Verder is aan te raden om na te gaan of het aannemelijk is dat elke individu slechts één keer in de meta-analyse meegenomen wordt. Dit is vooral van belang als er meerdere artikelen zijn die één gerandomiseerde trial, cohort of registratie beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Resultaten rapporteren ==&lt;br /&gt;
Bij het rapporteren of publiceren van de systematische review is het belangrijk om alle benodigde informatie hierin op te nemen. De PRISMA-richtlijnen geven hierbij een goede leidraad &amp;lt;cite&amp;gt;[moher2009]&amp;lt;/cite&amp;gt;. Soms is het voldoende om alleen de PRISMA-richtlijnen te gebruiken. Maar er zijn ook uitbreidingen hiervan gepubliceerd. Deze uitbreidingen van de PRISMA-richtlijnen geven specifieke aanwijzingen over welke informatie in bepaalde typen systematische reviews opgenomen dient te worden. Zo zijn er richtlijnen voor reviews over diagnostische studies &amp;lt;cite&amp;gt;[mcinnes2018]&amp;lt;/cite&amp;gt;, bijwerkingen &amp;lt;cite&amp;gt;[zorzela2016]&amp;lt;/cite&amp;gt; en reviews die gebruik maken van een netwerk meta-analyse &amp;lt;cite&amp;gt;[hutton2015]&amp;lt;/cite&amp;gt; of data op het niveau van de individuele patiënt &amp;lt;cite&amp;gt;[stewart2015]&amp;lt;/cite&amp;gt;. Voor reviews van kwantitatieve onderzoeken is de ENTREQ richtlijn opgesteld &amp;lt;cite&amp;gt;[tong2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Tot slot is het belangrijk om in de rapportage of publicatie duidelijk en met de betreffende referentie te vermelden dat vóór het uitvoeren van de systematische review een protocol geschreven.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#field2010 Field AP, Gillett R. How to do a meta-analysis. Br J Math Stat Psychol. 2010 Nov;63(Pt 3):665-94. [http://dx.doi.org/10.1348/000711010X502733 DOI 10.1348/000711010X502733] &lt;br /&gt;
&lt;br /&gt;
#moher2015 Moher D, Shamseer L, Clarke M, Ghersi D, Liberati A, Petticrew M, Shekelle P, Stewart LA; PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Syst Rev. 2015 Jan 1;4:1. [http://dx.doi.org/10.1186/2046-4053-4-1 DOI 10.1186/2046-4053-4-1].&lt;br /&gt;
&lt;br /&gt;
#mcgowan2016 McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol. 2016 Jul;75:40-6.[http://dx.doi.org/10.1016/j.jclinepi.2016.01.021 DOI 10.1016/j.jclinepi.2016.01.021]. &lt;br /&gt;
&lt;br /&gt;
#higgins2011 Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, Savovic J, Schulz KF, Weeks L, Sterne JA; Cochrane Bias Methods Group; Cochrane Statistical Methods Group. The Cochrane Collaboration&#039;s tool for assessing risk of bias in randomised trials. BMJ. 2011 Oct 18;343:d5928. [http://dx.doi.org/10.1136/bmj.d5928 DOI 10.1136/bmj.d5928].&lt;br /&gt;
&lt;br /&gt;
#whiting2011 Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, Leeflang MM, Sterne JA, Bossuyt PM; QUADAS-2 Group. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011 Oct 18;155(8):529-36. [http://dx.doi.org/10.7326/0003-4819-155-8-201110180-00009 DOI 10.7326/0003-4819-155-8-201110180-00009].&lt;br /&gt;
&lt;br /&gt;
#murad2018 Murad MH, Sultan S, Haffar S, Bazerbachi F. Methodological quality and synthesis of case series and case reports. BMJ Evid Based Med. 2018 Apr;23(2):60-63. [http://dx.doi.org/10.1136/bmjebm-2017-110853 DOI 10.1136/bmjebm-2017-110853]. &lt;br /&gt;
&lt;br /&gt;
#moher2009 Moher D, Liberati A, Tetzlaff J, Altman DG; PRISMA Group. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. J Clin Epidemiol. 2009 Oct;62(10):1006-12. [http://dx.doi.org/10.1016/j.jclinepi.2009.06.005 DOI 10.1016/j.jclinepi.2009.06.005].&lt;br /&gt;
&lt;br /&gt;
#mcinnes2018 McInnes MDF, Moher D, Thombs BD, McGrath TA, Bossuyt PM; the PRISMA-DTA Group, Clifford T, Cohen JF, Deeks JJ, Gatsonis C, Hooft L, Hunt HA, Hyde CJ, Korevaar DA, Leeflang MMG, Macaskill P, Reitsma JB, Rodin R, Rutjes AWS, Salameh JP, Stevens A, Takwoingi Y, Tonelli M, Weeks L, Whiting P, Willis BH. Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement. JAMA. 2018 Jan 23;319(4):388-396. [http://dx.doi.org/10.1001/jama.2017.19163 DOI 10.1001/jama.2017.19163].&lt;br /&gt;
&lt;br /&gt;
#zorzela2016 Zorzela L, Loke YK, Ioannidis JP, Golder S, Santaguida P, Altman DG, Moher D, Vohra S; PRISMAHarms Group. PRISMA harms checklist: improving harms reporting in systematic reviews. BMJ. 2016 Feb 1;352:i157. [http://dx.doi.org/10.1136/bmj.i157 DOI 10.1136/bmj.i157].&lt;br /&gt;
&lt;br /&gt;
#hutton2015 Hutton B, Salanti G, Caldwell DM, Chaimani A, Schmid CH, Cameron C, Ioannidis JP, Straus S, Thorlund K, Jansen JP, Mulrow C, Catalá-López F, Gøtzsche PC, Dickersin K, Boutron I, Altman DG, Moher D. The PRISMA extension statement for reporting of systematic reviews incorporating network meta-analyses of health care interventions: checklist and explanations. Ann Intern Med. 2015 Jun 2;162(11):777-84. [http://dx.doi.org/10.7326/M14-2385 DOI 10.7326/M14-2385].&lt;br /&gt;
&lt;br /&gt;
#stewart2015 Stewart LA, Clarke M, Rovers M, Riley RD, Simmonds M, Stewart G, Tierney JF; PRISMA-IPD Development Group. Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement. JAMA. 2015 Apr 28;313(16):1657-65. [http://dx.doi.org/10.1001/jama.2015.3656 DOI 10.1001/jama.2015.3656].&lt;br /&gt;
&lt;br /&gt;
#tong2012 Tong A, Flemming K, McInnes E, Oliver S, Craig J. Enhancing transparency in reporting the synthesis of qualitative research: ENTREQ. BMC Med Res Methodol. 2012 Nov 27;12:181. [http://dx.doi.org/10.1186/1471-2288-12-181 DOI 10.1186/1471-2288-12-181].&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Informatie op andere websites ==&lt;br /&gt;
* [https://netherlands.cochrane.org/ Cochrane Netherlands] is één van de centra die wereldwijd het werk van Cochrane vertegenwoordigt.&lt;br /&gt;
* [http://handbook-5-1.cochrane.org/ The Cochrane Handbook for Systematic Reviews].&lt;br /&gt;
* Cochrane Reviews en de protocollen hiervan worden in [https://www.cochranelibrary.com/ The Cochrane Library] gepubliceerd.&lt;br /&gt;
* Onderzoekers kunnen een protocol aanmelden bij [https://www.crd.york.ac.uk/prospero/ PROSPERO] international prospective register of systematic reviews om het openbaar te archiveren.&lt;br /&gt;
* The [http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp Newcastle-Ottawa Scale] (NOS) for assessing the quality of nonrandomised studies in meta-analyses.&lt;br /&gt;
* [https://methods.cochrane.org/prognosis/our-publications Cochrane Methods Prognosis Review Group Tools].&lt;br /&gt;
* [https://methods.cochrane.org/qi/welcome Cochrane Qualitative and Implementation Methods Group] &lt;br /&gt;
* [https://www.equator-network.org/ The Equator Network] heeft een bibliotheek van richtlijnen over welke informatie in een wetenschappelijke artikel hoort te zijn.&lt;br /&gt;
* [http://www.gradeworkinggroup.org/ The GRADE working group].&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2655</id>
		<title>Systematische reviews</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2655"/>
		<updated>2019-05-02T12:55:08Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Presenteren en interpreteren van resultaten */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Een systematisch review is een samenvatting van de literatuur over een specifiek onderwerp waarin op een transparante en gestructureerde wijze data verzameld en beschreven wordt om vertekening te voorkomen. Een systematische review kan kwalitatieve en/of kwantitatieve onderzoeken beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Systematische reviews en meta-analyses ==&lt;br /&gt;
Er zijn verschillende fases bij het uitvoeren van een systematische review: &lt;br /&gt;
# het definiëren van de onderzoeksvraag&lt;br /&gt;
# het gestructureerd zoeken in elektronische literatuur-databases en het hanteren van de gekozen in- en exclusiecriteria om de benodigde literatuur te selecteren&lt;br /&gt;
# het op methodologische kwaliteit beoordelen van de publicaties, &lt;br /&gt;
# de extractie van de benodigde gegevens uit de gekozen artikelen, &lt;br /&gt;
# het gestructureerd samenvatten van de uitkomsten van de studies en &lt;br /&gt;
# het rapporteren van de resultaten van de systematische review. &lt;br /&gt;
&lt;br /&gt;
Bij sommige systematische reviews wordt ook een [[Meta-analyse | meta-analyse]] uitgevoerd om de resultaten uit verschillende, maar methodologisch vergelijkbare studies statistisch samen te vatten &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Cochrane is een internationale organisatie die zorgverleners, beleidsmakers en patiënten helpt bij het nemen van beslissingen over gezondheidszorg. Deze organisatie doet dit door informatie over de effectiviteit van de gezondheidszorg in de vorm van systematische reviews te presenteren. Cochrane Reviews en de protocollen hiervan worden in The Cochrane Library gepubliceerd. &lt;br /&gt;
&lt;br /&gt;
== Een onderzoeksprotocol schrijven en publiceren of archiveren ==&lt;br /&gt;
Voordat onderzoekers een systematische review uitvoeren, is het aan te raden om een onderzoeksprotocol op te stellen. Zo leggen onderzoekers de onderzoeksdoelen, vraagstelling en methoden helder vast voordat zij het onderzoek uitvoeren. Bij het opstellen van het onderzoeksprotocol gebruikt men het liefst de Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols (PRISMA-P) checklijst om te controleren of alle benodigde informatie in het document is opgenomen &amp;lt;cite&amp;gt;[moher2015]&amp;lt;/cite&amp;gt;. Het is aan te raden om al bij het schrijven van het protocol contact op te nemen met een gespecialiseerd methodoloog, klinisch informatie specialist en statisticus. Het is in deze fase ook aan te raden om afspraken te maken over wie de auteurs worden en in welke volgorde zij zullen staan op de uiteindelijke publicatie.&lt;br /&gt;
Zodra het protocol is opgesteld, is het aan te raden om het protocol te publiceren of openbaar te archiveren. Onderzoekers kunnen een protocol aanmelden bij PROSPERO (International prospective register of systematic reviews) om het openbaar te archiveren. Door het protocol te publiceren of openbaar te archiveren, laat men in een latere fase aan peer-reviewers van tijdschriften zien dat de gekozen onderzoeksmethoden al vóór het uitvoeren van de review zijn vastgesteld en dat er niet zomaar is “gevist” naar een aantrekkelijk resultaat met een leuke p-waarde. Ook laat men daarmee aan andere onderzoekers zien waarmee men momenteel bezig is, hetgeen de kans verkleint op het verschijnen van systematische reviews die zeer vergelijkbaar zijn. &lt;br /&gt;
&lt;br /&gt;
== Het definiëren van de onderzoeksvraag ==&lt;br /&gt;
Bij een systematische review is het belangrijk om de vraagstelling eenduidig op te schrijven. Dit kan door de vraagstelling op basis van PICOS (Population, Interventions, Comparators, Outcomes, Study designs) te definiëren. Sommige methodologen raden oaan om hierin ook het onderdeel ‘Timeframe’ mee te nemen. Dit onderdeel geeft aan binnen welke tijdsperiode de behandeling, blootstelling of uitkomst heeft plaatsgevonden. Het is van belang om bij elk onderdeel van PICOS(T) voldoende specifiek te zijn. Een op PICOS(T) gebaseerde gedetailleerde uitwerking van de vraagstelling geeft concrete richting aan de uitvoer van het systematisch review, zoals de zoekstrategie, in- en exclusiecriteria en data-extractie. &lt;br /&gt;
&lt;br /&gt;
Als een onderzoeker een vraagstelling heeft opgesteld, is het aan te raden om in de literatuur te controleren of iemand al eerder een vergelijkbare systematische review heeft gepubliceerd of een vergelijkbaar protocol in PROPERSO heeft gearchiveerd. Als er een vergelijkbare systematische review bestaat of in voorbereiding is, moet de onderzoeker zich kritisch afvragen of zijn/haar voorgenomen systematische review een betekenisvolle toevoeging geeft aan de wetenschappelijke literatuur. &lt;br /&gt;
&lt;br /&gt;
== Het zoeken naar literatuur en het hanteren van de gekozen in- en exclusiecriteria ==&lt;br /&gt;
Na het definiëren van de onderzoeksvraag worden in- en exclusie criteria geformuleerd. Deze criteria dienen voor het opzetten van de zoekactie en het selecteren van de studies die een antwoord geven op de onderzoeksvraag. Aan de hand van de in- en exclusie criteria wordt gestructureerd en sensitief naar literatuur gezocht. Veel gebruikte bibliografische databases van wetenschappelijke publicaties zijn PubMed en Embase. Het gebruik van meerdere databases en bronnen, van zowel gepubliceerde studies als grijze literatuur, wordt aangeraden om het risico op vertekening in de dataset te voorkomen. Dit resulteert echter vaak in een groot aantal studies. &lt;br /&gt;
&lt;br /&gt;
De studies die door middel van de zoekactie gevonden zijn worden naast de in- en exclusie criteria gelegd om zo de studies te selecteren die de review vraag beantwoorden. Het is aan te raden dit selectieproces door tenminste twee leden van de onderzoeksgroep onafhankelijk van elkaar uit te voeren. &lt;br /&gt;
&lt;br /&gt;
Een klinisch informatie specialist, vaak verbonden aan de medische bibliotheek, kan ondersteuning bieden bij het op de juiste wijze omzetten van de onderzoeksvraag naar een zoekopdracht &amp;lt;cite&amp;gt;[mcgowan2016]&amp;lt;/cite&amp;gt;. Hij of zij kan ook adviseren over hoe de in- en exclusie van studies op juiste en efficiënte wijze in een zoekstrategie kunnen worden vertaald.&lt;br /&gt;
&lt;br /&gt;
== Het beoordelen van de methodologische kwaliteit ==&lt;br /&gt;
Als de onderzoeker de studies heeft geselecteerd om in de review mee te nemen, wordt een geschikte vragenlijst gebruikt om de methodologische kwaliteit hiervan te beoordelen. De juiste keuze van een vragenlijst hangt af van het onderzoeksdesign van de geïncludeerde studies. Zo zijn bijvoorbeeld vragenlijsten ontworpen voor gerandomiseerde en niet-gerandomiseerde interventie studies &amp;lt;cite&amp;gt;[higgins2011]&amp;lt;/cite&amp;gt;, diagnostische studies &amp;lt;cite&amp;gt;[whiting2011]&amp;lt;/cite&amp;gt;, case-studies &amp;lt;cite&amp;gt;[murad2018]&amp;lt;/cite&amp;gt;, en vragenlijsten voor het beantwoorden van etiologische en prognostisch onderzoeksvragen en predictiemodellen. Een gespecialiseerd methodoloog kan adviseren bij het kiezen van de juiste vragenlijst.&lt;br /&gt;
&lt;br /&gt;
== De extractie van de data en het omrekenen van de uitkomstparameters ==&lt;br /&gt;
In deze fase worden de gerapporteerde onderzoeksgegevens uit de geïncludeerde studies geëxtraheerd en in een database opgeslagen. In het AMC kan dit bijvoorbeeld in Castor. Het is af te raden om de data in Excel op te slaan, te bewerken of te analyseren omdat het in dit pakket niet mogelijk is te werken met syntaxen, hetgeen een statistische voorwaarde is van goed onderzoek doen. Het is aan te raden dat twee onderzoekers onafhankelijk van elkaar de gegevens uit de studies extraheren (double data entry). Daarna worden de twee resulterende databestanden onderling vergeleken. Als er verschillen zijn, dan worden de gegevens nogmaals met de brondocumenten vergeleken en worden de fouten gecorrigeerd. &lt;br /&gt;
&lt;br /&gt;
Tijdens het extractieproces zal soms ook besloten moeten worden welke getallen er precies uit een artikel overgenomen moeten worden. Het kan bijvoorbeeld zijn dat een getal in een tabel afwijkt van het getal in de tekst. Het is aan te raden om bij dit soort beslissingen te overleggen met de medeauteurs en te noteren wáárom voor een bepaalde waarde is gekozen. &lt;br /&gt;
Het is mogelijk dat bij het extraheren van de onderzoeksgegevens niet alle gewenste parameters in de artikelen worden gevonden. Soms is het mogelijk om deze parameters op basis van andere informatie in het artikel te berekenen. Een voorbeeld hiervan is als de &#039;[[Standaardfout/standard_error|standard error]]&#039; wordt gerapporteerd, maar de onderzoeker de standaarddeviatie nodig heeft. Afhankelijk van de beschikbare informatie kan een statisticus helpen bij het omrekenen. Maar soms is er simpelweg onvoldoende informatie beschikbaar. Dan kan men overwegen om de corresponding author te mailen om te vragen of de ontbrekende informatie elders te vinden is, dan wel die informatie op te sturen. &lt;br /&gt;
&lt;br /&gt;
== Presenteren en interpreteren van resultaten ==&lt;br /&gt;
De resultaten van de systematische review worden gepresenteerd in de vorm van tabellen en figuren, zoals een PRISMA flowchart voor het weergeven van de resultaten van de zoekstrategie. Een ‘Summary of Findings’ - tabel geeft een kort en krachtig overzicht van de hoeveelheid ‘evidence’, de kwaliteit van dat bewijs en de grootte van de effecten. Voor het beoordelen van de bewijskracht is GRADE de aangewezen methode. &lt;br /&gt;
&lt;br /&gt;
Een [[Meta-analyse | meta-analyse]] is een statistische techniek waarbij de resultaten van verschillende studies gecombineerd worden tot een &#039;overall&#039; resultaat &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;. Een belangrijke voorwaarde voor het uitvoeren van een meta-analyse is dat de studies voldoende op elkaar lijken. Het is in het algemeen af te raden om een meta-analyse uit te voeren op resultaten van een combinatie van gerandomiseerde trials, observationele cohorten en case-series. Ook is het af te raden om zeer kleine studies of studies met een “slechte” methodologische kwaliteit mee te nemen. Verder is aan te raden om na te gaan of het aannemelijk is dat elke individu slechts één keer in de meta-analyse meegenomen wordt. Dit is vooral van belang als er meerdere artikelen zijn die één gerandomiseerde trial, cohort of registratie beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Resultaten rapporteren ==&lt;br /&gt;
Bij het rapporteren of publiceren van de systematische review is het belangrijk om alle benodigde informatie hierin op te nemen. De PRISMA-richtlijnen geven hierbij een goede leidraad &amp;lt;cite&amp;gt;[moher2009]&amp;lt;/cite&amp;gt;. Soms is het voldoende om alleen de PRISMA-richtlijnen te gebruiken. Maar er zijn ook uitbreidingen hiervan gepubliceerd. Deze uitbreidingen van de PRISMA-richtlijnen geven specifieke aanwijzingen over welke informatie in bepaalde typen systematische reviews opgenomen dient te worden. Zo zijn er richtlijnen voor reviews over diagnostische studies &amp;lt;cite&amp;gt;[mcinnes2018]&amp;lt;/cite&amp;gt;, bijwerkingen &amp;lt;cite&amp;gt;[zorzela2016]&amp;lt;/cite&amp;gt; en reviews die gebruik maken van een netwerk meta-analyse &amp;lt;cite&amp;gt;[hutton2015]&amp;lt;/cite&amp;gt; of data op het niveau van de individuele patiënt &amp;lt;cite&amp;gt;[stewart2015]&amp;lt;/cite&amp;gt;. Voor reviews van kwantitatieve onderzoeken is de ENTREQ richtlijn opgesteld &amp;lt;cite&amp;gt;[tong2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Tot slot is het belangrijk om in de rapportage of publicatie duidelijk en met de betreffende referentie te vermelden dat vóór het uitvoeren van de systematische review een protocol geschreven.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#field2010 Field AP, Gillett R. How to do a meta-analysis. Br J Math Stat Psychol. 2010 Nov;63(Pt 3):665-94. [http://dx.doi.org/10.1348/000711010X502733 DOI 10.1348/000711010X502733] &lt;br /&gt;
&lt;br /&gt;
#moher2015 Moher D, Shamseer L, Clarke M, Ghersi D, Liberati A, Petticrew M, Shekelle P, Stewart LA; PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Syst Rev. 2015 Jan 1;4:1. [http://dx.doi.org/10.1186/2046-4053-4-1 DOI 10.1186/2046-4053-4-1].&lt;br /&gt;
&lt;br /&gt;
#mcgowan2016 McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol. 2016 Jul;75:40-6.[http://dx.doi.org/10.1016/j.jclinepi.2016.01.021 DOI 10.1016/j.jclinepi.2016.01.021]. &lt;br /&gt;
&lt;br /&gt;
#higgins2011 Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, Savovic J, Schulz KF, Weeks L, Sterne JA; Cochrane Bias Methods Group; Cochrane Statistical Methods Group. The Cochrane Collaboration&#039;s tool for assessing risk of bias in randomised trials. BMJ. 2011 Oct 18;343:d5928. [http://dx.doi.org/10.1136/bmj.d5928 DOI 10.1136/bmj.d5928].&lt;br /&gt;
&lt;br /&gt;
#whiting2011 Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, Leeflang MM, Sterne JA, Bossuyt PM; QUADAS-2 Group. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011 Oct 18;155(8):529-36. [http://dx.doi.org/10.7326/0003-4819-155-8-201110180-00009 DOI 10.7326/0003-4819-155-8-201110180-00009].&lt;br /&gt;
&lt;br /&gt;
#murad2018 Murad MH, Sultan S, Haffar S, Bazerbachi F. Methodological quality and synthesis of case series and case reports. BMJ Evid Based Med. 2018 Apr;23(2):60-63. [http://dx.doi.org/10.1136/bmjebm-2017-110853 DOI 10.1136/bmjebm-2017-110853]. &lt;br /&gt;
&lt;br /&gt;
#moher2009 Moher D, Liberati A, Tetzlaff J, Altman DG; PRISMA Group. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. J Clin Epidemiol. 2009 Oct;62(10):1006-12. [http://dx.doi.org/10.1016/j.jclinepi.2009.06.005 DOI 10.1016/j.jclinepi.2009.06.005].&lt;br /&gt;
&lt;br /&gt;
#mcinnes2018 McInnes MDF, Moher D, Thombs BD, McGrath TA, Bossuyt PM; the PRISMA-DTA Group, Clifford T, Cohen JF, Deeks JJ, Gatsonis C, Hooft L, Hunt HA, Hyde CJ, Korevaar DA, Leeflang MMG, Macaskill P, Reitsma JB, Rodin R, Rutjes AWS, Salameh JP, Stevens A, Takwoingi Y, Tonelli M, Weeks L, Whiting P, Willis BH. Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement. JAMA. 2018 Jan 23;319(4):388-396. [http://dx.doi.org/10.1001/jama.2017.19163 DOI 10.1001/jama.2017.19163].&lt;br /&gt;
&lt;br /&gt;
#zorzela2016 Zorzela L, Loke YK, Ioannidis JP, Golder S, Santaguida P, Altman DG, Moher D, Vohra S; PRISMAHarms Group. PRISMA harms checklist: improving harms reporting in systematic reviews. BMJ. 2016 Feb 1;352:i157. [http://dx.doi.org/10.1136/bmj.i157 DOI 10.1136/bmj.i157].&lt;br /&gt;
&lt;br /&gt;
#hutton2015 Hutton B, Salanti G, Caldwell DM, Chaimani A, Schmid CH, Cameron C, Ioannidis JP, Straus S, Thorlund K, Jansen JP, Mulrow C, Catalá-López F, Gøtzsche PC, Dickersin K, Boutron I, Altman DG, Moher D. The PRISMA extension statement for reporting of systematic reviews incorporating network meta-analyses of health care interventions: checklist and explanations. Ann Intern Med. 2015 Jun 2;162(11):777-84. [http://dx.doi.org/10.7326/M14-2385 DOI 10.7326/M14-2385].&lt;br /&gt;
&lt;br /&gt;
#stewart2015 Stewart LA, Clarke M, Rovers M, Riley RD, Simmonds M, Stewart G, Tierney JF; PRISMA-IPD Development Group. Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement. JAMA. 2015 Apr 28;313(16):1657-65. [http://dx.doi.org/10.1001/jama.2015.3656 DOI 10.1001/jama.2015.3656].&lt;br /&gt;
&lt;br /&gt;
#tong2012 Tong A, Flemming K, McInnes E, Oliver S, Craig J. Enhancing transparency in reporting the synthesis of qualitative research: ENTREQ. BMC Med Res Methodol. 2012 Nov 27;12:181. [http://dx.doi.org/10.1186/1471-2288-12-181 DOI 10.1186/1471-2288-12-181].&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Informatie op andere websites ==&lt;br /&gt;
* [https://netherlands.cochrane.org/ Cochrane Netherlands] is één van de centra die wereldwijd het werk van Cochrane vertegenwoordigt.&lt;br /&gt;
* [http://handbook-5-1.cochrane.org/ The Cochrane Handbook for Systematic Reviews].&lt;br /&gt;
* Cochrane Reviews en de protocollen hiervan worden in [https://www.cochranelibrary.com/ The Cochrane Library] gepubliceerd.&lt;br /&gt;
* Onderzoekers kunnen een protocol aanmelden bij [https://www.crd.york.ac.uk/prospero/ PROSPERO] international prospective register of systematic reviews om het openbaar te archiveren.&lt;br /&gt;
* The [http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp Newcastle-Ottawa Scale] (NOS) for assessing the quality of nonrandomised studies in meta-analyses.&lt;br /&gt;
* [https://methods.cochrane.org/prognosis/our-publications Cochrane Methods Prognosis Review Group Tools].&lt;br /&gt;
* [https://methods.cochrane.org/qi/welcome Cochrane Qualitative and Implementation Methods Group] &lt;br /&gt;
* [https://www.equator-network.org/ The Equator Network] heeft een bibliotheek van richtlijnen over welke informatie in een wetenschappelijke artikel hoort te zijn.&lt;br /&gt;
* [http://www.gradeworkinggroup.org/ The GRADE working group].&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2654</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2654"/>
		<updated>2019-03-07T08:29:01Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en [[generalized estimating equations]] (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=Repeated measures ANOVA=&lt;br /&gt;
&lt;br /&gt;
[[repeated measures ANOVA | Repeated measurements analysis of variance (ANOVA)]]  is een statistische methode om herhaalde metingen van een continue, normaal verdeelde afhankelijke variabele te analyseren. Deze methode is te gebruiken als de afhankelijke variabel op een beperkte aantal vaste tijdstippen is gemeten en waarbij alle patiënten op alle tijdstippen gemeten zijn.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=Area under the curve=&lt;br /&gt;
&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2653</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2653"/>
		<updated>2019-03-06T13:19:03Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* area under the curve */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en [[generalized estimating equations]] (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=Area under the curve=&lt;br /&gt;
&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2652</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2652"/>
		<updated>2019-03-06T13:18:12Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Welke analyses zijn er mogelijk voor herhaalde metingen? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en [[generalized estimating equations]] (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2650</id>
		<title>Mixed effects modellen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2650"/>
		<updated>2019-03-06T13:15:40Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
&lt;br /&gt;
Mixed models kunnen op meerdere manieren gespecificeerd worden. Het is zinvol om een onderscheid te maken tussen &lt;br /&gt;
#onderzoeken waarbij alle patienten op (min of meer) dezelfde tijdstippen (of onder dezelfde condities) herhaald worden gemeten, en&lt;br /&gt;
#onderzoeken waarin het aantal herhaalde metingen per patient en/of de tijdstippen en condities verschillen tussen patienten.&lt;br /&gt;
&lt;br /&gt;
====Situatie 1: herhaalde metingen op dezelfde momenten====&lt;br /&gt;
&lt;br /&gt;
Als alle patienten op dezelfde tijdstippen (onder dezelfde condities) zijn gemeten, kan het mixed-model gezien worden als een uitbreiding van een standaard [[lineaire regressie| lineair model]]. In formulevorm ziet de uitbreiding van het standaard model er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = a + b \times X_{i,t} + \epsilon_{i,t}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij &amp;lt;math&amp;gt;Y_{i,t}&amp;lt;/math&amp;gt; de meting van de &amp;lt;math&amp;gt;i^{de}&amp;lt;/math&amp;gt; patient is op het &amp;lt;math&amp;gt;t^{de}&amp;lt;/math&amp;gt; tijdstip (conditie); &amp;lt;math&amp;gt;X_{i,t}&amp;lt;/math&amp;gt; is de meting van de covariaat op dat moment en &amp;lt;math&amp;gt;\epsilon_{i,t}&amp;lt;/math&amp;gt; is de afstand (of: &#039;&#039;residu&#039;&#039;) van de datapunten tot de [[lineaire regressie#Hoe werkt (enkelvoudige) lineaire regressie?|regressielijn]]. Bij een standaard [[lineaire regressie]] zijn al deze residuen onafhankelijk van elkaar, maar bij herhaalde metingen is dat niet per se het geval. Namelijk, als het eerste datapunt van een patient (ver) boven (of onder) de lijn ligt, is het goed voorstelbaar dat volgende datapunten van dezelfde persoon ook boven (of onder) de regressielijn zullen liggen. Anders geformuleerd: datapunten van dezelfde persoon lijken meer op elkaar dan op datapunten van andere personen. &lt;br /&gt;
Bij een mixed model wordt rekening gehouden met de [[correlatie|correlaties]] tussen de residuen van metingen bij dezelfde patient. Dit kan op verschillende manieren en moet door de gebruiker worden gespecificeerd. Veel voorkomende correlatiestructuren zijn:&lt;br /&gt;
*compound symmetry, waarbij aangenomen wordt dat de correlaties tussen alle residuen van dezelfde persoon gelijk zijn. De eerste en de tweede meting van een persoon hangen dus even sterk met elkaar samen als de eerste en de laatste meting van die persoon;&lt;br /&gt;
*unstructured, waarbij geen enkele aanname wordt gemaakt over de correlaties. Iedere correlatie tussen twee tijdspunten wordt los van de anderen bepaald;&lt;br /&gt;
&lt;br /&gt;
Er zijn nog diverse andere opties en de beste keuze hangt af van het type onderzoek en het aantal herhaalde metingen. Er zijn statistische maten die je helpen bij het maken van de keuze. Vaak wordt hiervoor de Akaike Information Criterium (AIC) gebruikt. Dit is een maat voor hoe goed het gekozen model past bij de data. Hoe lager de AIC, hoe beter het model past.&lt;br /&gt;
&lt;br /&gt;
Deze eerste soort uitbreiding van het standaard lineaire model wordt ook wel &#039;Generalized Least Squares Model&#039; genoemd.&lt;br /&gt;
&lt;br /&gt;
====Situatie 2: herhaalde metingen op verschillende momenten====&lt;br /&gt;
&lt;br /&gt;
Als het aantal herhaalde metingen per patient en/of de tijdstippen (condities) waarop er gemeten wordt verschillen tussen patienten, ligt het voor de hand om het [[lineaire regressie|lineaire model]] op een andere wijze uit te breiden. In situatie 1 werd de correlatie tussen meetpunten op verschillende tijdstippen direct gemodelleerd. Als er niet op vaste tijdstippen gemeten wordt, is dit niet logisch. De afhankelijkheid van metingen bij eenzelfde patient kan ook gemodelleerd worden met zogenaamde random effects. Met random effects wordt een inschatting gemaakt van de afwijking die metingen van eenzelfde patient hebben ten opzichte van de regressielijn. Hierbij maakt het niet uit hoe vaak en op welke tijdstippen een patient gemeten is; al zijn metingen worden verondersteld een vaste afwijking van de &#039;gemiddelde&#039; regressielijn te hebben. In formulevorm ziet dit er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = (a+ \alpha_i) + (b+\beta_i) \times X_{i,t}  + \epsilon_{i,t} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij de nu toegevoegde &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; de specifieke afwijkingen van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt;  t.o.v. de regressielijn voorstellen. De &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; is de afwijking van de intercept van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|intercept]] &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;. De &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; is de afwijking van de [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|helling]] (&#039;&#039;slope&#039;&#039;) van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde helling &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; van de regressielijn. De &amp;lt;math&amp;gt;\alpha&#039;s&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta&#039;s&amp;lt;/math&amp;gt; worden niet direct geschat, in plaats daarvan wordt verondersteld dat zij normaal verdeeld zijn met gemiddelde 0. De standaard deviaties van deze verdelingen worden geschat. &lt;br /&gt;
De specificaties van de random effects kunnen nog uitgebreid worden en de fit van het model wordt gekwantificeerd met bijvoorbeeld de AIC. Ook hier geldt: het model met de laagste AIC past het beste bij de data.&lt;br /&gt;
&lt;br /&gt;
Deze tweede soort modellen wordt vaak aangeduid als &#039;Random Effect Models&#039;.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik linear mixed models in SPSS?==&lt;br /&gt;
Je vindt de linear mixed models in SPSS 16 onder Analyze-&amp;gt;Mixed models-&amp;gt;Linear. T/m [[statistische software#SPSS|SPSS 18]] is er alleen nog een mixed model beschikbaar voor continue (normaal verdeelde) uitkomsten. Vanaf [[statistische software#SPSS|SPSS 19]] biedt SPSS ook procedures aan voor andere typen uitkomsten zoals dichotome variabelen. Deze vind je onder Analyze -&amp;gt; Mixed Models -&amp;gt; Generalized. In andere pakketten zoals [[statistische software#R|R]] (package &#039;nlme&#039; en package &#039;lme4&#039;), Stata ([http://www.gllamm.org GLAMM]) en [[statistische software#SAS|SAS]] zijn er ook mixed modellen beschikbaar voor verschillende typen uitkomstmaten.&lt;br /&gt;
&lt;br /&gt;
Let op: om een mixed model in SPSS te kunnen draaien moeten de data onder elkaar gestructureerd staan, waarbij iedere meting op een rij staat en er meerdere rijen zijn die bij dezelfde patient horen. In deze [http://www.spss.ch/upload/1126184451_Linear%20Mixed%20Effects%20Modeling%20in%20SPSS.pdf SPSS handleiding] staat stap voor stap beschreven hoe data te restructureren is in het gewenste format voor mixed models. Als er drie herhaalde metingen van drie patienten zijn, ziet het resultaat er bijvoorbeeld zo uit:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! metingnr !! meting&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
De hierboven beschreven &#039;situatie 1&#039; modellering gebeurt in SPSS middels het specificeren van de &#039;Repeated&#039; (+bijbehorende repeated covariance type) in het eerste panel van de mixed procedure. De in &#039;situatie 2&#039; besproken modellering wordt gespecificeerd onder de &#039;Random...&#039; knop (let op: random intercept staat by default uit, bij covariance type kan correlatie tussen de random effects gespecificeerd worden). Vaak is het gebruik van 1 van beide opties (danwel repeated danwel random) voldoende om de correlatie in de data op te vangen. Gebruik maken van beide opties kan wel, maar zal soms leiden tot overbodige parameters.&lt;br /&gt;
&lt;br /&gt;
==Hoe analyseer ik met een mixed model een effect in de tijd?==&lt;br /&gt;
&#039;&#039;Ik onderzoek een groep patienten die een operatie hebben ondergaan. We zijn geinteresseerd in de pijnscore (VAS) op verschillende tijdsmomenten na de operatie. De verwachting is (uiteraard) dat de pijn direct na de operatie heviger is dan bijv. 3 mnd daarna (dit klopt ook als je de data in een barplot zet). In eerste instantie heb ik de ANOVA for repeated measures gebruikt om te analyseren of de pijn significant verandert in de tijd. Maar, omdat ik een aantal missing data heb, heb ik ook geprobeerd een mixed models analyse (hier mijn [[Media:voorbeeld_mixed_model_spss.doc|syntax]]) te doen. Mijn vragen hierover:  &lt;br /&gt;
&lt;br /&gt;
&#039;&#039;1. Heb ik de juiste covariance structure gebruikt? (nl. AR1)&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;2. Ik heb &#039;tijd&#039; als fixed effect genomen omdat de afname van de VAS op specifieke tijdsmomenten gebeurde, klopt dat?&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;3. Hoe geef de resultaten van deze mixed analyse weer?&lt;br /&gt;
&lt;br /&gt;
1. Of AR(1) de beste is is niet zo te zeggen, dat hangt af van de correlatie tussen de tijdsmomenten in jouw data. Je kunt bijvoorbeeld alle mogelijke structuren draaien en dan degene met de kleinste AIC te kiezen (smaller is better zoals er ook onder staat). &lt;br /&gt;
&lt;br /&gt;
2. Tijd is hier inderdaad een fixed variable, want je wilt hier de hypothese toetsen of er een verandering in de tijd is.&lt;br /&gt;
&lt;br /&gt;
3. In de output vind je onder &amp;quot;fixed effects&amp;quot; een B die aangeeft wat het effect is per tijdspunt (tov het startpunt) en een bijbehorende p-waarde. Dit is de toets die je waarschijnlijk wilt rapporteren. Onder het kopje &amp;quot;mean estimates&amp;quot; vind je de schatting van het model voor de gemiddelde VAS waarde op ieder tijdpunt. Deze mean estimates zijn voor een lezer makkelijker te interpreteren dan de B&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Wat is het verschil tussen een mixed model en een GEE model?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb een mixed model gebruikt omdat ik wil corrigeren voor de familieverbanden tussen mijn patienten. In een paper met een soortgelijke analyse zie ik echter dat er een GEE model is gebruikt. Welke moet ik hebben en wat is het verschil?&lt;br /&gt;
&lt;br /&gt;
Beide modellen, een mixed model en een GEE model, kunnen corrigeren voor familieverbanden (of andere herhaalde metingen structuren). Een GEE (generalized estimation equations), ook wel genoemd marginaal model, negeert de correlaties tussen de herhaalde metingen in dezelfde familie, maar corrigeert de [[standaardfout/standard error|standaardfouten]] van de regressie coëfficiënten door robuuste [[standaardfout/standard error|standaardfouten]] te berekenen. Een mixed model, ook wel conditioneel model, of ook wel random-effects model modelleert de correlaties tussen de herhaalde metingen in dezelfde familie door een random-effect per familie in het model te includeren. De herhaalde metingen in een familie hebben die random-effects parameter gezamenlijk en dat maakt dat die metingen correleren. De volgende pagina van [http://www.theanalysisfactor.com/extensions-general-linear-model/ The analysis factor]  geeft een helder overzicht van de overeenkomst/verschillen tussen verschillende modellen die je kunt gebruiken voor herhaalde metingen.&lt;br /&gt;
&lt;br /&gt;
==Hoe wordt gebruikelijk een linear mixed model gerapporteerd in een artikel?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Het valt me op dat hier maar weinig over te vinden is op Pubmed, en als er al wat is, is het heel wisselend. Ik heb bijvoorbeeld een artikel gevonden waarin ze alleen maar de Beta coefficient met bijbehorende p-waarde geven. Maar ik wil toch graag ook wel de mean (±SD) weergeven. Is het gebruikelijk dat per cluster te doen? Of bijvoorbeeld toch een mean (±SD) per groep?&lt;br /&gt;
&lt;br /&gt;
Je zou de ruwe data (mean +sd) kunnen presenteren voor iedere groep. Hier is de (cluster)correctie van het mixed model echter nog niet in meegenomen. Alternatief kun je de estimated marginal means (+ conf interval) uit het model per groep rapporteren, deze zijn &#039;gecorrigeerd&#039; voor de clusters/correlaties. Deze kun je ook opvragen in SPSS.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 Deze paper] bij continue uitkomsten.&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2649</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2649"/>
		<updated>2019-03-06T13:15:06Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en Generalized Estimation Equations (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2648</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2648"/>
		<updated>2019-03-06T13:14:39Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en Generalized Estimation Equations (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 Deze paper] bij continue uitkomsten.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2647</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2647"/>
		<updated>2019-03-06T13:14:25Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en Generalized Estimation Equations (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 Deze paper] bij continue uitkomsten.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Repeated_measures_ANOVA&amp;diff=2646</id>
		<title>Repeated measures ANOVA</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Repeated_measures_ANOVA&amp;diff=2646"/>
		<updated>2019-03-06T13:13:39Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: Created page with &amp;quot;Repeated measurements ANOVA is een wat oudere term voor speciale vormen van mixed-models voor het analyseren van herhaalde metingen van een kwantitatieve afhankelijke variabel...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Repeated measurements ANOVA is een wat oudere term voor speciale vormen van mixed-models voor het analyseren van herhaalde metingen van een kwantitatieve afhankelijke variabele die normaal verdeeld is. Binnen het SPSS pakket wordt deze techniek aangeduid als GLM - repeated. Zoals eerder opgemerkt is deze procedure specifieke variant van mixed-models, maar is alleen beschikbaar voor continue normaal verdeelde afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patiënten. &lt;br /&gt;
&lt;br /&gt;
== Aannames bij repeated measures ANOVA&lt;br /&gt;
Repeated measures ANOVA zoals in SPSS geimplementeerd, geeft twee soorten analyses, namelijk onder de aanname dat de correlaties tussen de herhaalde metingen allemaal dezelfde waarde hebben (compound symmetry) of zonder aannames over de correlaties (unstructured). In de SPSS output worden de compound-symmetry resultaten onder het kopje Tests of Within-Subjects Effects gerapporteerd en de unstructured resultaten onder het kopje Multivariate Tests. Wel handig is dat Mauchly&#039;s Test of Sphericity wordt gegeven; dat is een statistische toets van de nulhypothese dat de compound symmetry aanname klopt (kleine p-waardes van deze test zijn een indicatie dat compound symmetry niet goed past bij de data). Als sphericity (i.e. compound symmetry) wordt verworpen, dan kunnen ofwel de multivariate toets resultaten gebruikt worden, ofwel een Greenhouse-Geisser of een Huynh-Feldt correctie worden toegepast op de Tests of Within-Subjects Effects.&lt;br /&gt;
&lt;br /&gt;
==Wanneer kan ik een repeated measurements ANOVA gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Je kunt een repeated measurements ANOVA gebruiken als:&lt;br /&gt;
* de afhankelijke variabele continue is en (per level van de onafhankelijke voorspeller) normaal verdeeld is,&lt;br /&gt;
* de herhaalde metingen op vaste tijdstippen in alle patienten zijn gedaan,&lt;br /&gt;
* er geen missende waardes zijn.&lt;br /&gt;
&lt;br /&gt;
==Hoe kan ik post hoc testen doen bij een two-way repeated measures anova?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb twee onafhankelijke groepen (patient/controle is between subject factor) waarbij  bij beide op 5 tijdsmomenten data is verzameld (5 timepoints als within subject factor). Nu run ik een two-way repeated measures anova om het interactie effect tussen groep en tijd te bekijken. Indien dit significant is wil ik graag weten op welke tijdsmomenten de controle groep verschilde van de patient groep. Er is geen optie in SPSS om een Tukey post hoc test te doen. Mag je in deze situatie een independent t-test gebruiken op ieder tijdstip om te bepalen op welke verschillende tijdsmomenten de twee groepen met elkaar verschilden? &lt;br /&gt;
 &lt;br /&gt;
&#039;&#039;Zo niet, dan wil ik graag een Tukey met de hand uitrekenen, dit heb ik al wel gedaan voor de one-way repeated measures anova waarin ik bij de patient groep heb gekeken op welke tijdsmomenten de data verschilde met de data van de baseline meting. Maar kan je dit ook doen bij een two way anova met 2 onafhankelijke groepen? &lt;br /&gt;
&lt;br /&gt;
Je kunt de losse (t-)testen doen (t0 patient minus t0 controle, t1 patient minus t1 controle etc.). En vervolgens moet je de uitkomsten van die testen corrigeren voor het feit dat je [[multiple testing|multiple comparisons]] doet. Ik zou daar zelf niet direct zien hoe Tukey toe te passen, omdat je daarbij uitgaat van een aantal means met hypothese dat ze allemaal (aan elkaar) gelijk zijn. Nu is het een ander geval, namelijk je wilt kijken of de means telkens 2 aan 2 gelijk aan elkaar zijn. Ik zou daarom een andere correctiemethode gebruiken (zoals [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni]] of [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni-Holms]]). &lt;br /&gt;
&lt;br /&gt;
Let bij je eerdere analyse (post hoc op de within factor) ook goed op dat je de vergelijkingen wel gepaard uitvoert. Overigens kun je deze (within) vergelijking wel door spss laten doen. Namelijk door onder &#039;Options&#039; de factor &#039;tijd&#039; naar &#039;Display means for&#039; te brengen en dan &#039;compare main effects&#039; aan te klikken, met gewenste correctiemethode.&lt;br /&gt;
&lt;br /&gt;
Op deze [http://www.uvm.edu/~dhowell/StatPages/More_Stuff/RepMeasMultComp/RepMeasMultComp.html site van David Howell] staan zeer veel adviezen over de zin en onzin van post hoc tests bij repeated measurements ANOVA&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik de repeated measurements ANOVA in SPSS?==&lt;br /&gt;
&lt;br /&gt;
Je vindt de repeated measurements ANOVA in SPSS 16 onder Analyze-&amp;gt;General Linear Model-&amp;gt;Repeated measures.&lt;br /&gt;
&lt;br /&gt;
Er geldt voor de repeated measurements ANOVA dat de herhaalde metingen van de patienten in aparte kolommen naast elkaar in de SPSS file moeten staan. Stel dat er drie herhaalde metingen van drie patienten zijn, dan ziet de data file er als volgt uit met vier kolommen:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! meting1 !! meting2 !! meting3&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2645</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2645"/>
		<updated>2019-03-06T13:11:38Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Welke analyses zijn er mogelijk voor herhaalde metingen? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]] en Generalized Estimation Equations (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=repeated measurements ANOVA=&lt;br /&gt;
Repeated measurements ANOVA is een wat oudere term voor speciale vormen van mixed-models voor het analyseren van herhaalde metingen van een kwantitatieve afhankelijke variabele die normaal verdeeld is. Binnen het SPSS pakket wordt deze techniek aangeduid als GLM - repeated. Zoals eerder opgemerkt is deze procedure specifieke variant van mixed-models, maar is alleen beschikbaar voor continue normaal verdeelde afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patiënten. &lt;br /&gt;
&lt;br /&gt;
Repeated measures ANOVA zoals in SPSS geimplementeerd, geeft twee soorten analyses, namelijk onder de aanname dat de correlaties tussen de herhaalde metingen allemaal dezelfde waarde hebben (compound symmetry) of zonder aannames over de correlaties (unstructured). In de SPSS output worden de compound-symmetry resultaten onder het kopje Tests of Within-Subjects Effects gerapporteerd en de unstructured resultaten onder het kopje Multivariate Tests. Wel handig is dat Mauchly&#039;s Test of Sphericity wordt gegeven; dat is een statistische toets van de nulhypothese dat de compound symmetry aanname klopt (kleine p-waardes van deze test zijn een indicatie dat compound symmetry niet goed past bij de data). Als sphericity (i.e. compound symmetry) wordt verworpen, dan kunnen ofwel de multivariate toets resultaten gebruikt worden, ofwel een Greenhouse-Geisser of een Huynh-Feldt correctie worden toegepast op de Tests of Within-Subjects Effects.&lt;br /&gt;
&lt;br /&gt;
==Wanneer kan ik een repeated measurements ANOVA gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Je kunt een repeated measurements ANOVA gebruiken als:&lt;br /&gt;
* de afhankelijke variabele continue is en (per level van de onafhankelijke voorspeller) normaal verdeeld is,&lt;br /&gt;
* de herhaalde metingen op vaste tijdstippen in alle patienten zijn gedaan,&lt;br /&gt;
* er geen missende waardes zijn.&lt;br /&gt;
&lt;br /&gt;
==Hoe kan ik post hoc testen doen bij een two-way repeated measures anova?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb twee onafhankelijke groepen (patient/controle is between subject factor) waarbij  bij beide op 5 tijdsmomenten data is verzameld (5 timepoints als within subject factor). Nu run ik een two-way repeated measures anova om het interactie effect tussen groep en tijd te bekijken. Indien dit significant is wil ik graag weten op welke tijdsmomenten de controle groep verschilde van de patient groep. Er is geen optie in SPSS om een Tukey post hoc test te doen. Mag je in deze situatie een independent t-test gebruiken op ieder tijdstip om te bepalen op welke verschillende tijdsmomenten de twee groepen met elkaar verschilden? &lt;br /&gt;
 &lt;br /&gt;
&#039;&#039;Zo niet, dan wil ik graag een Tukey met de hand uitrekenen, dit heb ik al wel gedaan voor de one-way repeated measures anova waarin ik bij de patient groep heb gekeken op welke tijdsmomenten de data verschilde met de data van de baseline meting. Maar kan je dit ook doen bij een two way anova met 2 onafhankelijke groepen? &lt;br /&gt;
&lt;br /&gt;
Je kunt de losse (t-)testen doen (t0 patient minus t0 controle, t1 patient minus t1 controle etc.). En vervolgens moet je de uitkomsten van die testen corrigeren voor het feit dat je [[multiple testing|multiple comparisons]] doet. Ik zou daar zelf niet direct zien hoe Tukey toe te passen, omdat je daarbij uitgaat van een aantal means met hypothese dat ze allemaal (aan elkaar) gelijk zijn. Nu is het een ander geval, namelijk je wilt kijken of de means telkens 2 aan 2 gelijk aan elkaar zijn. Ik zou daarom een andere correctiemethode gebruiken (zoals [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni]] of [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni-Holms]]). &lt;br /&gt;
&lt;br /&gt;
Let bij je eerdere analyse (post hoc op de within factor) ook goed op dat je de vergelijkingen wel gepaard uitvoert. Overigens kun je deze (within) vergelijking wel door spss laten doen. Namelijk door onder &#039;Options&#039; de factor &#039;tijd&#039; naar &#039;Display means for&#039; te brengen en dan &#039;compare main effects&#039; aan te klikken, met gewenste correctiemethode.&lt;br /&gt;
&lt;br /&gt;
Op deze [http://www.uvm.edu/~dhowell/StatPages/More_Stuff/RepMeasMultComp/RepMeasMultComp.html site van David Howell] staan zeer veel adviezen over de zin en onzin van post hoc tests bij repeated measurements ANOVA&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik de repeated measurements ANOVA in SPSS?==&lt;br /&gt;
&lt;br /&gt;
Je vindt de repeated measurements ANOVA in SPSS 16 onder Analyze-&amp;gt;General Linear Model-&amp;gt;Repeated measures.&lt;br /&gt;
&lt;br /&gt;
Er geldt voor de repeated measurements ANOVA dat de herhaalde metingen van de patienten in aparte kolommen naast elkaar in de SPSS file moeten staan. Stel dat er drie herhaalde metingen van drie patienten zijn, dan ziet de data file er als volgt uit met vier kolommen:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! meting1 !! meting2 !! meting3&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 Deze paper] bij continue uitkomsten.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2644</id>
		<title>Mixed effects modellen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Mixed_effects_modellen&amp;diff=2644"/>
		<updated>2019-03-06T13:09:41Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: Created page with &amp;quot;  Mixed models kunnen op meerdere manieren gespecificeerd worden. Het is zinvol om een onderscheid te maken tussen  #onderzoeken waarbij alle patienten op (min of meer) dezelf...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
&lt;br /&gt;
Mixed models kunnen op meerdere manieren gespecificeerd worden. Het is zinvol om een onderscheid te maken tussen &lt;br /&gt;
#onderzoeken waarbij alle patienten op (min of meer) dezelfde tijdstippen (of onder dezelfde condities) herhaald worden gemeten, en&lt;br /&gt;
#onderzoeken waarin het aantal herhaalde metingen per patient en/of de tijdstippen en condities verschillen tussen patienten.&lt;br /&gt;
&lt;br /&gt;
====Situatie 1: herhaalde metingen op dezelfde momenten====&lt;br /&gt;
&lt;br /&gt;
Als alle patienten op dezelfde tijdstippen (onder dezelfde condities) zijn gemeten, kan het mixed-model gezien worden als een uitbreiding van een standaard [[lineaire regressie| lineair model]]. In formulevorm ziet de uitbreiding van het standaard model er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = a + b \times X_{i,t} + \epsilon_{i,t}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij &amp;lt;math&amp;gt;Y_{i,t}&amp;lt;/math&amp;gt; de meting van de &amp;lt;math&amp;gt;i^{de}&amp;lt;/math&amp;gt; patient is op het &amp;lt;math&amp;gt;t^{de}&amp;lt;/math&amp;gt; tijdstip (conditie); &amp;lt;math&amp;gt;X_{i,t}&amp;lt;/math&amp;gt; is de meting van de covariaat op dat moment en &amp;lt;math&amp;gt;\epsilon_{i,t}&amp;lt;/math&amp;gt; is de afstand (of: &#039;&#039;residu&#039;&#039;) van de datapunten tot de [[lineaire regressie#Hoe werkt (enkelvoudige) lineaire regressie?|regressielijn]]. Bij een standaard [[lineaire regressie]] zijn al deze residuen onafhankelijk van elkaar, maar bij herhaalde metingen is dat niet per se het geval. Namelijk, als het eerste datapunt van een patient (ver) boven (of onder) de lijn ligt, is het goed voorstelbaar dat volgende datapunten van dezelfde persoon ook boven (of onder) de regressielijn zullen liggen. Anders geformuleerd: datapunten van dezelfde persoon lijken meer op elkaar dan op datapunten van andere personen. &lt;br /&gt;
Bij een mixed model wordt rekening gehouden met de [[correlatie|correlaties]] tussen de residuen van metingen bij dezelfde patient. Dit kan op verschillende manieren en moet door de gebruiker worden gespecificeerd. Veel voorkomende correlatiestructuren zijn:&lt;br /&gt;
*compound symmetry, waarbij aangenomen wordt dat de correlaties tussen alle residuen van dezelfde persoon gelijk zijn. De eerste en de tweede meting van een persoon hangen dus even sterk met elkaar samen als de eerste en de laatste meting van die persoon;&lt;br /&gt;
*unstructured, waarbij geen enkele aanname wordt gemaakt over de correlaties. Iedere correlatie tussen twee tijdspunten wordt los van de anderen bepaald;&lt;br /&gt;
&lt;br /&gt;
Er zijn nog diverse andere opties en de beste keuze hangt af van het type onderzoek en het aantal herhaalde metingen. Er zijn statistische maten die je helpen bij het maken van de keuze. Vaak wordt hiervoor de Akaike Information Criterium (AIC) gebruikt. Dit is een maat voor hoe goed het gekozen model past bij de data. Hoe lager de AIC, hoe beter het model past.&lt;br /&gt;
&lt;br /&gt;
Deze eerste soort uitbreiding van het standaard lineaire model wordt ook wel &#039;Generalized Least Squares Model&#039; genoemd.&lt;br /&gt;
&lt;br /&gt;
====Situatie 2: herhaalde metingen op verschillende momenten====&lt;br /&gt;
&lt;br /&gt;
Als het aantal herhaalde metingen per patient en/of de tijdstippen (condities) waarop er gemeten wordt verschillen tussen patienten, ligt het voor de hand om het [[lineaire regressie|lineaire model]] op een andere wijze uit te breiden. In situatie 1 werd de correlatie tussen meetpunten op verschillende tijdstippen direct gemodelleerd. Als er niet op vaste tijdstippen gemeten wordt, is dit niet logisch. De afhankelijkheid van metingen bij eenzelfde patient kan ook gemodelleerd worden met zogenaamde random effects. Met random effects wordt een inschatting gemaakt van de afwijking die metingen van eenzelfde patient hebben ten opzichte van de regressielijn. Hierbij maakt het niet uit hoe vaak en op welke tijdstippen een patient gemeten is; al zijn metingen worden verondersteld een vaste afwijking van de &#039;gemiddelde&#039; regressielijn te hebben. In formulevorm ziet dit er als volgt uit:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;Y_{i,t} = (a+ \alpha_i) + (b+\beta_i) \times X_{i,t}  + \epsilon_{i,t} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
waarbij de nu toegevoegde &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; de specifieke afwijkingen van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt;  t.o.v. de regressielijn voorstellen. De &amp;lt;math&amp;gt;\alpha_i&amp;lt;/math&amp;gt; is de afwijking van de intercept van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|intercept]] &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;. De &amp;lt;math&amp;gt;\beta_i&amp;lt;/math&amp;gt; is de afwijking van de [[lineaire regressie#Hoe werkt een (enkelvoudig) lineair model?|helling]] (&#039;&#039;slope&#039;&#039;) van patient &amp;lt;math&amp;gt;i&amp;lt;/math&amp;gt; ten opzichte van de gemiddelde helling &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; van de regressielijn. De &amp;lt;math&amp;gt;\alpha&#039;s&amp;lt;/math&amp;gt; en &amp;lt;math&amp;gt;\beta&#039;s&amp;lt;/math&amp;gt; worden niet direct geschat, in plaats daarvan wordt verondersteld dat zij normaal verdeeld zijn met gemiddelde 0. De standaard deviaties van deze verdelingen worden geschat. &lt;br /&gt;
De specificaties van de random effects kunnen nog uitgebreid worden en de fit van het model wordt gekwantificeerd met bijvoorbeeld de AIC. Ook hier geldt: het model met de laagste AIC past het beste bij de data.&lt;br /&gt;
&lt;br /&gt;
Deze tweede soort modellen wordt vaak aangeduid als &#039;Random Effect Models&#039;.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik linear mixed models in SPSS?==&lt;br /&gt;
Je vindt de linear mixed models in SPSS 16 onder Analyze-&amp;gt;Mixed models-&amp;gt;Linear. T/m [[statistische software#SPSS|SPSS 18]] is er alleen nog een mixed model beschikbaar voor continue (normaal verdeelde) uitkomsten. Vanaf [[statistische software#SPSS|SPSS 19]] biedt SPSS ook procedures aan voor andere typen uitkomsten zoals dichotome variabelen. Deze vind je onder Analyze -&amp;gt; Mixed Models -&amp;gt; Generalized. In andere pakketten zoals [[statistische software#R|R]] (package &#039;nlme&#039; en package &#039;lme4&#039;), Stata ([http://www.gllamm.org GLAMM]) en [[statistische software#SAS|SAS]] zijn er ook mixed modellen beschikbaar voor verschillende typen uitkomstmaten.&lt;br /&gt;
&lt;br /&gt;
Let op: om een mixed model in SPSS te kunnen draaien moeten de data onder elkaar gestructureerd staan, waarbij iedere meting op een rij staat en er meerdere rijen zijn die bij dezelfde patient horen. In deze [http://www.spss.ch/upload/1126184451_Linear%20Mixed%20Effects%20Modeling%20in%20SPSS.pdf SPSS handleiding] staat stap voor stap beschreven hoe data te restructureren is in het gewenste format voor mixed models. Als er drie herhaalde metingen van drie patienten zijn, ziet het resultaat er bijvoorbeeld zo uit:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! metingnr !! meting&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
De hierboven beschreven &#039;situatie 1&#039; modellering gebeurt in SPSS middels het specificeren van de &#039;Repeated&#039; (+bijbehorende repeated covariance type) in het eerste panel van de mixed procedure. De in &#039;situatie 2&#039; besproken modellering wordt gespecificeerd onder de &#039;Random...&#039; knop (let op: random intercept staat by default uit, bij covariance type kan correlatie tussen de random effects gespecificeerd worden). Vaak is het gebruik van 1 van beide opties (danwel repeated danwel random) voldoende om de correlatie in de data op te vangen. Gebruik maken van beide opties kan wel, maar zal soms leiden tot overbodige parameters.&lt;br /&gt;
&lt;br /&gt;
==Hoe analyseer ik met een mixed model een effect in de tijd?==&lt;br /&gt;
&#039;&#039;Ik onderzoek een groep patienten die een operatie hebben ondergaan. We zijn geinteresseerd in de pijnscore (VAS) op verschillende tijdsmomenten na de operatie. De verwachting is (uiteraard) dat de pijn direct na de operatie heviger is dan bijv. 3 mnd daarna (dit klopt ook als je de data in een barplot zet). In eerste instantie heb ik de ANOVA for repeated measures gebruikt om te analyseren of de pijn significant verandert in de tijd. Maar, omdat ik een aantal missing data heb, heb ik ook geprobeerd een mixed models analyse (hier mijn [[Media:voorbeeld_mixed_model_spss.doc|syntax]]) te doen. Mijn vragen hierover:  &lt;br /&gt;
&lt;br /&gt;
&#039;&#039;1. Heb ik de juiste covariance structure gebruikt? (nl. AR1)&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;2. Ik heb &#039;tijd&#039; als fixed effect genomen omdat de afname van de VAS op specifieke tijdsmomenten gebeurde, klopt dat?&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;3. Hoe geef de resultaten van deze mixed analyse weer?&lt;br /&gt;
&lt;br /&gt;
1. Of AR(1) de beste is is niet zo te zeggen, dat hangt af van de correlatie tussen de tijdsmomenten in jouw data. Je kunt bijvoorbeeld alle mogelijke structuren draaien en dan degene met de kleinste AIC te kiezen (smaller is better zoals er ook onder staat). &lt;br /&gt;
&lt;br /&gt;
2. Tijd is hier inderdaad een fixed variable, want je wilt hier de hypothese toetsen of er een verandering in de tijd is.&lt;br /&gt;
&lt;br /&gt;
3. In de output vind je onder &amp;quot;fixed effects&amp;quot; een B die aangeeft wat het effect is per tijdspunt (tov het startpunt) en een bijbehorende p-waarde. Dit is de toets die je waarschijnlijk wilt rapporteren. Onder het kopje &amp;quot;mean estimates&amp;quot; vind je de schatting van het model voor de gemiddelde VAS waarde op ieder tijdpunt. Deze mean estimates zijn voor een lezer makkelijker te interpreteren dan de B&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Wat is het verschil tussen een mixed model en een GEE model?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb een mixed model gebruikt omdat ik wil corrigeren voor de familieverbanden tussen mijn patienten. In een paper met een soortgelijke analyse zie ik echter dat er een GEE model is gebruikt. Welke moet ik hebben en wat is het verschil?&lt;br /&gt;
&lt;br /&gt;
Beide modellen, een mixed model en een GEE model, kunnen corrigeren voor familieverbanden (of andere herhaalde metingen structuren). Een GEE (generalized estimation equations), ook wel genoemd marginaal model, negeert de correlaties tussen de herhaalde metingen in dezelfde familie, maar corrigeert de [[standaardfout/standard error|standaardfouten]] van de regressie coëfficiënten door robuuste [[standaardfout/standard error|standaardfouten]] te berekenen. Een mixed model, ook wel conditioneel model, of ook wel random-effects model modelleert de correlaties tussen de herhaalde metingen in dezelfde familie door een random-effect per familie in het model te includeren. De herhaalde metingen in een familie hebben die random-effects parameter gezamenlijk en dat maakt dat die metingen correleren. De volgende pagina van [http://www.theanalysisfactor.com/extensions-general-linear-model/ The analysis factor]  geeft een helder overzicht van de overeenkomst/verschillen tussen verschillende modellen die je kunt gebruiken voor herhaalde metingen.&lt;br /&gt;
&lt;br /&gt;
==Hoe wordt gebruikelijk een linear mixed model gerapporteerd in een artikel?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Het valt me op dat hier maar weinig over te vinden is op Pubmed, en als er al wat is, is het heel wisselend. Ik heb bijvoorbeeld een artikel gevonden waarin ze alleen maar de Beta coefficient met bijbehorende p-waarde geven. Maar ik wil toch graag ook wel de mean (±SD) weergeven. Is het gebruikelijk dat per cluster te doen? Of bijvoorbeeld toch een mean (±SD) per groep?&lt;br /&gt;
&lt;br /&gt;
Je zou de ruwe data (mean +sd) kunnen presenteren voor iedere groep. Hier is de (cluster)correctie van het mixed model echter nog niet in meegenomen. Alternatief kun je de estimated marginal means (+ conf interval) uit het model per groep rapporteren, deze zijn &#039;gecorrigeerd&#039; voor de clusters/correlaties. Deze kun je ook opvragen in SPSS.&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2643</id>
		<title>Herhaalde metingen</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Herhaalde_metingen&amp;diff=2643"/>
		<updated>2019-03-06T13:08:56Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]&lt;br /&gt;
|coauthor=  prof. dr. A.H. Zwinderman&lt;br /&gt;
}}&lt;br /&gt;
==Wat zijn herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;herhaling in de tijd&#039;&#039;&#039;: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);&lt;br /&gt;
*&#039;&#039;&#039;meerdere locaties&#039;&#039;&#039;: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);&lt;br /&gt;
*&#039;&#039;&#039;meerdere condities&#039;&#039;&#039;: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;&lt;br /&gt;
*&#039;&#039;&#039;herhalingen tbv nauwkeurigheid&#039;&#039;&#039;: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;&lt;br /&gt;
*&#039;&#039;&#039;multilevel structuren&#039;&#039;&#039;: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.&lt;br /&gt;
&lt;br /&gt;
==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. &lt;br /&gt;
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.&lt;br /&gt;
&lt;br /&gt;
[[Image:14189829-0.jpg|500px]]&lt;br /&gt;
&lt;br /&gt;
==Welke analyses zijn er mogelijk voor herhaalde metingen?==&lt;br /&gt;
&lt;br /&gt;
*&#039;&#039;&#039;Simpele methodes&#039;&#039;&#039;: Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].&lt;br /&gt;
*&#039;&#039;&#039;Geavanceerde methodes&#039;&#039;&#039;: Methodes die wel herhaalde metingen aankunnen zijn o.a. [[herhaalde metingen#mixed models|mixed models]], [[herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]] en Generalized Estimation Equations (GEE). &lt;br /&gt;
&lt;br /&gt;
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.&lt;br /&gt;
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. &lt;br /&gt;
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.&lt;br /&gt;
&lt;br /&gt;
=area under the curve=&lt;br /&gt;
&lt;br /&gt;
==Wat is een area under the curve en wanneer kun je die gebruiken?==&lt;br /&gt;
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een &amp;quot;area under the curve&amp;quot;. Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.&lt;br /&gt;
&lt;br /&gt;
==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==&lt;br /&gt;
&#039;&#039;Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de &#039;area under the curve&#039; bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?&lt;br /&gt;
&lt;br /&gt;
Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=repeated measurements ANOVA=&lt;br /&gt;
Repeated measurements ANOVA is een wat oudere term voor speciale vormen van mixed-models voor het analyseren van herhaalde metingen van een kwantitatieve afhankelijke variabele die normaal verdeeld is. Binnen het SPSS pakket wordt deze techniek aangeduid als GLM - repeated. Zoals eerder opgemerkt is deze procedure specifieke variant van mixed-models, maar is alleen beschikbaar voor continue normaal verdeelde afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patiënten. &lt;br /&gt;
&lt;br /&gt;
Repeated measures ANOVA zoals in SPSS geimplementeerd, geeft twee soorten analyses, namelijk onder de aanname dat de correlaties tussen de herhaalde metingen allemaal dezelfde waarde hebben (compound symmetry) of zonder aannames over de correlaties (unstructured). In de SPSS output worden de compound-symmetry resultaten onder het kopje Tests of Within-Subjects Effects gerapporteerd en de unstructured resultaten onder het kopje Multivariate Tests. Wel handig is dat Mauchly&#039;s Test of Sphericity wordt gegeven; dat is een statistische toets van de nulhypothese dat de compound symmetry aanname klopt (kleine p-waardes van deze test zijn een indicatie dat compound symmetry niet goed past bij de data). Als sphericity (i.e. compound symmetry) wordt verworpen, dan kunnen ofwel de multivariate toets resultaten gebruikt worden, ofwel een Greenhouse-Geisser of een Huynh-Feldt correctie worden toegepast op de Tests of Within-Subjects Effects.&lt;br /&gt;
&lt;br /&gt;
==Wanneer kan ik een repeated measurements ANOVA gebruiken?==&lt;br /&gt;
&lt;br /&gt;
Je kunt een repeated measurements ANOVA gebruiken als:&lt;br /&gt;
* de afhankelijke variabele continue is en (per level van de onafhankelijke voorspeller) normaal verdeeld is,&lt;br /&gt;
* de herhaalde metingen op vaste tijdstippen in alle patienten zijn gedaan,&lt;br /&gt;
* er geen missende waardes zijn.&lt;br /&gt;
&lt;br /&gt;
==Hoe kan ik post hoc testen doen bij een two-way repeated measures anova?==&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik heb twee onafhankelijke groepen (patient/controle is between subject factor) waarbij  bij beide op 5 tijdsmomenten data is verzameld (5 timepoints als within subject factor). Nu run ik een two-way repeated measures anova om het interactie effect tussen groep en tijd te bekijken. Indien dit significant is wil ik graag weten op welke tijdsmomenten de controle groep verschilde van de patient groep. Er is geen optie in SPSS om een Tukey post hoc test te doen. Mag je in deze situatie een independent t-test gebruiken op ieder tijdstip om te bepalen op welke verschillende tijdsmomenten de twee groepen met elkaar verschilden? &lt;br /&gt;
 &lt;br /&gt;
&#039;&#039;Zo niet, dan wil ik graag een Tukey met de hand uitrekenen, dit heb ik al wel gedaan voor de one-way repeated measures anova waarin ik bij de patient groep heb gekeken op welke tijdsmomenten de data verschilde met de data van de baseline meting. Maar kan je dit ook doen bij een two way anova met 2 onafhankelijke groepen? &lt;br /&gt;
&lt;br /&gt;
Je kunt de losse (t-)testen doen (t0 patient minus t0 controle, t1 patient minus t1 controle etc.). En vervolgens moet je de uitkomsten van die testen corrigeren voor het feit dat je [[multiple testing|multiple comparisons]] doet. Ik zou daar zelf niet direct zien hoe Tukey toe te passen, omdat je daarbij uitgaat van een aantal means met hypothese dat ze allemaal (aan elkaar) gelijk zijn. Nu is het een ander geval, namelijk je wilt kijken of de means telkens 2 aan 2 gelijk aan elkaar zijn. Ik zou daarom een andere correctiemethode gebruiken (zoals [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni]] of [[Multiple_testing#Hoe_kan_ik_corrigeren_met_de_Bonferroni_methode|Bonferroni-Holms]]). &lt;br /&gt;
&lt;br /&gt;
Let bij je eerdere analyse (post hoc op de within factor) ook goed op dat je de vergelijkingen wel gepaard uitvoert. Overigens kun je deze (within) vergelijking wel door spss laten doen. Namelijk door onder &#039;Options&#039; de factor &#039;tijd&#039; naar &#039;Display means for&#039; te brengen en dan &#039;compare main effects&#039; aan te klikken, met gewenste correctiemethode.&lt;br /&gt;
&lt;br /&gt;
Op deze [http://www.uvm.edu/~dhowell/StatPages/More_Stuff/RepMeasMultComp/RepMeasMultComp.html site van David Howell] staan zeer veel adviezen over de zin en onzin van post hoc tests bij repeated measurements ANOVA&#039;s.&lt;br /&gt;
&lt;br /&gt;
== Waar vind ik de repeated measurements ANOVA in SPSS?==&lt;br /&gt;
&lt;br /&gt;
Je vindt de repeated measurements ANOVA in SPSS 16 onder Analyze-&amp;gt;General Linear Model-&amp;gt;Repeated measures.&lt;br /&gt;
&lt;br /&gt;
Er geldt voor de repeated measurements ANOVA dat de herhaalde metingen van de patienten in aparte kolommen naast elkaar in de SPSS file moeten staan. Stel dat er drie herhaalde metingen van drie patienten zijn, dan ziet de data file er als volgt uit met vier kolommen:&lt;br /&gt;
&lt;br /&gt;
{| border =&amp;quot;1&amp;quot; style=&amp;quot;width:450px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;3&amp;quot;&lt;br /&gt;
! patientnummer!! meting1 !! meting2 !! meting3&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 1 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 10 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 2 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 11 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 12&lt;br /&gt;
|-&lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 3 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 5 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 8 &lt;br /&gt;
|align=&amp;quot;center&amp;quot;| 9&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Hoe kan ik data van 4 experimenten combineren? =&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren. &lt;br /&gt;
&lt;br /&gt;
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter &amp;lt;cite&amp;gt;[Ruijter2006]&amp;lt;/cite&amp;gt; onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de &#039;clustering&#039;  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als &#039;herhaalde metingen&#039; binnen een sessie.&lt;br /&gt;
&lt;br /&gt;
== Wat is het minimaal aantal observaties bij het gebruik van een mixed-effects model? ==&lt;br /&gt;
&#039;Hoeveel datapunten (clusters en/of patiënten) heb ik nodig als ik een mixed-effects model wil gebruiken?&#039;&lt;br /&gt;
&lt;br /&gt;
[http://dx.doi.org/10.1186/1471-2288-7-34 Deze paper]  geeft wat houvast bij binaire uitkomsten. En [http://dx.doi.org/10.1027/1614-2241.1.3.86 Deze paper] bij continue uitkomsten.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Referenties =&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]&lt;br /&gt;
&lt;br /&gt;
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&amp;amp;pubmedid=16398936]&lt;br /&gt;
&lt;br /&gt;
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=Informatie op andere websites=&lt;br /&gt;
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten. &lt;br /&gt;
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.&lt;br /&gt;
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.&lt;br /&gt;
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.&lt;br /&gt;
&lt;br /&gt;
=Sofwaretips=&lt;br /&gt;
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2642</id>
		<title>OVERZICHT</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=OVERZICHT&amp;diff=2642"/>
		<updated>2019-03-06T13:06:18Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{| border =&amp;quot;2&amp;quot; style=&amp;quot;width:850px&amp;quot; align=&amp;quot;center&amp;quot; cellpadding=&amp;quot;8&amp;quot;&lt;br /&gt;
! [[Poweranalyse]]!! Toetsen !! Statistische maten&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Poweranalyse#AMC biostatistics manual - Sample size calculation|manual sample size calculation (Engels)]]&lt;br /&gt;
*[[Poweranalyse#Wat is een poweranalyse|wat is een poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Wanneer heb ik een power analyse nodig?|wanneer heb ik een poweranalyse nodig]]&lt;br /&gt;
*[[Poweranalyse#Welke software is beschikbaar voor power analyse?|welke software is er voor poweranalyse]]&lt;br /&gt;
*[[Poweranalyse#Welke informatie heb ik nodig voor een power analyse?|welke informatie heb ik nodig]]&lt;br /&gt;
*[[Poweranalyse#Waar vind ik de benodigde informatie voor een power analyse?|waar vind ik de informatie]]&lt;br /&gt;
*[[Poweranalyse#Kan ik meerdere uitkomstmaten combineren in een poweranalyse?|meerdere uitkomstmaten]]&lt;br /&gt;
*[[Poweranalyse#Wanneer is een post hoc poweranalyse zinvol?|post hoc poweranalyses]]&lt;br /&gt;
*[[Poweranalyse#Poweranalyse in specifieke onderzoeksdesigns|specifieke onderzoeksdesigns]]&lt;br /&gt;
| &lt;br /&gt;
*[[Fisher&#039;s exact toets]] &lt;br /&gt;
*[[Chi-kwadraat toets]]&lt;br /&gt;
*[[McNemar toets]]&lt;br /&gt;
*[[T-toets]]&lt;br /&gt;
*[[Mann-Whitney U toets]]&lt;br /&gt;
*[[Wilcoxon signed rank toets]]&lt;br /&gt;
*[[one-way ANOVA]]&lt;br /&gt;
*[[Kruskal Wallis]]&lt;br /&gt;
*[[Friedman toets]]&lt;br /&gt;
*[[Tekentoets]]&lt;br /&gt;
*[[Cochran&#039;s Q toets]]&lt;br /&gt;
| &lt;br /&gt;
*[[gemiddelde en mediaan]]&lt;br /&gt;
*[[standaardfout/standard error]]&lt;br /&gt;
*[[betrouwbaarheidsinterval]]&lt;br /&gt;
*[[associatiematen 2x2 tabel]]&lt;br /&gt;
*[[z-scores]]&lt;br /&gt;
*[[effect maten]]&lt;br /&gt;
*[[model fit maten]]&lt;br /&gt;
*[[statistiek rapporteren]]&lt;br /&gt;
|-&lt;br /&gt;
! Regressieanalyse!! [[Herhaalde metingen]]!! [[Survival analyse]]&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
&lt;br /&gt;
*[[lineaire regressie]]&lt;br /&gt;
*[[logistische regressie]]&lt;br /&gt;
*[[multivariabele regressie]]&lt;br /&gt;
*[[ANCOVA]]&lt;br /&gt;
*[[multinomiale logistische regressie]]&lt;br /&gt;
*[[ordinale logistische regressie]]&lt;br /&gt;
*[[risicoscores gebaseerd op regressiemodellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[repeated measures ANOVA]]&lt;br /&gt;
*[[generalized estimating equations]]&lt;br /&gt;
*[[mixed effects modellen]]&lt;br /&gt;
| &lt;br /&gt;
*[[Survival analyse#kaplan meier analyse|Kaplan Meier]]&lt;br /&gt;
*[[Survival analyse#cox regressie|Cox regressie]]&lt;br /&gt;
*[[competing risk analyse]]&lt;br /&gt;
|-&lt;br /&gt;
! [[Correlatie]]!! Studieontwerp!! Overig&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
*[[Correlatie#Pearson&#039;s r|Pearson&#039;s r]]&lt;br /&gt;
*[[Correlatie#Spearman’s rho|Spearman&#039;s rho]]&lt;br /&gt;
*[[Cohen&#039;s kappa]]&lt;br /&gt;
*[[intraclass correlatie coefficient]]&lt;br /&gt;
| &lt;br /&gt;
*[[observationeel onderzoek]]&lt;br /&gt;
*[[diagnostisch onderzoek]]&lt;br /&gt;
*[[systematische reviews]]&lt;br /&gt;
*[[meta-analyse]]&lt;br /&gt;
*[[equivalentie design]]&lt;br /&gt;
| &lt;br /&gt;
*[[interimanalyse]]&lt;br /&gt;
*[[matchen]]&lt;br /&gt;
*[[multiple testing]]&lt;br /&gt;
*[[missing values]]&lt;br /&gt;
*[[outliers]]&lt;br /&gt;
*[[randomiseren]]&lt;br /&gt;
*[[statistische software]]&lt;br /&gt;
*[[grafieken]]&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;lt;div style=&amp;quot;background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Klaar met lezen? Je kunt naar de pagina [[KEUZE TOETS]] gaan voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de [http://www.elearningbiostatistics.com AMC e-learning Practical Biostatistics]. Vind je op deze pagina&#039;s iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan [[meeschrijven | contact]] met ons op.&lt;br /&gt;
&lt;br /&gt;
De wiki biostatistiek is een initiatief van de [https://www.amc.nl/web/Research/ResearchAMC/Research-Support.htm AMC Clinical Research Unit]. De Clinical Research Unit biedt statistische ondersteuning aan AMC onderzoekers bij het ontwerpen, uitvoeren en rapporteren van statistische analyses. Daarnaast ontwikkelen we ondersteunende producten die toegankelijke uitleg geven over het gebruik van statistiek en statistische software in het medisch onderzoek. Medewerkers van het AMC kunnen via de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm AMC intranet site van de CRU] statistische ondersteuning aanvragen.&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2641</id>
		<title>Randomiseren</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2641"/>
		<updated>2019-02-27T13:08:27Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Welke software is beschikbaar voor randomisatie? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Jan Binnekade|dr. J.M. Binnekade]]&lt;br /&gt;
|coauthor=  [[user:Nan van Geloven|dr. ir. N. van Geloven]]&lt;br /&gt;
}}&lt;br /&gt;
Randomisatie is een techniek waarmee patiënten, proefpersonen of proefdieren op basis van toeval (loting) worden toegewezen aan een van de groepen  van een experimenteel onderzoek. &lt;br /&gt;
&lt;br /&gt;
== Wat is randomiseren? == &lt;br /&gt;
&lt;br /&gt;
Een randomized controlled trial is de gouden standaard voor het evalueren van interventies in de gezondheidszorg. De idee van het studiedesign is dat proefpersonen op basis van toeval (at random) worden toegewezen aan een van de studiearmen. Het beoogde resultaat is een gelijke verdeling van de eigenschappen van bekende en onbekende prognostische factoren over de studiearmen. Na randomisatie verwacht je dat het effect van het natuurlijk beloop, placebo effecten, confounders en meetfouten in beide groepen tegen elkaar wegvallen. Hierdoor meet je uiteindelijk alleen het “netto” effect van de interventie als verschil tussen de interventie en de controle groep.&lt;br /&gt;
&lt;br /&gt;
==Wanneer randomiseren?==&lt;br /&gt;
&lt;br /&gt;
In experimenteel onderzoek waarbij twee of meer groepen worden vergeleken en waarin de onderzoeker de interventie kan manipuleren en op deze wijze invloed zou kunnen hebben op de toewijzing van de interventie of op de behandeling van de proefpersonen.&lt;br /&gt;
&lt;br /&gt;
==Waarom randomiseren? ==&lt;br /&gt;
Er zijn drie redenen om te randomiseren: &lt;br /&gt;
&lt;br /&gt;
#Idealiter bestaat het verschil tussen de armen van een studie alleen uit het effect van de therapie, de interventie. Door te randomiseren worden alle andere factoren die het therapie effect kunnen beïnvloeden door het toeval verdeeld over de beide groepen. Dit zorgt ervoor dat het effect van bekende en onbekende (prognostische) factoren at random wordt verdeeld over beide studiearmen. &lt;br /&gt;
#Randomisatie helpt bij het blinderen van de interventie voor de behandelaars en de proefpersonen. Het voorkomt dat er patronen van patiëntreacties herkend worden waardoor de toewijzing aan een van de studiearmen bekend wordt aan de behandelaar.  &lt;br /&gt;
#Randomisatie levert groepen op die een willekeurige steekproef zijn van de onderzoekspopulatie waarmee aan een voorwaarde wordt voldaan voor het toepassen van de standaard statistische testen die gebaseerd zijn op kanstheorie.&lt;br /&gt;
&lt;br /&gt;
==Wat doet randomisatie niet? ==&lt;br /&gt;
&lt;br /&gt;
Randomisatie is geen garantie dat prognostische factoren ook werkelijk gelijk verdeeld worden tussen studiegroepen, het toeval kan ongelukkig uitpakken. De kans op een ongelijke verdeling wordt groter naarmate de steekproef kleiner is. Bij een willekeurig grote steekproef zullen prognostische factoren gelijk verdeeld raken.&lt;br /&gt;
&lt;br /&gt;
==Welke methoden zijn ongeschikt voor randomisatie?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende methoden om patiënten aan een studie arm toe te wijzen die niet gelden als random. Het bezwaar tegen deze methoden is de voorspelbaarheid van de toewijzing. Omdat artsen er naar streven om iedere patient optimaal te behandelen kan er bij een voorspelde toewijzing een conflict ontstaan tussen wat de arts wenselijk acht, op dat moment, onder die specifieke omstandigheden en wat de zorg behorende bij de toegewezen studiearm inhoudt. &amp;lt;br/&amp;gt; &lt;br /&gt;
Voorbeelden van toewijzing die worden geassocieerd met een hoge mate van voorspelbaarheid zijn:  volgens een vaste volgorde (patiënt 1 krijgt A, patiënt 2 krijgt B, patiënt 3 krijgt A etc.); op basis van de datum of dag in de week (patiënten geïncludeerd op even dagen krijgen A, patiënten geïncludeerd op oneven dagen krijgen B); op basis van de initialen van de patient (A-K → behandeling A en M-Z → behandeling B). Deze methoden worden sterk afgeraden omdat er makkelijk mee gemanipuleerd kan worden.&lt;br /&gt;
&lt;br /&gt;
==Welke software is beschikbaar voor randomisatie?==&lt;br /&gt;
In het algemeen in het AMC randomiseert men in Castor. Als de gewenste methode of instellingen in Castor niet beschikbaar is, kunnen onderzoekers contact met de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm helpdesk statistiek van de CRU] (AMC intranet link) opnemen.&lt;br /&gt;
&lt;br /&gt;
==Welke typen randomisatie zijn er?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende manieren om te randomiseren, o.a. simpel-, blok-, gestratificeerde randomisatie en minimisatie. &lt;br /&gt;
&lt;br /&gt;
===Simpele randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij twee studiearmen is deze methode vergelijkbaar met het opgooien van een munt. In de praktijk werkt het met  random getallen. Een behandeling wordt toegewezen volgens een vooraf gestelde regel. Bijvoorbeeld een computer genereert een random getal tussen de 0 en 1. Als dit getal minder of gelijk is aan 0,5 wordt behandeling A toegepast, als het getal meer is dan 0,5 wordt behandeling B toegepast. &lt;br /&gt;
Nadeel van deze methode is dat het niet garandeert dat de steekproef precies gelijk over de studiearmen verdeeld zal worden. Op basis van toeval kan er een lange opeenvolging van eenzijdige toewijzing plaatsvinden, bijvoorbeeld AAAABBA. Hoe kleiner de steekproef hoe groter het risico op een ongelijke verdeling is.&amp;lt;br/&amp;gt; &lt;br /&gt;
Om een ongelijke verdeling tussen de studiearmen te vermijden kun vooraf aan de studie met een computer een lijst met random getallen maken en beoordelen op bruikbaarheid. Als de lijst een ongelijke verdeling heeft van meer dan 10 tussen de studiearmen kun je een nieuwe random getallen lijst genereren.  De praktijk leert dat de simpele methode van randomisatie alleen bij een beoogde steekproef van pakweg meer dan 200 toepasbaar is &amp;lt;cite&amp;gt;[pocock1979]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Blok randomisatie===&lt;br /&gt;
&lt;br /&gt;
Het nadeel van simpele randomisatie is de kans op een ongelijke verdeling van het aantal patiënten over de studiearmen . Door te randomiseren in blokken kun je dit vermijden. Een blok krijgt een bepaalde grootte, bijvoorbeeld 4, 6 of 8 waarin beide studiearmen evenredig verdeeld zijn (voorbeeld ABAB of BAAB etc.). Na ieder blok heb je dus een gelijke verdeling over beide studiearmen. De blokgrootte is een veelvoud van het aantal studiearmen in de studie. &lt;br /&gt;
&lt;br /&gt;
Als blokken niet helemaal gebruikt worden kan er alsnog een ongelijke verdeling tussen studiearmen ontstaan. Bijvoorbeeld, als een studie met een blokgrootte van 8 halverwege stopt is de maximale ongelijkheid 4 patiënten.  &lt;br /&gt;
&lt;br /&gt;
Kritiek op het gebruik van kleine blokken is dat de randomisatie voor een deel voorspelbaar kan worden. Daarom worden er het liefst grote en blokken van random wisselende grootte gebruikt.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van randomisatie met blokgrootte van 4 ( therapie = A, controle = B)  R → ABAB  BABA   AABB  ABBA  ABBA  ABAB  BABA  AABB  ABBA  etc. &amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===Gestratificeerde randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij simpele of blok randomisatie is het niet gegarandeerd dat bekende prognostische factoren gelijk verdeeld worden over de studiearmen. De kans dat prognostische factoren ongelijk verdeeld worden is bij een kleine steekproef groter dan bij een grote steekproef. Een methode om een ongelijke verdeling van bekende prognostische factoren te voorkomen is gestratificeerde randomisatie. Stratificatie betekent dat voor iedere combinatie van prognostische factoren (voor ieder stratum) een aparte randomisatielijst wordt gebruikt. Gestratificeerde randomisatie wordt vaak gebruikt in combinatie met het blok design om de interventie evenredig over beide studiearmen te verdelen.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van een gestratificeerde blok randomisatie waarin gestratificeerd wordt voor geslacht en leeftijdsgroep ( therapie = A, controle = B)&lt;br /&gt;
&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|&lt;br /&gt;
|width=&amp;quot;160&amp;quot; colspan=&amp;quot;2&amp;quot;|Patienteigenschappen&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|Randomisatievolgorde&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst1&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABAB AABB ABBA BABA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst2&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|BAAB BBAA ABAB AABB&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst3&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|AABB ABBA BAAB BBAA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst4&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABBA BABA ABAB AABB&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
Op basis van de eigenschappen van een patient wordt de juiste lijst gekozen,  een man die ouder is dan de  mediane leeftijd wordt gerandomiseerd vanuit lijst 2. &lt;br /&gt;
Het stratificeren wordt belangrijker naarmate de steekproef kleiner is omdat het risico op een onevenredige verdeling van de prognostische factoren dan groter is. Echter, het aantal randomisatielijsten dat je moet hanteren groeit snel naarmate je met meer prognostische factoren rekening wil houden. Voor je het weet heb je evenveel strata als patiënten in je steekproef. Bij deze methode is evenzogoed een onevenredige verdeling van patiënten aantallen tussen de studiearmen mogelijk (zie blok randomisatie). Hierbij speelt de blokgrootte en het aantal strata een rol. Als in het bovenstaande voorbeeld toevalligerwijs in alle strata de laatste blokken AABB zouden zijn en de studie stopt nadat alleen de AA&#039;s zijn gebruikt is de maximale (erg theoretische) scheefheid 8 patiënten. &lt;br /&gt;
Als je met meerdere prognostische factoren rekening wilt houden kun je meerdere factoren combineren in een index waarna je de index gebruikt om de strata te definiëren.&lt;br /&gt;
Let op: wanneer er gestratificeerd gerandomiseerd wordt, dan moet ook de analyse corrigeren voor de stratificatiefactoren. Zie bijvoorbeeld de artikelen van Kahan en Morris &amp;lt;cite&amp;gt;[Kahan2011],[Kahan2012]&amp;lt;/cite&amp;gt; en de [http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2013/06/WC500144946.pdf EMA guideline on adjustment for baseline covariates (draft)]. Een toegankelijke uitleg hierover vind je in deze [http://thestatsgeek.com/2016/04/05/matching-analysis-to-design-stratified-randomization-in-trials/ post van Jonathan Bartlett].&lt;br /&gt;
&lt;br /&gt;
===Minimisatie===&lt;br /&gt;
&lt;br /&gt;
Met minimisatie wordt ook gestreefd naar een gelijke verdeling van patiënten en hun prognostische factoren onder de studiearmen. Het verschil met gestratificeerde blok randomisatie is dat er bij minimisatie geen strata (subgroepen) vooraf worden gedefinieerd van waaruit gerandomiseerd wordt. De minimisatie methode beoordeelt alvorens een nieuwe patient wordt gerandomiseerd hoe zijn of haar verdeling van de prognostische factoren is bij de tot dan toe gerandomiseerde patiënten. Als deze verdeling in balans is wordt de patient gewoon (kop of munt) gerandomiseerd. Als er een onbalans bestaat zal de trekking bewust worden beïnvloed ten gunste van de groep die de onbalans doet verminderen.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voorbeeld van een randomisatie met de minimisatie methode. &#039;&#039;&amp;lt;br/&amp;gt;&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;200&amp;quot; colspan=&amp;quot;3&amp;quot;| Overzicht eerder gerandomiseerde patienten &lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Prognostische factor&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Interventie&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Controle&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Mannen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Vrouwen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 21-30&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 31-40&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 41-50&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|1&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico hoog&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico laag&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Stel de eerst volgende patient is een man, tussen de 31 en 40 jaar oud met een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de interventie groep zijn tot nu toe 3 mannen gerandomiseerd, hebben 2 patienten een leeftijd tussen de 31-40 en hebben 4 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de controle groep zijn 5 mannen gerandomiseerd, hebben 3 patienten een leeftijd tussen de 31-40 en hebben 5 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
De onbalans die nu zou ontstaan bij randomizatie naar de interventiearm is voor mannen 5 - 4 = 1, voor de leeftijdscategorie 3 - 3 = 0 en voor hoog risico 5 - 5 = 0, totaal 1 (1+0+0). Bij randomizatie naar de controlearm ontstaat er een onbalans van 6 - 3 = 3 (mannen), 4 - 2 = 2 (leeftijd 31-40) en 6 - 4 = 2 (hoog risico), een totale onbalans van 7 (3+2+2). Nu zijn er verschillende opties om de patiënt toe te wijzen. Bij een strikte minimisatie wordt de patiënt toegewezen aan de interventie groep omdat 1 &amp;lt; 7. Het nadeel van deze methode is de voorspelbaarheid. Een andere optie is het aanpassen van de kansverhouding op toewijzing, bijvoorbeeld 80:20. De kansverhouding kan je laten bepalen door de mate van onbalans (gebruikelijk). Als groepen in balans zijn vindt de toewijzing plaats op basis van een fifty-fifty kans.&lt;br /&gt;
&lt;br /&gt;
==Vragen over randomisatie==&lt;br /&gt;
&lt;br /&gt;
=== Kan ik op volgorde van aanmelding randomiseren ? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Wij gaan een dubbelblinde crossover studie doen. Een groep volwassen patiënten gaat gedurende 2 perioden van 4 weken een extra supplement krijgen wat we ene periode een mogelijk werkzame stof en de andere periode placebo bevat. Het doel is 20 patiënten te includeren. Graag willen we uw advies over hoe te randomiseren. Er zal een groep 1 zijn, die eerst het blauwe supplement en in de tweede periode het groene supplement krijgt, en er is een groep 2 die eerst het groene supplement en in de tweede periode het blauwe supplement krijgt. Mijn voorstel zou zijn om te randomiseren in volgorde van aanmelding waarbij de oneven nummers (1e, 3e, 5e aanmelding etc) in groep 1 gaan en de even nummers (2e 4e 6e etc) aanmelding in groep 2. Is dit een juiste methode of zijn er valkuilen?&lt;br /&gt;
&lt;br /&gt;
Om en om randomiseren is gevaarlijk omdat dan makkelijk de blindering doorbroken kan worden (als je eenmaal weet dat nr 5 groen heeft gekregen weet je alle opeenvolgende toewijzingen ook gelijk!). Er worden in [[meta-analyse|meta-analyses]] zelfs studies geexludeerd die gerandomiseerd hebben op bijvoorbeeld dag van de week. Het handigst om de te randomiseren mbv een randomisatieprogramma. Degene die het middel moet gaan geven, mag niet weten of dit groen of blauw is. Bij de tweede (cross-over) periode moet de &#039;randomisator&#039; alle groene op blauw overzetten en vice versa. Wederom blijft de behandelaar blind.&lt;br /&gt;
&lt;br /&gt;
=== Kan het bij gestratificeerde randomisatie voorkomen dat bepaalde patienten niet meer geincludeerd kunnen worden? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil binnenkort starten met een RCT waarin ik 100 patiënten in de interventie wil hebben en 100 in de controle groep. Stratificatie zal zijn voor geslacht (man/vrouw), leeftijd(50-70/70-90) en uitvoerend chirurg. Mijn vraag is nu: kan het zijn dat (vooral later in het randomisatieproces) er patiënten NIET worden geincludeerd omdat een randomisatie stratum al vol is en de patiënt niet voldoet aan de eisen die gesteld zijn door de stratificatieprocedure (bv. niet de goede leeftijd, geslacht, arts zit al vol etc etc.) Ik vraag dit, daar de patiënten die ik wil includeren moeilijk te vinden zijn en elke patiënt eigenlijk telt.&lt;br /&gt;
&lt;br /&gt;
Doorgaans wordt er bij gebruik van gestratificeerde randomisatie geen grens gezet op bijv het &#039;absolute&#039; aantal mannen of vrouwen dat geincludeerd wordt. Stel dat er maar 10% vrouwen instroomt, dan tracht de stratificatie in beide behandelgroepen die 10% vrouwen te krijgen. Het is niet zo dat er op een gegeven moment &#039;geen vrouw meer geincludeerd mag worden&#039; oid. Waar wel rekening mee moet worden gehouden is dat bij het gebruik van (meerdere) stratificatiefactoren het lastiger is om die balans te verkrijgen en het ook lastiger kan worden om de totale balans (100 vs 100) te verzekeren. Het kan dan bijv ook 95-105 worden, of 5% vrouwen in de ene arm en 15% in de andere. Er moet van te voren gekeken worden hoeveel stratificatiefactoren meekunnen om een redelijke balans te kunnen verzekeren. Maar het is dus niet zo dat er patienten &#039;niet mee kunnen doen&#039;.&lt;br /&gt;
&lt;br /&gt;
=== Een van onze trialpatienten is uitgevallen, is het verstandig om de randomisatieplek weer vrij te maken en te vergeven aan een nieuwe patient? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Op dit moment zijn er een aantal patienten gerandomiseerd, maar nu valt er middenin de lijst een patient uit. Deze patient is onterecht geincludeerd. Wij zouden deze plek het liefst opnieuw vergeven aan een nieuwe patient. Mag dat of zijn er methodologische bezwaren? In principe is de randomisatielijst overigens lang genoeg om de plek leeg te laten. &lt;br /&gt;
&lt;br /&gt;
De aanpak bij &#039;uitval&#039; van gerandomiseerde patienten hangt van een aantal zaken af:&lt;br /&gt;
&lt;br /&gt;
1. intention to treat principe:&lt;br /&gt;
Volgens het &#039;intention to treat&#039; principe zou iedereen die ooit in een studie geincludeerd is mee moeten blijven doen tot het einde volgens de gerandomiseerde allocatie. Ook als er protocol violations zijn zoals het switchen van behandeling, niet houden aan voorgeschreven behandeling of het achteraf niet volledig blijken te voldoen aan inclusiecriteria. Idee hierachter is dat wanneer de behandeling aangeraden gaat worden (bijvoorbeeld in richtlijnen) voor patienten met bepaalde criteria er soortgelijke &#039;inschattingsfouten&#039;/ protocol violations kunnen optreden en dat een vergelijking van de effectiviteit binnen een studiepopulaties inclusief deze violators de beste inschatting van het effect in de werkelijkheid / praktijk geeft. Indien jullie in de trial het intention to treat principe willen aanhouden, dan zou deze patient niet geexcludeerd moeten worden.&lt;br /&gt;
 &lt;br /&gt;
2. sample size berekening:&lt;br /&gt;
De [[poweranalyse|sample size berekening]] kan op verschillende wijze rekening houden met uitval. Vaak is er bij de sample size berekening rekening gehouden met een bepaalde mate van uitval. Bijvoorbeeld er zijn 100 patienten nodig in de analyze, er worden er 110 geincludeerd omdat enkelen waarschijnlijk zullen uitvallen/niet mee kunnen in de analyse. In dit geval zou je 110 patienten randomiseren (randomisatielijst van 110). Er zullen uiteindelijk 10 hiervan niet mee doen in de analyse, dat is ingecalculeerd en een uitgevallen plek hoeft dus niet opgevuld te worden. Heel soms is de sample size berekening zo opgesteld dat er bijvoorbeeld 10 mannen en 10 vrouwen nodig zijn die het hele protocol strict moeten hebben gevolgd (powerberekening gebaseerd op de per-protocol analyse). Dit is vaak het geval in heel vroeg fase, experimentele studies. In zo&#039;n geval kan er bij uitval een plek worden opgevuld door een nieuwe patient. In sommige situatie is het raadzaam om daarbij de vrijgevallen randomisatieplaatsen weer op te vullen (zie punt 3 hieronder).&lt;br /&gt;
 &lt;br /&gt;
3. balans in randomisatielijst:&lt;br /&gt;
Wanneer er een kleine sample size is en daarbij wellciht ook nog een stratificatie in de randomisatie (bijvoorbeeld 10 mannen in 1 stratum en 10 vrouwen in ander stratum) dan kan uitval van een van de patienten en toevoegen van een nieuwe patient met nieuwe randomisatieuitslag een ongewenst scheve allocatie opleveren (bijvvoorbeeld mannen 4:6 ipv gewenste 5:5). In dat soort gevallen kan er voor gekozen worden een vrijgevallen randomisatieplek op te laten vullen door de nieuwe &#039;vervangende&#039; patient. Nadeel hiervan is wel dat (bij niet geblindeerde studies) de randomisatieuitslag van de vervanger al bekend is voor inclusie. Wanneer er een grotere sample size is, dan is iha een kleine disbalans in allocatie niet storend. Bijvvoorbeeld een trial met 47:53 allocatie is prima en heeft evenveel power als een 50:50 allocatie. Ervan uitgaande dat uitval van patienten niet slechts in 1 van de twee armen voorkomt (dat zou op hele andere problemen duiden) is er in het algemeen geen probleem met allocatiebalans te verwachten en wordt aangeraden om gewoon een volgende positie van de randomisatielijst te gebruiken na uitval van een patient.&lt;br /&gt;
&lt;br /&gt;
Samenvattend is het in het algemeen af te raden om randomisatieposites &#039;vrij te maken en opnieuw te vullen&#039;. Uitzondering hierop zijn vroeg fase experimentele studies met sterke wens voor gebalanceerde allocaties. Ook is een uitzondering als er ten onrechte gerandomiseerd is door bijvvoorbeeld een technische fout zoals &#039;twee keer op de randomisatieknop drukken&#039;.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#kernan1999 Kernan WN, Viscoli CM, Makuch RW, Brass LM, Horwitz RI. Stratified randomization for clinical trials. J Clin Epidemiol. 1999 Jan;52(1):19-26. [http://dx.doi.org/10.1016/S0895-4356(98)00138-3 DOI 10.1016/S0895-4356(98)00138-3]&lt;br /&gt;
&lt;br /&gt;
#altman2005 DG Altman, JM Bland. Treatment allocation by minimization. BMJ. 2005 April 9; 330(7495): 843. [http://dx.doi.org/10.1136/bmj.330.7495.843 DOI 10.1136/bmj.330.7495.843]&lt;br /&gt;
&lt;br /&gt;
#scott2002 Scott NW, McPherson GC, Ramsay CR, Campbell MK. The method of minimization for allocation to clinical trials. a review. Control Clin Trials. 2002 Dec;23(6):662-74. [http://dx.doi.org/10.1016/S0197-2456(02)00242-8 DOI 10.1016/S0197-2456(02)00242-8]&lt;br /&gt;
&lt;br /&gt;
#schulz2002 Schulz KF, Grimes DA. Generation of allocation sequences in randomised trials: chance, not choice. Lancet. 2002 Feb 9;359(9305):515-9. [http://dx.doi.org/10.1016/S0140-6736(02)07683-3 DOI 10.1016/S0140-6736(02)07683-3]&lt;br /&gt;
&lt;br /&gt;
#kang2008 Kang M, Ragan BG, Park JH. Issues in outcomes research: an overview of randomization techniques for clinical trials. J Athl Train. 2008 Apr-Jun;43(2):215-21. [http://dx.doi.org/10.4085/1062-6050-43.2.215 DOI 10.4085/1062-6050-43.2.215.]&lt;br /&gt;
&lt;br /&gt;
#pocock1979 Pocock SJ. Allocation of patients to treatment in clinical trials. Biometrics 1979; 35: 183-197 [http://dx.doi.org/10.2307/2529944 DOI 10.2307/2529944]&lt;br /&gt;
&lt;br /&gt;
#Kahan2012 Kahan BC, Morris TP. Reporting and analysis of trials using stratified randomisation in leading medical journals: review and reanalysis. BMJ 2012; 345 :e5840 [http://dx.doi.org/10.1136/bmj.e5840 DOI 10.1136/bmj.e5840]&lt;br /&gt;
&lt;br /&gt;
#Kahan2011 Kahan, B. C. and Morris, T. P. (2012), Improper analysis of trials randomised using stratified blocks or minimisation. Statist. Med., 31: 328–340 [http://dx.doi.org/10.1002/sim.4431 DOI: 10.1002/sim.4431]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2640</id>
		<title>Randomiseren</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2640"/>
		<updated>2019-02-27T13:08:11Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Welke software is beschikbaar voor randomisatie? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Jan Binnekade|dr. J.M. Binnekade]]&lt;br /&gt;
|coauthor=  [[user:Nan van Geloven|dr. ir. N. van Geloven]]&lt;br /&gt;
}}&lt;br /&gt;
Randomisatie is een techniek waarmee patiënten, proefpersonen of proefdieren op basis van toeval (loting) worden toegewezen aan een van de groepen  van een experimenteel onderzoek. &lt;br /&gt;
&lt;br /&gt;
== Wat is randomiseren? == &lt;br /&gt;
&lt;br /&gt;
Een randomized controlled trial is de gouden standaard voor het evalueren van interventies in de gezondheidszorg. De idee van het studiedesign is dat proefpersonen op basis van toeval (at random) worden toegewezen aan een van de studiearmen. Het beoogde resultaat is een gelijke verdeling van de eigenschappen van bekende en onbekende prognostische factoren over de studiearmen. Na randomisatie verwacht je dat het effect van het natuurlijk beloop, placebo effecten, confounders en meetfouten in beide groepen tegen elkaar wegvallen. Hierdoor meet je uiteindelijk alleen het “netto” effect van de interventie als verschil tussen de interventie en de controle groep.&lt;br /&gt;
&lt;br /&gt;
==Wanneer randomiseren?==&lt;br /&gt;
&lt;br /&gt;
In experimenteel onderzoek waarbij twee of meer groepen worden vergeleken en waarin de onderzoeker de interventie kan manipuleren en op deze wijze invloed zou kunnen hebben op de toewijzing van de interventie of op de behandeling van de proefpersonen.&lt;br /&gt;
&lt;br /&gt;
==Waarom randomiseren? ==&lt;br /&gt;
Er zijn drie redenen om te randomiseren: &lt;br /&gt;
&lt;br /&gt;
#Idealiter bestaat het verschil tussen de armen van een studie alleen uit het effect van de therapie, de interventie. Door te randomiseren worden alle andere factoren die het therapie effect kunnen beïnvloeden door het toeval verdeeld over de beide groepen. Dit zorgt ervoor dat het effect van bekende en onbekende (prognostische) factoren at random wordt verdeeld over beide studiearmen. &lt;br /&gt;
#Randomisatie helpt bij het blinderen van de interventie voor de behandelaars en de proefpersonen. Het voorkomt dat er patronen van patiëntreacties herkend worden waardoor de toewijzing aan een van de studiearmen bekend wordt aan de behandelaar.  &lt;br /&gt;
#Randomisatie levert groepen op die een willekeurige steekproef zijn van de onderzoekspopulatie waarmee aan een voorwaarde wordt voldaan voor het toepassen van de standaard statistische testen die gebaseerd zijn op kanstheorie.&lt;br /&gt;
&lt;br /&gt;
==Wat doet randomisatie niet? ==&lt;br /&gt;
&lt;br /&gt;
Randomisatie is geen garantie dat prognostische factoren ook werkelijk gelijk verdeeld worden tussen studiegroepen, het toeval kan ongelukkig uitpakken. De kans op een ongelijke verdeling wordt groter naarmate de steekproef kleiner is. Bij een willekeurig grote steekproef zullen prognostische factoren gelijk verdeeld raken.&lt;br /&gt;
&lt;br /&gt;
==Welke methoden zijn ongeschikt voor randomisatie?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende methoden om patiënten aan een studie arm toe te wijzen die niet gelden als random. Het bezwaar tegen deze methoden is de voorspelbaarheid van de toewijzing. Omdat artsen er naar streven om iedere patient optimaal te behandelen kan er bij een voorspelde toewijzing een conflict ontstaan tussen wat de arts wenselijk acht, op dat moment, onder die specifieke omstandigheden en wat de zorg behorende bij de toegewezen studiearm inhoudt. &amp;lt;br/&amp;gt; &lt;br /&gt;
Voorbeelden van toewijzing die worden geassocieerd met een hoge mate van voorspelbaarheid zijn:  volgens een vaste volgorde (patiënt 1 krijgt A, patiënt 2 krijgt B, patiënt 3 krijgt A etc.); op basis van de datum of dag in de week (patiënten geïncludeerd op even dagen krijgen A, patiënten geïncludeerd op oneven dagen krijgen B); op basis van de initialen van de patient (A-K → behandeling A en M-Z → behandeling B). Deze methoden worden sterk afgeraden omdat er makkelijk mee gemanipuleerd kan worden.&lt;br /&gt;
&lt;br /&gt;
==Welke software is beschikbaar voor randomisatie?==&lt;br /&gt;
In het algemeen in het AMC randomiseert men in Castor. Als de gewenste methode of instellingen in Castor niet beschikkbaar is, kunnen onderzoekers contact met de [http://intranet.amc.nl/web/organisatie/domeinen/research/clinical-research-unit-cru/statistiek.htm helpdesk statistiek van de CRU] (AMC intranet link) opnemen.&lt;br /&gt;
&lt;br /&gt;
==Welke typen randomisatie zijn er?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende manieren om te randomiseren, o.a. simpel-, blok-, gestratificeerde randomisatie en minimisatie. &lt;br /&gt;
&lt;br /&gt;
===Simpele randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij twee studiearmen is deze methode vergelijkbaar met het opgooien van een munt. In de praktijk werkt het met  random getallen. Een behandeling wordt toegewezen volgens een vooraf gestelde regel. Bijvoorbeeld een computer genereert een random getal tussen de 0 en 1. Als dit getal minder of gelijk is aan 0,5 wordt behandeling A toegepast, als het getal meer is dan 0,5 wordt behandeling B toegepast. &lt;br /&gt;
Nadeel van deze methode is dat het niet garandeert dat de steekproef precies gelijk over de studiearmen verdeeld zal worden. Op basis van toeval kan er een lange opeenvolging van eenzijdige toewijzing plaatsvinden, bijvoorbeeld AAAABBA. Hoe kleiner de steekproef hoe groter het risico op een ongelijke verdeling is.&amp;lt;br/&amp;gt; &lt;br /&gt;
Om een ongelijke verdeling tussen de studiearmen te vermijden kun vooraf aan de studie met een computer een lijst met random getallen maken en beoordelen op bruikbaarheid. Als de lijst een ongelijke verdeling heeft van meer dan 10 tussen de studiearmen kun je een nieuwe random getallen lijst genereren.  De praktijk leert dat de simpele methode van randomisatie alleen bij een beoogde steekproef van pakweg meer dan 200 toepasbaar is &amp;lt;cite&amp;gt;[pocock1979]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Blok randomisatie===&lt;br /&gt;
&lt;br /&gt;
Het nadeel van simpele randomisatie is de kans op een ongelijke verdeling van het aantal patiënten over de studiearmen . Door te randomiseren in blokken kun je dit vermijden. Een blok krijgt een bepaalde grootte, bijvoorbeeld 4, 6 of 8 waarin beide studiearmen evenredig verdeeld zijn (voorbeeld ABAB of BAAB etc.). Na ieder blok heb je dus een gelijke verdeling over beide studiearmen. De blokgrootte is een veelvoud van het aantal studiearmen in de studie. &lt;br /&gt;
&lt;br /&gt;
Als blokken niet helemaal gebruikt worden kan er alsnog een ongelijke verdeling tussen studiearmen ontstaan. Bijvoorbeeld, als een studie met een blokgrootte van 8 halverwege stopt is de maximale ongelijkheid 4 patiënten.  &lt;br /&gt;
&lt;br /&gt;
Kritiek op het gebruik van kleine blokken is dat de randomisatie voor een deel voorspelbaar kan worden. Daarom worden er het liefst grote en blokken van random wisselende grootte gebruikt.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van randomisatie met blokgrootte van 4 ( therapie = A, controle = B)  R → ABAB  BABA   AABB  ABBA  ABBA  ABAB  BABA  AABB  ABBA  etc. &amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===Gestratificeerde randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij simpele of blok randomisatie is het niet gegarandeerd dat bekende prognostische factoren gelijk verdeeld worden over de studiearmen. De kans dat prognostische factoren ongelijk verdeeld worden is bij een kleine steekproef groter dan bij een grote steekproef. Een methode om een ongelijke verdeling van bekende prognostische factoren te voorkomen is gestratificeerde randomisatie. Stratificatie betekent dat voor iedere combinatie van prognostische factoren (voor ieder stratum) een aparte randomisatielijst wordt gebruikt. Gestratificeerde randomisatie wordt vaak gebruikt in combinatie met het blok design om de interventie evenredig over beide studiearmen te verdelen.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van een gestratificeerde blok randomisatie waarin gestratificeerd wordt voor geslacht en leeftijdsgroep ( therapie = A, controle = B)&lt;br /&gt;
&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|&lt;br /&gt;
|width=&amp;quot;160&amp;quot; colspan=&amp;quot;2&amp;quot;|Patienteigenschappen&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|Randomisatievolgorde&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst1&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABAB AABB ABBA BABA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst2&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|BAAB BBAA ABAB AABB&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst3&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|AABB ABBA BAAB BBAA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst4&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABBA BABA ABAB AABB&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
Op basis van de eigenschappen van een patient wordt de juiste lijst gekozen,  een man die ouder is dan de  mediane leeftijd wordt gerandomiseerd vanuit lijst 2. &lt;br /&gt;
Het stratificeren wordt belangrijker naarmate de steekproef kleiner is omdat het risico op een onevenredige verdeling van de prognostische factoren dan groter is. Echter, het aantal randomisatielijsten dat je moet hanteren groeit snel naarmate je met meer prognostische factoren rekening wil houden. Voor je het weet heb je evenveel strata als patiënten in je steekproef. Bij deze methode is evenzogoed een onevenredige verdeling van patiënten aantallen tussen de studiearmen mogelijk (zie blok randomisatie). Hierbij speelt de blokgrootte en het aantal strata een rol. Als in het bovenstaande voorbeeld toevalligerwijs in alle strata de laatste blokken AABB zouden zijn en de studie stopt nadat alleen de AA&#039;s zijn gebruikt is de maximale (erg theoretische) scheefheid 8 patiënten. &lt;br /&gt;
Als je met meerdere prognostische factoren rekening wilt houden kun je meerdere factoren combineren in een index waarna je de index gebruikt om de strata te definiëren.&lt;br /&gt;
Let op: wanneer er gestratificeerd gerandomiseerd wordt, dan moet ook de analyse corrigeren voor de stratificatiefactoren. Zie bijvoorbeeld de artikelen van Kahan en Morris &amp;lt;cite&amp;gt;[Kahan2011],[Kahan2012]&amp;lt;/cite&amp;gt; en de [http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2013/06/WC500144946.pdf EMA guideline on adjustment for baseline covariates (draft)]. Een toegankelijke uitleg hierover vind je in deze [http://thestatsgeek.com/2016/04/05/matching-analysis-to-design-stratified-randomization-in-trials/ post van Jonathan Bartlett].&lt;br /&gt;
&lt;br /&gt;
===Minimisatie===&lt;br /&gt;
&lt;br /&gt;
Met minimisatie wordt ook gestreefd naar een gelijke verdeling van patiënten en hun prognostische factoren onder de studiearmen. Het verschil met gestratificeerde blok randomisatie is dat er bij minimisatie geen strata (subgroepen) vooraf worden gedefinieerd van waaruit gerandomiseerd wordt. De minimisatie methode beoordeelt alvorens een nieuwe patient wordt gerandomiseerd hoe zijn of haar verdeling van de prognostische factoren is bij de tot dan toe gerandomiseerde patiënten. Als deze verdeling in balans is wordt de patient gewoon (kop of munt) gerandomiseerd. Als er een onbalans bestaat zal de trekking bewust worden beïnvloed ten gunste van de groep die de onbalans doet verminderen.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voorbeeld van een randomisatie met de minimisatie methode. &#039;&#039;&amp;lt;br/&amp;gt;&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;200&amp;quot; colspan=&amp;quot;3&amp;quot;| Overzicht eerder gerandomiseerde patienten &lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Prognostische factor&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Interventie&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Controle&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Mannen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Vrouwen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 21-30&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 31-40&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 41-50&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|1&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico hoog&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico laag&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Stel de eerst volgende patient is een man, tussen de 31 en 40 jaar oud met een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de interventie groep zijn tot nu toe 3 mannen gerandomiseerd, hebben 2 patienten een leeftijd tussen de 31-40 en hebben 4 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de controle groep zijn 5 mannen gerandomiseerd, hebben 3 patienten een leeftijd tussen de 31-40 en hebben 5 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
De onbalans die nu zou ontstaan bij randomizatie naar de interventiearm is voor mannen 5 - 4 = 1, voor de leeftijdscategorie 3 - 3 = 0 en voor hoog risico 5 - 5 = 0, totaal 1 (1+0+0). Bij randomizatie naar de controlearm ontstaat er een onbalans van 6 - 3 = 3 (mannen), 4 - 2 = 2 (leeftijd 31-40) en 6 - 4 = 2 (hoog risico), een totale onbalans van 7 (3+2+2). Nu zijn er verschillende opties om de patiënt toe te wijzen. Bij een strikte minimisatie wordt de patiënt toegewezen aan de interventie groep omdat 1 &amp;lt; 7. Het nadeel van deze methode is de voorspelbaarheid. Een andere optie is het aanpassen van de kansverhouding op toewijzing, bijvoorbeeld 80:20. De kansverhouding kan je laten bepalen door de mate van onbalans (gebruikelijk). Als groepen in balans zijn vindt de toewijzing plaats op basis van een fifty-fifty kans.&lt;br /&gt;
&lt;br /&gt;
==Vragen over randomisatie==&lt;br /&gt;
&lt;br /&gt;
=== Kan ik op volgorde van aanmelding randomiseren ? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Wij gaan een dubbelblinde crossover studie doen. Een groep volwassen patiënten gaat gedurende 2 perioden van 4 weken een extra supplement krijgen wat we ene periode een mogelijk werkzame stof en de andere periode placebo bevat. Het doel is 20 patiënten te includeren. Graag willen we uw advies over hoe te randomiseren. Er zal een groep 1 zijn, die eerst het blauwe supplement en in de tweede periode het groene supplement krijgt, en er is een groep 2 die eerst het groene supplement en in de tweede periode het blauwe supplement krijgt. Mijn voorstel zou zijn om te randomiseren in volgorde van aanmelding waarbij de oneven nummers (1e, 3e, 5e aanmelding etc) in groep 1 gaan en de even nummers (2e 4e 6e etc) aanmelding in groep 2. Is dit een juiste methode of zijn er valkuilen?&lt;br /&gt;
&lt;br /&gt;
Om en om randomiseren is gevaarlijk omdat dan makkelijk de blindering doorbroken kan worden (als je eenmaal weet dat nr 5 groen heeft gekregen weet je alle opeenvolgende toewijzingen ook gelijk!). Er worden in [[meta-analyse|meta-analyses]] zelfs studies geexludeerd die gerandomiseerd hebben op bijvoorbeeld dag van de week. Het handigst om de te randomiseren mbv een randomisatieprogramma. Degene die het middel moet gaan geven, mag niet weten of dit groen of blauw is. Bij de tweede (cross-over) periode moet de &#039;randomisator&#039; alle groene op blauw overzetten en vice versa. Wederom blijft de behandelaar blind.&lt;br /&gt;
&lt;br /&gt;
=== Kan het bij gestratificeerde randomisatie voorkomen dat bepaalde patienten niet meer geincludeerd kunnen worden? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil binnenkort starten met een RCT waarin ik 100 patiënten in de interventie wil hebben en 100 in de controle groep. Stratificatie zal zijn voor geslacht (man/vrouw), leeftijd(50-70/70-90) en uitvoerend chirurg. Mijn vraag is nu: kan het zijn dat (vooral later in het randomisatieproces) er patiënten NIET worden geincludeerd omdat een randomisatie stratum al vol is en de patiënt niet voldoet aan de eisen die gesteld zijn door de stratificatieprocedure (bv. niet de goede leeftijd, geslacht, arts zit al vol etc etc.) Ik vraag dit, daar de patiënten die ik wil includeren moeilijk te vinden zijn en elke patiënt eigenlijk telt.&lt;br /&gt;
&lt;br /&gt;
Doorgaans wordt er bij gebruik van gestratificeerde randomisatie geen grens gezet op bijv het &#039;absolute&#039; aantal mannen of vrouwen dat geincludeerd wordt. Stel dat er maar 10% vrouwen instroomt, dan tracht de stratificatie in beide behandelgroepen die 10% vrouwen te krijgen. Het is niet zo dat er op een gegeven moment &#039;geen vrouw meer geincludeerd mag worden&#039; oid. Waar wel rekening mee moet worden gehouden is dat bij het gebruik van (meerdere) stratificatiefactoren het lastiger is om die balans te verkrijgen en het ook lastiger kan worden om de totale balans (100 vs 100) te verzekeren. Het kan dan bijv ook 95-105 worden, of 5% vrouwen in de ene arm en 15% in de andere. Er moet van te voren gekeken worden hoeveel stratificatiefactoren meekunnen om een redelijke balans te kunnen verzekeren. Maar het is dus niet zo dat er patienten &#039;niet mee kunnen doen&#039;.&lt;br /&gt;
&lt;br /&gt;
=== Een van onze trialpatienten is uitgevallen, is het verstandig om de randomisatieplek weer vrij te maken en te vergeven aan een nieuwe patient? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Op dit moment zijn er een aantal patienten gerandomiseerd, maar nu valt er middenin de lijst een patient uit. Deze patient is onterecht geincludeerd. Wij zouden deze plek het liefst opnieuw vergeven aan een nieuwe patient. Mag dat of zijn er methodologische bezwaren? In principe is de randomisatielijst overigens lang genoeg om de plek leeg te laten. &lt;br /&gt;
&lt;br /&gt;
De aanpak bij &#039;uitval&#039; van gerandomiseerde patienten hangt van een aantal zaken af:&lt;br /&gt;
&lt;br /&gt;
1. intention to treat principe:&lt;br /&gt;
Volgens het &#039;intention to treat&#039; principe zou iedereen die ooit in een studie geincludeerd is mee moeten blijven doen tot het einde volgens de gerandomiseerde allocatie. Ook als er protocol violations zijn zoals het switchen van behandeling, niet houden aan voorgeschreven behandeling of het achteraf niet volledig blijken te voldoen aan inclusiecriteria. Idee hierachter is dat wanneer de behandeling aangeraden gaat worden (bijvoorbeeld in richtlijnen) voor patienten met bepaalde criteria er soortgelijke &#039;inschattingsfouten&#039;/ protocol violations kunnen optreden en dat een vergelijking van de effectiviteit binnen een studiepopulaties inclusief deze violators de beste inschatting van het effect in de werkelijkheid / praktijk geeft. Indien jullie in de trial het intention to treat principe willen aanhouden, dan zou deze patient niet geexcludeerd moeten worden.&lt;br /&gt;
 &lt;br /&gt;
2. sample size berekening:&lt;br /&gt;
De [[poweranalyse|sample size berekening]] kan op verschillende wijze rekening houden met uitval. Vaak is er bij de sample size berekening rekening gehouden met een bepaalde mate van uitval. Bijvoorbeeld er zijn 100 patienten nodig in de analyze, er worden er 110 geincludeerd omdat enkelen waarschijnlijk zullen uitvallen/niet mee kunnen in de analyse. In dit geval zou je 110 patienten randomiseren (randomisatielijst van 110). Er zullen uiteindelijk 10 hiervan niet mee doen in de analyse, dat is ingecalculeerd en een uitgevallen plek hoeft dus niet opgevuld te worden. Heel soms is de sample size berekening zo opgesteld dat er bijvoorbeeld 10 mannen en 10 vrouwen nodig zijn die het hele protocol strict moeten hebben gevolgd (powerberekening gebaseerd op de per-protocol analyse). Dit is vaak het geval in heel vroeg fase, experimentele studies. In zo&#039;n geval kan er bij uitval een plek worden opgevuld door een nieuwe patient. In sommige situatie is het raadzaam om daarbij de vrijgevallen randomisatieplaatsen weer op te vullen (zie punt 3 hieronder).&lt;br /&gt;
 &lt;br /&gt;
3. balans in randomisatielijst:&lt;br /&gt;
Wanneer er een kleine sample size is en daarbij wellciht ook nog een stratificatie in de randomisatie (bijvoorbeeld 10 mannen in 1 stratum en 10 vrouwen in ander stratum) dan kan uitval van een van de patienten en toevoegen van een nieuwe patient met nieuwe randomisatieuitslag een ongewenst scheve allocatie opleveren (bijvvoorbeeld mannen 4:6 ipv gewenste 5:5). In dat soort gevallen kan er voor gekozen worden een vrijgevallen randomisatieplek op te laten vullen door de nieuwe &#039;vervangende&#039; patient. Nadeel hiervan is wel dat (bij niet geblindeerde studies) de randomisatieuitslag van de vervanger al bekend is voor inclusie. Wanneer er een grotere sample size is, dan is iha een kleine disbalans in allocatie niet storend. Bijvvoorbeeld een trial met 47:53 allocatie is prima en heeft evenveel power als een 50:50 allocatie. Ervan uitgaande dat uitval van patienten niet slechts in 1 van de twee armen voorkomt (dat zou op hele andere problemen duiden) is er in het algemeen geen probleem met allocatiebalans te verwachten en wordt aangeraden om gewoon een volgende positie van de randomisatielijst te gebruiken na uitval van een patient.&lt;br /&gt;
&lt;br /&gt;
Samenvattend is het in het algemeen af te raden om randomisatieposites &#039;vrij te maken en opnieuw te vullen&#039;. Uitzondering hierop zijn vroeg fase experimentele studies met sterke wens voor gebalanceerde allocaties. Ook is een uitzondering als er ten onrechte gerandomiseerd is door bijvvoorbeeld een technische fout zoals &#039;twee keer op de randomisatieknop drukken&#039;.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#kernan1999 Kernan WN, Viscoli CM, Makuch RW, Brass LM, Horwitz RI. Stratified randomization for clinical trials. J Clin Epidemiol. 1999 Jan;52(1):19-26. [http://dx.doi.org/10.1016/S0895-4356(98)00138-3 DOI 10.1016/S0895-4356(98)00138-3]&lt;br /&gt;
&lt;br /&gt;
#altman2005 DG Altman, JM Bland. Treatment allocation by minimization. BMJ. 2005 April 9; 330(7495): 843. [http://dx.doi.org/10.1136/bmj.330.7495.843 DOI 10.1136/bmj.330.7495.843]&lt;br /&gt;
&lt;br /&gt;
#scott2002 Scott NW, McPherson GC, Ramsay CR, Campbell MK. The method of minimization for allocation to clinical trials. a review. Control Clin Trials. 2002 Dec;23(6):662-74. [http://dx.doi.org/10.1016/S0197-2456(02)00242-8 DOI 10.1016/S0197-2456(02)00242-8]&lt;br /&gt;
&lt;br /&gt;
#schulz2002 Schulz KF, Grimes DA. Generation of allocation sequences in randomised trials: chance, not choice. Lancet. 2002 Feb 9;359(9305):515-9. [http://dx.doi.org/10.1016/S0140-6736(02)07683-3 DOI 10.1016/S0140-6736(02)07683-3]&lt;br /&gt;
&lt;br /&gt;
#kang2008 Kang M, Ragan BG, Park JH. Issues in outcomes research: an overview of randomization techniques for clinical trials. J Athl Train. 2008 Apr-Jun;43(2):215-21. [http://dx.doi.org/10.4085/1062-6050-43.2.215 DOI 10.4085/1062-6050-43.2.215.]&lt;br /&gt;
&lt;br /&gt;
#pocock1979 Pocock SJ. Allocation of patients to treatment in clinical trials. Biometrics 1979; 35: 183-197 [http://dx.doi.org/10.2307/2529944 DOI 10.2307/2529944]&lt;br /&gt;
&lt;br /&gt;
#Kahan2012 Kahan BC, Morris TP. Reporting and analysis of trials using stratified randomisation in leading medical journals: review and reanalysis. BMJ 2012; 345 :e5840 [http://dx.doi.org/10.1136/bmj.e5840 DOI 10.1136/bmj.e5840]&lt;br /&gt;
&lt;br /&gt;
#Kahan2011 Kahan, B. C. and Morris, T. P. (2012), Improper analysis of trials randomised using stratified blocks or minimisation. Statist. Med., 31: 328–340 [http://dx.doi.org/10.1002/sim.4431 DOI: 10.1002/sim.4431]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2639</id>
		<title>Randomiseren</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Randomiseren&amp;diff=2639"/>
		<updated>2019-02-21T10:03:17Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: /* Een van onze trialpatienten is uitgevallen, is het verstandig om de randomisatieplek weer vrij te maken en te vergeven aan een nieuwe patient? */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{auteurs|&lt;br /&gt;
|mainauthor= [[user:Jan Binnekade|dr. J.M. Binnekade]]&lt;br /&gt;
|coauthor=  [[user:Nan van Geloven|dr. ir. N. van Geloven]]&lt;br /&gt;
}}&lt;br /&gt;
Randomisatie is een techniek waarmee patiënten, proefpersonen of proefdieren op basis van toeval (loting) worden toegewezen aan een van de groepen  van een experimenteel onderzoek. &lt;br /&gt;
&lt;br /&gt;
== Wat is randomiseren? == &lt;br /&gt;
&lt;br /&gt;
Een randomized controlled trial is de gouden standaard voor het evalueren van interventies in de gezondheidszorg. De idee van het studiedesign is dat proefpersonen op basis van toeval (at random) worden toegewezen aan een van de studiearmen. Het beoogde resultaat is een gelijke verdeling van de eigenschappen van bekende en onbekende prognostische factoren over de studiearmen. Na randomisatie verwacht je dat het effect van het natuurlijk beloop, placebo effecten, confounders en meetfouten in beide groepen tegen elkaar wegvallen. Hierdoor meet je uiteindelijk alleen het “netto” effect van de interventie als verschil tussen de interventie en de controle groep.&lt;br /&gt;
&lt;br /&gt;
==Wanneer randomiseren?==&lt;br /&gt;
&lt;br /&gt;
In experimenteel onderzoek waarbij twee of meer groepen worden vergeleken en waarin de onderzoeker de interventie kan manipuleren en op deze wijze invloed zou kunnen hebben op de toewijzing van de interventie of op de behandeling van de proefpersonen.&lt;br /&gt;
&lt;br /&gt;
==Waarom randomiseren? ==&lt;br /&gt;
Er zijn drie redenen om te randomiseren: &lt;br /&gt;
&lt;br /&gt;
#Idealiter bestaat het verschil tussen de armen van een studie alleen uit het effect van de therapie, de interventie. Door te randomiseren worden alle andere factoren die het therapie effect kunnen beïnvloeden door het toeval verdeeld over de beide groepen. Dit zorgt ervoor dat het effect van bekende en onbekende (prognostische) factoren at random wordt verdeeld over beide studiearmen. &lt;br /&gt;
#Randomisatie helpt bij het blinderen van de interventie voor de behandelaars en de proefpersonen. Het voorkomt dat er patronen van patiëntreacties herkend worden waardoor de toewijzing aan een van de studiearmen bekend wordt aan de behandelaar.  &lt;br /&gt;
#Randomisatie levert groepen op die een willekeurige steekproef zijn van de onderzoekspopulatie waarmee aan een voorwaarde wordt voldaan voor het toepassen van de standaard statistische testen die gebaseerd zijn op kanstheorie.&lt;br /&gt;
&lt;br /&gt;
==Wat doet randomisatie niet? ==&lt;br /&gt;
&lt;br /&gt;
Randomisatie is geen garantie dat prognostische factoren ook werkelijk gelijk verdeeld worden tussen studiegroepen, het toeval kan ongelukkig uitpakken. De kans op een ongelijke verdeling wordt groter naarmate de steekproef kleiner is. Bij een willekeurig grote steekproef zullen prognostische factoren gelijk verdeeld raken.&lt;br /&gt;
&lt;br /&gt;
==Welke methoden zijn ongeschikt voor randomisatie?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende methoden om patiënten aan een studie arm toe te wijzen die niet gelden als random. Het bezwaar tegen deze methoden is de voorspelbaarheid van de toewijzing. Omdat artsen er naar streven om iedere patient optimaal te behandelen kan er bij een voorspelde toewijzing een conflict ontstaan tussen wat de arts wenselijk acht, op dat moment, onder die specifieke omstandigheden en wat de zorg behorende bij de toegewezen studiearm inhoudt. &amp;lt;br/&amp;gt; &lt;br /&gt;
Voorbeelden van toewijzing die worden geassocieerd met een hoge mate van voorspelbaarheid zijn:  volgens een vaste volgorde (patiënt 1 krijgt A, patiënt 2 krijgt B, patiënt 3 krijgt A etc.); op basis van de datum of dag in de week (patiënten geïncludeerd op even dagen krijgen A, patiënten geïncludeerd op oneven dagen krijgen B); op basis van de initialen van de patient (A-K → behandeling A en M-Z → behandeling B). Deze methoden worden sterk afgeraden omdat er makkelijk mee gemanipuleerd kan worden.&lt;br /&gt;
&lt;br /&gt;
==Welke software is beschikbaar voor randomisatie?==&lt;br /&gt;
Je kunt op de pagina over software lezen welke [[Statistische_software#Randomisatie_software | randomisatie software]] beschikbaar is.&lt;br /&gt;
&lt;br /&gt;
==Welke typen randomisatie zijn er?==&lt;br /&gt;
&lt;br /&gt;
Er zijn verschillende manieren om te randomiseren, o.a. simpel-, blok-, gestratificeerde randomisatie en minimisatie. &lt;br /&gt;
&lt;br /&gt;
===Simpele randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij twee studiearmen is deze methode vergelijkbaar met het opgooien van een munt. In de praktijk werkt het met  random getallen. Een behandeling wordt toegewezen volgens een vooraf gestelde regel. Bijvoorbeeld een computer genereert een random getal tussen de 0 en 1. Als dit getal minder of gelijk is aan 0,5 wordt behandeling A toegepast, als het getal meer is dan 0,5 wordt behandeling B toegepast. &lt;br /&gt;
Nadeel van deze methode is dat het niet garandeert dat de steekproef precies gelijk over de studiearmen verdeeld zal worden. Op basis van toeval kan er een lange opeenvolging van eenzijdige toewijzing plaatsvinden, bijvoorbeeld AAAABBA. Hoe kleiner de steekproef hoe groter het risico op een ongelijke verdeling is.&amp;lt;br/&amp;gt; &lt;br /&gt;
Om een ongelijke verdeling tussen de studiearmen te vermijden kun vooraf aan de studie met een computer een lijst met random getallen maken en beoordelen op bruikbaarheid. Als de lijst een ongelijke verdeling heeft van meer dan 10 tussen de studiearmen kun je een nieuwe random getallen lijst genereren.  De praktijk leert dat de simpele methode van randomisatie alleen bij een beoogde steekproef van pakweg meer dan 200 toepasbaar is &amp;lt;cite&amp;gt;[pocock1979]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
===Blok randomisatie===&lt;br /&gt;
&lt;br /&gt;
Het nadeel van simpele randomisatie is de kans op een ongelijke verdeling van het aantal patiënten over de studiearmen . Door te randomiseren in blokken kun je dit vermijden. Een blok krijgt een bepaalde grootte, bijvoorbeeld 4, 6 of 8 waarin beide studiearmen evenredig verdeeld zijn (voorbeeld ABAB of BAAB etc.). Na ieder blok heb je dus een gelijke verdeling over beide studiearmen. De blokgrootte is een veelvoud van het aantal studiearmen in de studie. &lt;br /&gt;
&lt;br /&gt;
Als blokken niet helemaal gebruikt worden kan er alsnog een ongelijke verdeling tussen studiearmen ontstaan. Bijvoorbeeld, als een studie met een blokgrootte van 8 halverwege stopt is de maximale ongelijkheid 4 patiënten.  &lt;br /&gt;
&lt;br /&gt;
Kritiek op het gebruik van kleine blokken is dat de randomisatie voor een deel voorspelbaar kan worden. Daarom worden er het liefst grote en blokken van random wisselende grootte gebruikt.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van randomisatie met blokgrootte van 4 ( therapie = A, controle = B)  R → ABAB  BABA   AABB  ABBA  ABBA  ABAB  BABA  AABB  ABBA  etc. &amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===Gestratificeerde randomisatie===&lt;br /&gt;
&lt;br /&gt;
Bij simpele of blok randomisatie is het niet gegarandeerd dat bekende prognostische factoren gelijk verdeeld worden over de studiearmen. De kans dat prognostische factoren ongelijk verdeeld worden is bij een kleine steekproef groter dan bij een grote steekproef. Een methode om een ongelijke verdeling van bekende prognostische factoren te voorkomen is gestratificeerde randomisatie. Stratificatie betekent dat voor iedere combinatie van prognostische factoren (voor ieder stratum) een aparte randomisatielijst wordt gebruikt. Gestratificeerde randomisatie wordt vaak gebruikt in combinatie met het blok design om de interventie evenredig over beide studiearmen te verdelen.&lt;br /&gt;
&lt;br /&gt;
Voorbeeld van een gestratificeerde blok randomisatie waarin gestratificeerd wordt voor geslacht en leeftijdsgroep ( therapie = A, controle = B)&lt;br /&gt;
&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|&lt;br /&gt;
|width=&amp;quot;160&amp;quot; colspan=&amp;quot;2&amp;quot;|Patienteigenschappen&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|Randomisatievolgorde&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst1&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABAB AABB ABBA BABA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst2&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|man&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|BAAB BBAA ABAB AABB&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst3&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd-&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|AABB ABBA BAAB BBAA&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;70&amp;quot;|Lijst4&lt;br /&gt;
|width=&amp;quot;50&amp;quot;|vrouw&lt;br /&gt;
|width=&amp;quot;110&amp;quot;|mediane leeftijd+&lt;br /&gt;
|width=&amp;quot;200&amp;quot;|ABBA BABA ABAB AABB&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
Op basis van de eigenschappen van een patient wordt de juiste lijst gekozen,  een man die ouder is dan de  mediane leeftijd wordt gerandomiseerd vanuit lijst 2. &lt;br /&gt;
Het stratificeren wordt belangrijker naarmate de steekproef kleiner is omdat het risico op een onevenredige verdeling van de prognostische factoren dan groter is. Echter, het aantal randomisatielijsten dat je moet hanteren groeit snel naarmate je met meer prognostische factoren rekening wil houden. Voor je het weet heb je evenveel strata als patiënten in je steekproef. Bij deze methode is evenzogoed een onevenredige verdeling van patiënten aantallen tussen de studiearmen mogelijk (zie blok randomisatie). Hierbij speelt de blokgrootte en het aantal strata een rol. Als in het bovenstaande voorbeeld toevalligerwijs in alle strata de laatste blokken AABB zouden zijn en de studie stopt nadat alleen de AA&#039;s zijn gebruikt is de maximale (erg theoretische) scheefheid 8 patiënten. &lt;br /&gt;
Als je met meerdere prognostische factoren rekening wilt houden kun je meerdere factoren combineren in een index waarna je de index gebruikt om de strata te definiëren.&lt;br /&gt;
Let op: wanneer er gestratificeerd gerandomiseerd wordt, dan moet ook de analyse corrigeren voor de stratificatiefactoren. Zie bijvoorbeeld de artikelen van Kahan en Morris &amp;lt;cite&amp;gt;[Kahan2011],[Kahan2012]&amp;lt;/cite&amp;gt; en de [http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2013/06/WC500144946.pdf EMA guideline on adjustment for baseline covariates (draft)]. Een toegankelijke uitleg hierover vind je in deze [http://thestatsgeek.com/2016/04/05/matching-analysis-to-design-stratified-randomization-in-trials/ post van Jonathan Bartlett].&lt;br /&gt;
&lt;br /&gt;
===Minimisatie===&lt;br /&gt;
&lt;br /&gt;
Met minimisatie wordt ook gestreefd naar een gelijke verdeling van patiënten en hun prognostische factoren onder de studiearmen. Het verschil met gestratificeerde blok randomisatie is dat er bij minimisatie geen strata (subgroepen) vooraf worden gedefinieerd van waaruit gerandomiseerd wordt. De minimisatie methode beoordeelt alvorens een nieuwe patient wordt gerandomiseerd hoe zijn of haar verdeling van de prognostische factoren is bij de tot dan toe gerandomiseerde patiënten. Als deze verdeling in balans is wordt de patient gewoon (kop of munt) gerandomiseerd. Als er een onbalans bestaat zal de trekking bewust worden beïnvloed ten gunste van de groep die de onbalans doet verminderen.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Voorbeeld van een randomisatie met de minimisatie methode. &#039;&#039;&amp;lt;br/&amp;gt;&lt;br /&gt;
{|border=&amp;quot;1&amp;quot; style=&amp;quot;text-align:center&amp;quot; cellpadding=&amp;quot;3&amp;quot; cellspacing=&amp;quot;0&amp;quot;&lt;br /&gt;
|width=&amp;quot;200&amp;quot; colspan=&amp;quot;3&amp;quot;| Overzicht eerder gerandomiseerde patienten &lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Prognostische factor&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Interventie&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|Controle&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Mannen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Vrouwen&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 21-30&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 31-40&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Leeftijd 41-50&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|2&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|1&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico hoog&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|5&lt;br /&gt;
|-&lt;br /&gt;
|width=&amp;quot;120&amp;quot;|Risico laag&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|4&lt;br /&gt;
|width=&amp;quot;40&amp;quot;|3&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Stel de eerst volgende patient is een man, tussen de 31 en 40 jaar oud met een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de interventie groep zijn tot nu toe 3 mannen gerandomiseerd, hebben 2 patienten een leeftijd tussen de 31-40 en hebben 4 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
In de controle groep zijn 5 mannen gerandomiseerd, hebben 3 patienten een leeftijd tussen de 31-40 en hebben 5 patienten een hoog risico.&amp;lt;br/&amp;gt;&lt;br /&gt;
De onbalans die nu zou ontstaan bij randomizatie naar de interventiearm is voor mannen 5 - 4 = 1, voor de leeftijdscategorie 3 - 3 = 0 en voor hoog risico 5 - 5 = 0, totaal 1 (1+0+0). Bij randomizatie naar de controlearm ontstaat er een onbalans van 6 - 3 = 3 (mannen), 4 - 2 = 2 (leeftijd 31-40) en 6 - 4 = 2 (hoog risico), een totale onbalans van 7 (3+2+2). Nu zijn er verschillende opties om de patiënt toe te wijzen. Bij een strikte minimisatie wordt de patiënt toegewezen aan de interventie groep omdat 1 &amp;lt; 7. Het nadeel van deze methode is de voorspelbaarheid. Een andere optie is het aanpassen van de kansverhouding op toewijzing, bijvoorbeeld 80:20. De kansverhouding kan je laten bepalen door de mate van onbalans (gebruikelijk). Als groepen in balans zijn vindt de toewijzing plaats op basis van een fifty-fifty kans.&lt;br /&gt;
&lt;br /&gt;
==Vragen over randomisatie==&lt;br /&gt;
&lt;br /&gt;
=== Kan ik op volgorde van aanmelding randomiseren ? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Wij gaan een dubbelblinde crossover studie doen. Een groep volwassen patiënten gaat gedurende 2 perioden van 4 weken een extra supplement krijgen wat we ene periode een mogelijk werkzame stof en de andere periode placebo bevat. Het doel is 20 patiënten te includeren. Graag willen we uw advies over hoe te randomiseren. Er zal een groep 1 zijn, die eerst het blauwe supplement en in de tweede periode het groene supplement krijgt, en er is een groep 2 die eerst het groene supplement en in de tweede periode het blauwe supplement krijgt. Mijn voorstel zou zijn om te randomiseren in volgorde van aanmelding waarbij de oneven nummers (1e, 3e, 5e aanmelding etc) in groep 1 gaan en de even nummers (2e 4e 6e etc) aanmelding in groep 2. Is dit een juiste methode of zijn er valkuilen?&lt;br /&gt;
&lt;br /&gt;
Om en om randomiseren is gevaarlijk omdat dan makkelijk de blindering doorbroken kan worden (als je eenmaal weet dat nr 5 groen heeft gekregen weet je alle opeenvolgende toewijzingen ook gelijk!). Er worden in [[meta-analyse|meta-analyses]] zelfs studies geexludeerd die gerandomiseerd hebben op bijvoorbeeld dag van de week. Het handigst om de te randomiseren mbv een randomisatieprogramma. Degene die het middel moet gaan geven, mag niet weten of dit groen of blauw is. Bij de tweede (cross-over) periode moet de &#039;randomisator&#039; alle groene op blauw overzetten en vice versa. Wederom blijft de behandelaar blind.&lt;br /&gt;
&lt;br /&gt;
=== Kan het bij gestratificeerde randomisatie voorkomen dat bepaalde patienten niet meer geincludeerd kunnen worden? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Ik wil binnenkort starten met een RCT waarin ik 100 patiënten in de interventie wil hebben en 100 in de controle groep. Stratificatie zal zijn voor geslacht (man/vrouw), leeftijd(50-70/70-90) en uitvoerend chirurg. Mijn vraag is nu: kan het zijn dat (vooral later in het randomisatieproces) er patiënten NIET worden geincludeerd omdat een randomisatie stratum al vol is en de patiënt niet voldoet aan de eisen die gesteld zijn door de stratificatieprocedure (bv. niet de goede leeftijd, geslacht, arts zit al vol etc etc.) Ik vraag dit, daar de patiënten die ik wil includeren moeilijk te vinden zijn en elke patiënt eigenlijk telt.&lt;br /&gt;
&lt;br /&gt;
Doorgaans wordt er bij gebruik van gestratificeerde randomisatie geen grens gezet op bijv het &#039;absolute&#039; aantal mannen of vrouwen dat geincludeerd wordt. Stel dat er maar 10% vrouwen instroomt, dan tracht de stratificatie in beide behandelgroepen die 10% vrouwen te krijgen. Het is niet zo dat er op een gegeven moment &#039;geen vrouw meer geincludeerd mag worden&#039; oid. Waar wel rekening mee moet worden gehouden is dat bij het gebruik van (meerdere) stratificatiefactoren het lastiger is om die balans te verkrijgen en het ook lastiger kan worden om de totale balans (100 vs 100) te verzekeren. Het kan dan bijv ook 95-105 worden, of 5% vrouwen in de ene arm en 15% in de andere. Er moet van te voren gekeken worden hoeveel stratificatiefactoren meekunnen om een redelijke balans te kunnen verzekeren. Maar het is dus niet zo dat er patienten &#039;niet mee kunnen doen&#039;.&lt;br /&gt;
&lt;br /&gt;
=== Een van onze trialpatienten is uitgevallen, is het verstandig om de randomisatieplek weer vrij te maken en te vergeven aan een nieuwe patient? ===&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Op dit moment zijn er een aantal patienten gerandomiseerd, maar nu valt er middenin de lijst een patient uit. Deze patient is onterecht geincludeerd. Wij zouden deze plek het liefst opnieuw vergeven aan een nieuwe patient. Mag dat of zijn er methodologische bezwaren? In principe is de randomisatielijst overigens lang genoeg om de plek leeg te laten. &lt;br /&gt;
&lt;br /&gt;
De aanpak bij &#039;uitval&#039; van gerandomiseerde patienten hangt van een aantal zaken af:&lt;br /&gt;
&lt;br /&gt;
1. intention to treat principe:&lt;br /&gt;
Volgens het &#039;intention to treat&#039; principe zou iedereen die ooit in een studie geincludeerd is mee moeten blijven doen tot het einde volgens de gerandomiseerde allocatie. Ook als er protocol violations zijn zoals het switchen van behandeling, niet houden aan voorgeschreven behandeling of het achteraf niet volledig blijken te voldoen aan inclusiecriteria. Idee hierachter is dat wanneer de behandeling aangeraden gaat worden (bijvoorbeeld in richtlijnen) voor patienten met bepaalde criteria er soortgelijke &#039;inschattingsfouten&#039;/ protocol violations kunnen optreden en dat een vergelijking van de effectiviteit binnen een studiepopulaties inclusief deze violators de beste inschatting van het effect in de werkelijkheid / praktijk geeft. Indien jullie in de trial het intention to treat principe willen aanhouden, dan zou deze patient niet geexcludeerd moeten worden.&lt;br /&gt;
 &lt;br /&gt;
2. sample size berekening:&lt;br /&gt;
De [[poweranalyse|sample size berekening]] kan op verschillende wijze rekening houden met uitval. Vaak is er bij de sample size berekening rekening gehouden met een bepaalde mate van uitval. Bijvoorbeeld er zijn 100 patienten nodig in de analyze, er worden er 110 geincludeerd omdat enkelen waarschijnlijk zullen uitvallen/niet mee kunnen in de analyse. In dit geval zou je 110 patienten randomiseren (randomisatielijst van 110). Er zullen uiteindelijk 10 hiervan niet mee doen in de analyse, dat is ingecalculeerd en een uitgevallen plek hoeft dus niet opgevuld te worden. Heel soms is de sample size berekening zo opgesteld dat er bijvoorbeeld 10 mannen en 10 vrouwen nodig zijn die het hele protocol strict moeten hebben gevolgd (powerberekening gebaseerd op de per-protocol analyse). Dit is vaak het geval in heel vroeg fase, experimentele studies. In zo&#039;n geval kan er bij uitval een plek worden opgevuld door een nieuwe patient. In sommige situatie is het raadzaam om daarbij de vrijgevallen randomisatieplaatsen weer op te vullen (zie punt 3 hieronder).&lt;br /&gt;
 &lt;br /&gt;
3. balans in randomisatielijst:&lt;br /&gt;
Wanneer er een kleine sample size is en daarbij wellciht ook nog een stratificatie in de randomisatie (bijvoorbeeld 10 mannen in 1 stratum en 10 vrouwen in ander stratum) dan kan uitval van een van de patienten en toevoegen van een nieuwe patient met nieuwe randomisatieuitslag een ongewenst scheve allocatie opleveren (bijvvoorbeeld mannen 4:6 ipv gewenste 5:5). In dat soort gevallen kan er voor gekozen worden een vrijgevallen randomisatieplek op te laten vullen door de nieuwe &#039;vervangende&#039; patient. Nadeel hiervan is wel dat (bij niet geblindeerde studies) de randomisatieuitslag van de vervanger al bekend is voor inclusie. Wanneer er een grotere sample size is, dan is iha een kleine disbalans in allocatie niet storend. Bijvvoorbeeld een trial met 47:53 allocatie is prima en heeft evenveel power als een 50:50 allocatie. Ervan uitgaande dat uitval van patienten niet slechts in 1 van de twee armen voorkomt (dat zou op hele andere problemen duiden) is er in het algemeen geen probleem met allocatiebalans te verwachten en wordt aangeraden om gewoon een volgende positie van de randomisatielijst te gebruiken na uitval van een patient.&lt;br /&gt;
&lt;br /&gt;
Samenvattend is het in het algemeen af te raden om randomisatieposites &#039;vrij te maken en opnieuw te vullen&#039;. Uitzondering hierop zijn vroeg fase experimentele studies met sterke wens voor gebalanceerde allocaties. Ook is een uitzondering als er ten onrechte gerandomiseerd is door bijvvoorbeeld een technische fout zoals &#039;twee keer op de randomisatieknop drukken&#039;.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
#kernan1999 Kernan WN, Viscoli CM, Makuch RW, Brass LM, Horwitz RI. Stratified randomization for clinical trials. J Clin Epidemiol. 1999 Jan;52(1):19-26. [http://dx.doi.org/10.1016/S0895-4356(98)00138-3 DOI 10.1016/S0895-4356(98)00138-3]&lt;br /&gt;
&lt;br /&gt;
#altman2005 DG Altman, JM Bland. Treatment allocation by minimization. BMJ. 2005 April 9; 330(7495): 843. [http://dx.doi.org/10.1136/bmj.330.7495.843 DOI 10.1136/bmj.330.7495.843]&lt;br /&gt;
&lt;br /&gt;
#scott2002 Scott NW, McPherson GC, Ramsay CR, Campbell MK. The method of minimization for allocation to clinical trials. a review. Control Clin Trials. 2002 Dec;23(6):662-74. [http://dx.doi.org/10.1016/S0197-2456(02)00242-8 DOI 10.1016/S0197-2456(02)00242-8]&lt;br /&gt;
&lt;br /&gt;
#schulz2002 Schulz KF, Grimes DA. Generation of allocation sequences in randomised trials: chance, not choice. Lancet. 2002 Feb 9;359(9305):515-9. [http://dx.doi.org/10.1016/S0140-6736(02)07683-3 DOI 10.1016/S0140-6736(02)07683-3]&lt;br /&gt;
&lt;br /&gt;
#kang2008 Kang M, Ragan BG, Park JH. Issues in outcomes research: an overview of randomization techniques for clinical trials. J Athl Train. 2008 Apr-Jun;43(2):215-21. [http://dx.doi.org/10.4085/1062-6050-43.2.215 DOI 10.4085/1062-6050-43.2.215.]&lt;br /&gt;
&lt;br /&gt;
#pocock1979 Pocock SJ. Allocation of patients to treatment in clinical trials. Biometrics 1979; 35: 183-197 [http://dx.doi.org/10.2307/2529944 DOI 10.2307/2529944]&lt;br /&gt;
&lt;br /&gt;
#Kahan2012 Kahan BC, Morris TP. Reporting and analysis of trials using stratified randomisation in leading medical journals: review and reanalysis. BMJ 2012; 345 :e5840 [http://dx.doi.org/10.1136/bmj.e5840 DOI 10.1136/bmj.e5840]&lt;br /&gt;
&lt;br /&gt;
#Kahan2011 Kahan, B. C. and Morris, T. P. (2012), Improper analysis of trials randomised using stratified blocks or minimisation. Statist. Med., 31: 328–340 [http://dx.doi.org/10.1002/sim.4431 DOI: 10.1002/sim.4431]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
	<entry>
		<id>https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2638</id>
		<title>Systematische reviews</title>
		<link rel="alternate" type="text/html" href="https://wikibiostatistiek.amsterdamumc.org/index.php?title=Systematische_reviews&amp;diff=2638"/>
		<updated>2019-02-21T09:57:55Z</updated>

		<summary type="html">&lt;p&gt;Rebecca Holman: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Een systematisch review is een samenvatting van de literatuur over een specifiek onderwerp waarin op een transparante en gestructureerde wijze data verzameld en beschreven wordt om vertekening te voorkomen. Een systematische review kan kwalitatieve en/of kwantitatieve onderzoeken beschrijven.&lt;br /&gt;
&lt;br /&gt;
== Systematische reviews en meta-analyses ==&lt;br /&gt;
Er zijn verschillende fases bij het uitvoeren van een systematische review: &lt;br /&gt;
# het definiëren van de onderzoeksvraag&lt;br /&gt;
# het gestructureerd zoeken in elektronische literatuur-databases en het hanteren van de gekozen in- en exclusiecriteria om de benodigde literatuur te selecteren&lt;br /&gt;
# het op methodologische kwaliteit beoordelen van de publicaties, &lt;br /&gt;
# de extractie van de benodigde gegevens uit de gekozen artikelen, &lt;br /&gt;
# het gestructureerd samenvatten van de uitkomsten van de studies en &lt;br /&gt;
# het rapporteren van de resultaten van de systematische review. &lt;br /&gt;
&lt;br /&gt;
Bij sommige systematische reviews wordt ook een [[Meta-analyse | meta-analyse]] uitgevoerd om de resultaten uit verschillende, maar methodologisch vergelijkbare studies statistisch samen te vatten &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Cochrane is een internationale organisatie die zorgverleners, beleidsmakers en patiënten helpt bij het nemen van beslissingen over gezondheidszorg. Deze organisatie doet dit door informatie over de effectiviteit van de gezondheidszorg in de vorm van systematische reviews te presenteren. Cochrane Reviews en de protocollen hiervan worden in The Cochrane Library gepubliceerd. &lt;br /&gt;
&lt;br /&gt;
== Een onderzoeksprotocol schrijven en publiceren of archiveren ==&lt;br /&gt;
Voordat onderzoekers een systematische review uitvoeren, is het aan te raden om een onderzoeksprotocol op te stellen. Zo leggen onderzoekers de onderzoeksdoelen, vraagstelling en methoden helder vast voordat zij het onderzoek uitvoeren. Bij het opstellen van het onderzoeksprotocol gebruikt men het liefst de Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols (PRISMA-P) checklijst om te controleren of alle benodigde informatie in het document is opgenomen &amp;lt;cite&amp;gt;[moher2015]&amp;lt;/cite&amp;gt;. Het is aan te raden om al bij het schrijven van het protocol contact op te nemen met een gespecialiseerd methodoloog, klinisch informatie specialist en statisticus. Het is in deze fase ook aan te raden om afspraken te maken over wie de auteurs worden en in welke volgorde zij zullen staan op de uiteindelijke publicatie.&lt;br /&gt;
Zodra het protocol is opgesteld, is het aan te raden om het protocol te publiceren of openbaar te archiveren. Onderzoekers kunnen een protocol aanmelden bij PROSPERO (International prospective register of systematic reviews) om het openbaar te archiveren. Door het protocol te publiceren of openbaar te archiveren, laat men in een latere fase aan peer-reviewers van tijdschriften zien dat de gekozen onderzoeksmethoden al vóór het uitvoeren van de review zijn vastgesteld en dat er niet zomaar is “gevist” naar een aantrekkelijk resultaat met een leuke p-waarde. Ook laat men daarmee aan andere onderzoekers zien waarmee men momenteel bezig is, hetgeen de kans verkleint op het verschijnen van systematische reviews die zeer vergelijkbaar zijn. &lt;br /&gt;
&lt;br /&gt;
== Het definiëren van de onderzoeksvraag ==&lt;br /&gt;
Bij een systematische review is het belangrijk om de vraagstelling eenduidig op te schrijven. Dit kan door de vraagstelling op basis van PICOS (Population, Interventions, Comparators, Outcomes, Study designs) te definiëren. Sommige methodologen raden oaan om hierin ook het onderdeel ‘Timeframe’ mee te nemen. Dit onderdeel geeft aan binnen welke tijdsperiode de behandeling, blootstelling of uitkomst heeft plaatsgevonden. Het is van belang om bij elk onderdeel van PICOS(T) voldoende specifiek te zijn. Een op PICOS(T) gebaseerde gedetailleerde uitwerking van de vraagstelling geeft concrete richting aan de uitvoer van het systematisch review, zoals de zoekstrategie, in- en exclusiecriteria en data-extractie. &lt;br /&gt;
&lt;br /&gt;
Als een onderzoeker een vraagstelling heeft opgesteld, is het aan te raden om in de literatuur te controleren of iemand al eerder een vergelijkbare systematische review heeft gepubliceerd of een vergelijkbaar protocol in PROPERSO heeft gearchiveerd. Als er een vergelijkbare systematische review bestaat of in voorbereiding is, moet de onderzoeker zich kritisch afvragen of zijn/haar voorgenomen systematische review een betekenisvolle toevoeging geeft aan de wetenschappelijke literatuur. &lt;br /&gt;
&lt;br /&gt;
== Het zoeken naar literatuur en het hanteren van de gekozen in- en exclusiecriteria ==&lt;br /&gt;
Na het definiëren van de onderzoeksvraag worden in- en exclusie criteria geformuleerd. Deze criteria dienen voor het opzetten van de zoekactie en het selecteren van de studies die een antwoord geven op de onderzoeksvraag. Aan de hand van de in- en exclusie criteria wordt gestructureerd en sensitief naar literatuur gezocht. Veel gebruikte bibliografische databases van wetenschappelijke publicaties zijn PubMed en Embase. Het gebruik van meerdere databases en bronnen, van zowel gepubliceerde studies als grijze literatuur, wordt aangeraden om het risico op vertekening in de dataset te voorkomen. Dit resulteert echter vaak in een groot aantal studies. &lt;br /&gt;
&lt;br /&gt;
De studies die door middel van de zoekactie gevonden zijn worden naast de in- en exclusie criteria gelegd om zo de studies te selecteren die de review vraag beantwoorden. Het is aan te raden dit selectieproces door tenminste twee leden van de onderzoeksgroep onafhankelijk van elkaar uit te voeren. &lt;br /&gt;
&lt;br /&gt;
Een klinisch informatie specialist, vaak verbonden aan de medische bibliotheek, kan ondersteuning bieden bij het op de juiste wijze omzetten van de onderzoeksvraag naar een zoekopdracht &amp;lt;cite&amp;gt;[mcgowan2016]&amp;lt;/cite&amp;gt;. Hij of zij kan ook adviseren over hoe de in- en exclusie van studies op juiste en efficiënte wijze in een zoekstrategie kunnen worden vertaald.&lt;br /&gt;
&lt;br /&gt;
== Het beoordelen van de methodologische kwaliteit ==&lt;br /&gt;
Als de onderzoeker de studies heeft geselecteerd om in de review mee te nemen, wordt een geschikte vragenlijst gebruikt om de methodologische kwaliteit hiervan te beoordelen. De juiste keuze van een vragenlijst hangt af van het onderzoeksdesign van de geïncludeerde studies. Zo zijn bijvoorbeeld vragenlijsten ontworpen voor gerandomiseerde en niet-gerandomiseerde interventie studies &amp;lt;cite&amp;gt;[higgins2011]&amp;lt;/cite&amp;gt;, diagnostische studies &amp;lt;cite&amp;gt;[whiting2011]&amp;lt;/cite&amp;gt;, case-studies &amp;lt;cite&amp;gt;[murad2018]&amp;lt;/cite&amp;gt;, en vragenlijsten voor het beantwoorden van etiologische en prognostisch onderzoeksvragen en predictiemodellen. Een gespecialiseerd methodoloog kan adviseren bij het kiezen van de juiste vragenlijst.&lt;br /&gt;
&lt;br /&gt;
== De extractie van de data en het omrekenen van de uitkomstparameters ==&lt;br /&gt;
In deze fase worden de gerapporteerde onderzoeksgegevens uit de geïncludeerde studies geëxtraheerd en in een database opgeslagen. In het AMC kan dit bijvoorbeeld in Castor. Het is af te raden om de data in Excel op te slaan, te bewerken of te analyseren omdat het in dit pakket niet mogelijk is te werken met syntaxen, hetgeen een statistische voorwaarde is van goed onderzoek doen. Het is aan te raden dat twee onderzoekers onafhankelijk van elkaar de gegevens uit de studies extraheren (double data entry). Daarna worden de twee resulterende databestanden onderling vergeleken. Als er verschillen zijn, dan worden de gegevens nogmaals met de brondocumenten vergeleken en worden de fouten gecorrigeerd. &lt;br /&gt;
&lt;br /&gt;
Tijdens het extractieproces zal soms ook besloten moeten worden welke getallen er precies uit een artikel overgenomen moeten worden. Het kan bijvoorbeeld zijn dat een getal in een tabel afwijkt van het getal in de tekst. Het is aan te raden om bij dit soort beslissingen te overleggen met de medeauteurs en te noteren wáárom voor een bepaalde waarde is gekozen. &lt;br /&gt;
Het is mogelijk dat bij het extraheren van de onderzoeksgegevens niet alle gewenste parameters in de artikelen worden gevonden. Soms is het mogelijk om deze parameters op basis van andere informatie in het artikel te berekenen. Een voorbeeld hiervan is als de &#039;[[Standaardfout/standard_error|standard error]]&#039; wordt gerapporteerd, maar de onderzoeker de standaarddeviatie nodig heeft. Afhankelijk van de beschikbare informatie kan een statisticus helpen bij het omrekenen. Maar soms is er simpelweg onvoldoende informatie beschikbaar. Dan kan men overwegen om de corresponding author te mailen om te vragen of de ontbrekende informatie elders te vinden is, dan wel die informatie op te sturen. &lt;br /&gt;
&lt;br /&gt;
== Presenteren en interpreteren van resultaten ==&lt;br /&gt;
De resultaten van de systematische review worden gepresenteerd in de vorm van tabellen en figuren, zoals een PRISMA flowchart voor het weergeven van de resultaten van de zoekstrategie. Een ‘Summary of Findings’ - tabel geeft een kort en krachtig overzicht van de hoeveelheid ‘evidence’, de kwaliteit van dat bewijs en de grootte van de effecten. Voor het beoordelen van de bewijskracht is GRADE de aangewezen methode. &lt;br /&gt;
&lt;br /&gt;
Een [[Meta-analyse | meta-analyse]] is een statistische techniek waarbij de resultaten van verschillende studies gecombineerd worden tot een &#039;overall&#039; resultaat &amp;lt;cite&amp;gt;[field2010]&amp;lt;/cite&amp;gt;. Een belangrijke voorwaarde voor het uitvoeren van een meta-analyse is dat de studies voldoende op elkaar lijken.&lt;br /&gt;
&lt;br /&gt;
== Resultaten rapporteren ==&lt;br /&gt;
Bij het rapporteren of publiceren van de systematische review is het belangrijk om alle benodigde informatie hierin op te nemen. De PRISMA-richtlijnen geven hierbij een goede leidraad &amp;lt;cite&amp;gt;[moher2009]&amp;lt;/cite&amp;gt;. Soms is het voldoende om alleen de PRISMA-richtlijnen te gebruiken. Maar er zijn ook uitbreidingen hiervan gepubliceerd. Deze uitbreidingen van de PRISMA-richtlijnen geven specifieke aanwijzingen over welke informatie in bepaalde typen systematische reviews opgenomen dient te worden. Zo zijn er richtlijnen voor reviews over diagnostische studies &amp;lt;cite&amp;gt;[mcinnes2018]&amp;lt;/cite&amp;gt;, bijwerkingen &amp;lt;cite&amp;gt;[zorzela2016]&amp;lt;/cite&amp;gt; en reviews die gebruik maken van een netwerk meta-analyse &amp;lt;cite&amp;gt;[hutton2015]&amp;lt;/cite&amp;gt; of data op het niveau van de individuele patiënt &amp;lt;cite&amp;gt;[stewart2015]&amp;lt;/cite&amp;gt;. Voor reviews van kwantitatieve onderzoeken is de ENTREQ richtlijn opgesteld &amp;lt;cite&amp;gt;[tong2012]&amp;lt;/cite&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Tot slot is het belangrijk om in de rapportage of publicatie duidelijk en met de betreffende referentie te vermelden dat vóór het uitvoeren van de systematische review een protocol geschreven.&lt;br /&gt;
&lt;br /&gt;
== Referenties ==&lt;br /&gt;
&amp;lt;biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
#field2010 Field AP, Gillett R. How to do a meta-analysis. Br J Math Stat Psychol. 2010 Nov;63(Pt 3):665-94. [http://dx.doi.org/10.1348/000711010X502733 DOI 10.1348/000711010X502733] &lt;br /&gt;
&lt;br /&gt;
#moher2015 Moher D, Shamseer L, Clarke M, Ghersi D, Liberati A, Petticrew M, Shekelle P, Stewart LA; PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Syst Rev. 2015 Jan 1;4:1. [http://dx.doi.org/10.1186/2046-4053-4-1 DOI 10.1186/2046-4053-4-1].&lt;br /&gt;
&lt;br /&gt;
#mcgowan2016 McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol. 2016 Jul;75:40-6.[http://dx.doi.org/10.1016/j.jclinepi.2016.01.021 DOI 10.1016/j.jclinepi.2016.01.021]. &lt;br /&gt;
&lt;br /&gt;
#higgins2011 Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, Savovic J, Schulz KF, Weeks L, Sterne JA; Cochrane Bias Methods Group; Cochrane Statistical Methods Group. The Cochrane Collaboration&#039;s tool for assessing risk of bias in randomised trials. BMJ. 2011 Oct 18;343:d5928. [http://dx.doi.org/10.1136/bmj.d5928 DOI 10.1136/bmj.d5928].&lt;br /&gt;
&lt;br /&gt;
#whiting2011 Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, Leeflang MM, Sterne JA, Bossuyt PM; QUADAS-2 Group. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011 Oct 18;155(8):529-36. [http://dx.doi.org/10.7326/0003-4819-155-8-201110180-00009 DOI 10.7326/0003-4819-155-8-201110180-00009].&lt;br /&gt;
&lt;br /&gt;
#murad2018 Murad MH, Sultan S, Haffar S, Bazerbachi F. Methodological quality and synthesis of case series and case reports. BMJ Evid Based Med. 2018 Apr;23(2):60-63. [http://dx.doi.org/10.1136/bmjebm-2017-110853 DOI 10.1136/bmjebm-2017-110853]. &lt;br /&gt;
&lt;br /&gt;
#moher2009 Moher D, Liberati A, Tetzlaff J, Altman DG; PRISMA Group. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. J Clin Epidemiol. 2009 Oct;62(10):1006-12. [http://dx.doi.org/10.1016/j.jclinepi.2009.06.005 DOI 10.1016/j.jclinepi.2009.06.005].&lt;br /&gt;
&lt;br /&gt;
#mcinnes2018 McInnes MDF, Moher D, Thombs BD, McGrath TA, Bossuyt PM; the PRISMA-DTA Group, Clifford T, Cohen JF, Deeks JJ, Gatsonis C, Hooft L, Hunt HA, Hyde CJ, Korevaar DA, Leeflang MMG, Macaskill P, Reitsma JB, Rodin R, Rutjes AWS, Salameh JP, Stevens A, Takwoingi Y, Tonelli M, Weeks L, Whiting P, Willis BH. Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement. JAMA. 2018 Jan 23;319(4):388-396. [http://dx.doi.org/10.1001/jama.2017.19163 DOI 10.1001/jama.2017.19163].&lt;br /&gt;
&lt;br /&gt;
#zorzela2016 Zorzela L, Loke YK, Ioannidis JP, Golder S, Santaguida P, Altman DG, Moher D, Vohra S; PRISMAHarms Group. PRISMA harms checklist: improving harms reporting in systematic reviews. BMJ. 2016 Feb 1;352:i157. [http://dx.doi.org/10.1136/bmj.i157 DOI 10.1136/bmj.i157].&lt;br /&gt;
&lt;br /&gt;
#hutton2015 Hutton B, Salanti G, Caldwell DM, Chaimani A, Schmid CH, Cameron C, Ioannidis JP, Straus S, Thorlund K, Jansen JP, Mulrow C, Catalá-López F, Gøtzsche PC, Dickersin K, Boutron I, Altman DG, Moher D. The PRISMA extension statement for reporting of systematic reviews incorporating network meta-analyses of health care interventions: checklist and explanations. Ann Intern Med. 2015 Jun 2;162(11):777-84. [http://dx.doi.org/10.7326/M14-2385 DOI 10.7326/M14-2385].&lt;br /&gt;
&lt;br /&gt;
#stewart2015 Stewart LA, Clarke M, Rovers M, Riley RD, Simmonds M, Stewart G, Tierney JF; PRISMA-IPD Development Group. Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement. JAMA. 2015 Apr 28;313(16):1657-65. [http://dx.doi.org/10.1001/jama.2015.3656 DOI 10.1001/jama.2015.3656].&lt;br /&gt;
&lt;br /&gt;
#tong2012 Tong A, Flemming K, McInnes E, Oliver S, Craig J. Enhancing transparency in reporting the synthesis of qualitative research: ENTREQ. BMC Med Res Methodol. 2012 Nov 27;12:181. [http://dx.doi.org/10.1186/1471-2288-12-181 DOI 10.1186/1471-2288-12-181].&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/biblio&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Informatie op andere websites ==&lt;br /&gt;
* [https://netherlands.cochrane.org/ Cochrane Netherlands] is één van de centra die wereldwijd het werk van Cochrane vertegenwoordigt.&lt;br /&gt;
* [http://handbook-5-1.cochrane.org/ The Cochrane Handbook for Systematic Reviews].&lt;br /&gt;
* Cochrane Reviews en de protocollen hiervan worden in [https://www.cochranelibrary.com/ The Cochrane Library] gepubliceerd.&lt;br /&gt;
* Onderzoekers kunnen een protocol aanmelden bij [https://www.crd.york.ac.uk/prospero/ PROSPERO] international prospective register of systematic reviews om het openbaar te archiveren.&lt;br /&gt;
* The [http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp Newcastle-Ottawa Scale] (NOS) for assessing the quality of nonrandomised studies in meta-analyses.&lt;br /&gt;
* [https://methods.cochrane.org/prognosis/our-publications Cochrane Methods Prognosis Review Group Tools].&lt;br /&gt;
* [https://methods.cochrane.org/qi/welcome Cochrane Qualitative and Implementation Methods Group] &lt;br /&gt;
* [https://www.equator-network.org/ The Equator Network] heeft een bibliotheek van richtlijnen over welke informatie in een wetenschappelijke artikel hoort te zijn.&lt;br /&gt;
* [http://www.gradeworkinggroup.org/ The GRADE working group].&lt;br /&gt;
&lt;br /&gt;
{{onderschrift}}&lt;/div&gt;</summary>
		<author><name>Rebecca Holman</name></author>
	</entry>
</feed>