T-toets: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
 
(41 intermediate revisions by 4 users not shown)
Line 1: Line 1:
De t-toets is een parametrische toets voor het testen van hypothesen over de gemiddelden van (semi-)continue data. De meest gebruikte t-toets is de [[T-toets#two sample ongepaarde t-toets|two sample ongepaarde t-toets]]. Deze toets vergelijkt de de gemiddelden van 2 onafhankelijk groepen. Voor [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]] groepen is er de [[T-toets#two sample gepaarde t-toets|two sample gepaarde t-toets]] en voor hypotheses over het gemiddelde in 1 groep de [[T-toets#one sample t-toets|one sample t-toets]].
{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]
|coauthor=
}}
De t-toets is een parametrische toets voor het testen van hypothesen over de gemiddelden van (semi-)continue data. De meest gebruikte t-toets is de [[T-toets#ongepaarde t-toets|ongepaarde t-toets]]. Deze toets vergelijkt de de gemiddelden van 2 onafhankelijk groepen. Voor [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]] groepen is er de [[T-toets#gepaarde t-toets|gepaarde t-toets]] en voor hypotheses over het gemiddelde in 1 groep de [[T-toets#one sample t-toets|one sample t-toets]].  


=Ongepaarde t-toets=
== Wanneer gebruik ik de ongepaarde t-toets? ==


=two sample ongepaarde t-toets=
Als je wilt toetsen of de gemiddelden van twee aparte groepen aan elkaar gelijk zijn, kun je de ongepaarde t-toets gebruiken. Bijvoorbeeld als je wilt testen of de gemiddelde leeftijd gelijk is voor twee armen in een studie.
== Wanneer gebruik ik de two sample ongepaarde t-toets? ==


Als je wilt toetsen of de gemiddelden van twee normaal verdeelde populaties aan elkaar gelijk zijn, kun je de two sample ongepaarde t-toets gebruiken.
De t-toets veronderstelt dat het gemiddelde verschil tussen de twee groepen normaal verdeeld is (eigenlijk: dat de steekproevenverdeling van gemiddelde verschillen). Als beide groepen afkomstig zijn uit een normaal verdeelde populatie is hieraan voldaan. Je kunt daarom beoordelen of jouw studie sample aan de normaliteitsassumptie van de two sample ongepaarde t-toets voldoet door voor beide groepen het histogram te bekijken. Hoe groter de steekproef, hoe minder je je - dankzij de central limit theorem - om de normaliteit van de data druk hoeft te maken. [https://statisticsbyjim.com/basics/central-limit-theorem/ In deze blogpost] wordt uitgelegd wat de central limit theorem is en waarom die hier relevant is.


=two sample gepaarde t-toets=
De standaard two sample ongepaarde t-toets veronderstelt daarnaast dat beide groepen uit een verdeling komen met dezelfde variantie (spreiding). Met bijvoorbeeld 'Levene's Test for equality of variance' kun je testen of de variantie in beide groepen gelijk verondersteld kan worden. SPSS geeft in de output van de two sample ongepaarde t-toets dit testresultaat plus het resultaat van de t-toets bij het wel of niet veronderstellen van gelijke variantie.
== Wanneer gebruik ik de two sample gepaarde t-toets? ==


=one sample t-toets=
Voorbeeld van het gebruik van een ongepaarde t-toets:
 
{| border ="1" style=align="center" cellpadding="3" cellspacing="0"
! colspan="4" align="left"|Table 1. Baseline characteristics of the patients
|-
|align="left" |Variable*
|align="center"|Treated Group
|align="center"|Placebo Group
|align="center"|p-value**
|-
|Age - yr
|align="center" | 67 (5.0)
|align="center" | 64 (4.2)
|align="center" |0.12
|-
|Weight - kg
|align="center" | 79 (10.2)
|align="center" | 85 (15.4)
|align="center" |0.33
|-
|colspan="4" rowspan="2"|  *Variables are denoted as mean (SD). **Group differences were tested with the two sample unpaired t-test.
|}
 
== Welke toets kan ik gebruiken voor het vergelijken van twee virusmetingen? ==
''Ik heb twee metingen gedaan (betreffende de hoeveelheid van een virus: niet normaal verdeeld) op tijdstip A en tijdstip B bij een patiëntenpopulatie. Deze populatie heb ik opgesplitst in twee groepen, nl: opgeknapt en niet opgeknapt. Nu wil ik weten of de afnamen (of toenamen) van hoeveelheid virus verschilt voor de opgeknapte en niet opgeknapte patiënten. Ik wil graag weten welke toets ik hiervoor kan gebruiken.
 
Voor het ontwerp dat je omschrijft zijn meerdere aanpakken mogelijk. Ik doe hier een voorstel: Indien je geïnteresseerd bent in de afname (of toename) tussen de twee tijdstippen, kun je deze verschillen als uitkomstmaat beschouwen. Iedere patiënt heeft dan één uitkomst, namelijk zijn verschil in virus.
De patiënten heb je ingedeeld in twee groepen (opgeknapt, niet opgeknapt). Je wilt dan toetsen of de uitkomstmaat verschilt over deze twee groepen.
Je schrijft dat de hoeveelheid virus niet normaal verdeeld is. Je zou dit opnieuw kunnen bekijken voor het verschil in virushoeveelheid. Eventueel zou een log-transformatie kunnen helpen de data minder scheef te krijgen (je bekijkt dan als het ware een log-reductiefactor). De twee groepen kunnen dan of met ongepaarde t-toets of met een niet-parametrische toets ([[Mann-Whitney U toets]]) vergeleken worden.
 
== Kan ik bij ongelijke groepsgrootte de t-toets gebruiken? ==
''Ik wil binnen mijn studiepopulatie groepen vergelijken op basis van verschillende variabelen. Als ik groepen maak kom ik bij een vergelijking op 14 proefpersonen in de ene groep en 97 in de andere groep uit. Dit is een erg groot verschil en ik vroeg me af of dit niet een te sterke invloed heeft op het resultaat? Mijn vraag is dus of ik in SPSS gewoon de t-toets mag gebruiken voor de vergelijking van deze twee groepen of wat anders het alternatief zou zijn.
 
De t-toets houdt bij de berekening rekening met de beschikbare aantallen (in de degrees of freedom), het is dus in principe geen bezwaar dat er ongelijke groepsgroottes zijn. Wat (bij de standaard t-test) wel gelijk verondersteld wordt is de spreiding (variantie) in beide groepen. En verder wordt er natuurlijk een normale verdeling verondersteld. Daar zou je nog eens kritisch naar kunnen kijken. Bij kleinere groepen (n=14) is de normaliteitsaanname soms niet goed hard te maken. Het kan dan 'veilig' zijn om een niet-parametrische test te gebruiken, zoals de [[Mann-Whitney U toets]].
 
== Wanneer kunnen we gelijke varianties aannemen in de t-toets? ==
 
''We hebben een vraag over t-toetsen op data met ongelijke variantie. In het soort experimenten die wij doen komt bijna nooit voor dat groepen ongelijke variantie vertonen, maar een enkele keer wel. Wij vroegen ons af wat me moeten doen als er in een experiment met meer dan 2 groepen, 1 groep is waarvan de variantie significant anders is. Moeten we dan bijvoorbeeld een Welch-test doen voor vergelijkingen met de groep die andere variantie vertoont en een Student t-test voor de vergelijkingen tussen groepen met dezelfde variantie? Of moeten we in dat geval binnen het hele experiment of zelfs experimenten een test gebruiken die niet uitgaat van gelijke variantie?  Of kunnen we stellen dat het die ene keer toeval is dat de variantie anders is en gewoon de testen gebruiken die van gelijke variantie uit gaan? Het lijkt ons niet wenselijk dat we verschillende datasets/experimenten of zelfs groepen binnen experiment statistisch anders moeten behandelen terwijl het type data hetzelfde is.
 
Hier zijn de richtlijnen niet zwart-wit. Je kunt meewegen wat je verwachtingen zijn van de variantie (of je denkt dat het toeval is). Daarbij zou ik in ogenschouw houden wat de sample size is en dus hoe overtuigend de data je vertellen dat er ongelijke varianties zijn. Daarnaast is het sowieso van belang voordat je groepen onderling vergelijkt een sterke ‘overall’ test te doen ([[One-way ANOVA]] of [[Kruskal Wallis|niet-parametrisch equivalent]]).
 
=Gepaarde t-toets=
== Wanneer gebruik ik de gepaarde t-toets? ==
Als je wilt toetsen of de gemiddelden van twee maal gemeten, [[KEUZE TOETS#Heb ik gepaarde of ongepaarde data?|gepaarde]], variabelen aan elkaar gelijk zijn, kun je de gepaarde t-toets gebruiken. Bijvoorbeeld als je wilt testen of de bloedwaarden voor en na het toedienen van een medicijn van elkaar verschillen.
 
De gepaarde t-toets veronderstelt dat het verschil tussen twee gepaarde metingen normaal verdeeld is (eigenlijk: dat de steekproevenverdeling van gemiddelde verschillen normaal verdeeld is). Om te beoordelen of je data geschikt is voor een gepaarde t-toets, kun je voor ieder paar het verschil tussen de twee metingen berekenen en het histogram plotten. Met een formele toets de normaliteit van jouw data testen, zoals met de Kolmogorov-Smirnoff-toets, wordt in deze context afgeraden [https://doi.org/10.1111/j.1365-2230.2006.02206.x]. Hoe groter de steekproef, hoe minder je je - dankzij de central limit theorem - om de normaliteit van de data druk hoeft te maken. [https://statisticsbyjim.com/basics/central-limit-theorem/ In deze blogpost] wordt uitgelegd wat de central limit theorem is en waarom die hier relevant is.
 
=One sample t-toets=
== Wanneer gebruik ik de one sample t-toets? ==
== Wanneer gebruik ik de one sample t-toets? ==
Als je wilt toetsen of het gemiddelde van een variabele (bijvoorbeeld lengte) in een populatie gelijk is aan een bepaalde, vooraf gespecificeerde, waarde kun je de one sample t-toets gebruiken. Bijvoorbeeld als je de hypothese wilt toetsen of de gemiddelde lengte van mannen met bepaalde aandoening lager is dan de (bekende) Nederlands gemiddelde lengte van mannen (1.82 m).
Als je wilt toetsen of het gemiddelde van een variabele (bijvoorbeeld lengte) in een populatie gelijk is aan een bepaalde, vooraf gespecificeerde, waarde kun je de one sample t-toets gebruiken. Bijvoorbeeld als je de hypothese wilt toetsen of de gemiddelde lengte van mannen met bepaalde aandoening lager is dan de (bekende) Nederlands gemiddelde lengte van mannen (1.82 m).


De one sample t-toets veronderstelt dat de variabele een normale verdeling heeft in de populatie. Om redelijkerwijs aan te kunnen nemen dat de gemeten waardes in een studie sample uit een normale verdeling afkomstig zijn kun je een histogram maken van de data of een formele toets uitvoeren, bijvoorbeeld de Kolmogorov-Smirnoff test of de Shapiro-Wilk test (in SPSS 16: Analyze- Descriptive Statistics->Explore, klik onder het "Plots" kopje 'Histogram' en 'Normality plots with tests' aan.
De one sample t-toets veronderstelt dat de variabele een normale verdeling heeft in de populatie. Om redelijkerwijs aan te kunnen nemen dat de gemeten waardes in een studie sample uit een normale verdeling afkomstig zijn kun je een histogram maken van de data.


= Waar vind ik de t-toets in SPSS?=
= Waar vind ik de t-toets in SPSS?=


Je vindt de t-toets in SPSS 16 onder Analyze->Compare Means.
Je vindt de t-toetsen in SPSS 28 onder Analyze->Compare Means.
 
= Referenties =
 


<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.


Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
{{onderschrift}}
<div>

Latest revision as of 16:56, 24 June 2024

Auteur dr. ir. N. van Geloven
Co-Auteur
auteurschap op deze site

De t-toets is een parametrische toets voor het testen van hypothesen over de gemiddelden van (semi-)continue data. De meest gebruikte t-toets is de ongepaarde t-toets. Deze toets vergelijkt de de gemiddelden van 2 onafhankelijk groepen. Voor gepaarde groepen is er de gepaarde t-toets en voor hypotheses over het gemiddelde in 1 groep de one sample t-toets.

Ongepaarde t-toets

Wanneer gebruik ik de ongepaarde t-toets?

Als je wilt toetsen of de gemiddelden van twee aparte groepen aan elkaar gelijk zijn, kun je de ongepaarde t-toets gebruiken. Bijvoorbeeld als je wilt testen of de gemiddelde leeftijd gelijk is voor twee armen in een studie.

De t-toets veronderstelt dat het gemiddelde verschil tussen de twee groepen normaal verdeeld is (eigenlijk: dat de steekproevenverdeling van gemiddelde verschillen). Als beide groepen afkomstig zijn uit een normaal verdeelde populatie is hieraan voldaan. Je kunt daarom beoordelen of jouw studie sample aan de normaliteitsassumptie van de two sample ongepaarde t-toets voldoet door voor beide groepen het histogram te bekijken. Hoe groter de steekproef, hoe minder je je - dankzij de central limit theorem - om de normaliteit van de data druk hoeft te maken. In deze blogpost wordt uitgelegd wat de central limit theorem is en waarom die hier relevant is.

De standaard two sample ongepaarde t-toets veronderstelt daarnaast dat beide groepen uit een verdeling komen met dezelfde variantie (spreiding). Met bijvoorbeeld 'Levene's Test for equality of variance' kun je testen of de variantie in beide groepen gelijk verondersteld kan worden. SPSS geeft in de output van de two sample ongepaarde t-toets dit testresultaat plus het resultaat van de t-toets bij het wel of niet veronderstellen van gelijke variantie.

Voorbeeld van het gebruik van een ongepaarde t-toets:

Table 1. Baseline characteristics of the patients
Variable* Treated Group Placebo Group p-value**
Age - yr 67 (5.0) 64 (4.2) 0.12
Weight - kg 79 (10.2) 85 (15.4) 0.33
*Variables are denoted as mean (SD). **Group differences were tested with the two sample unpaired t-test.

Welke toets kan ik gebruiken voor het vergelijken van twee virusmetingen?

Ik heb twee metingen gedaan (betreffende de hoeveelheid van een virus: niet normaal verdeeld) op tijdstip A en tijdstip B bij een patiëntenpopulatie. Deze populatie heb ik opgesplitst in twee groepen, nl: opgeknapt en niet opgeknapt. Nu wil ik weten of de afnamen (of toenamen) van hoeveelheid virus verschilt voor de opgeknapte en niet opgeknapte patiënten. Ik wil graag weten welke toets ik hiervoor kan gebruiken.

Voor het ontwerp dat je omschrijft zijn meerdere aanpakken mogelijk. Ik doe hier een voorstel: Indien je geïnteresseerd bent in de afname (of toename) tussen de twee tijdstippen, kun je deze verschillen als uitkomstmaat beschouwen. Iedere patiënt heeft dan één uitkomst, namelijk zijn verschil in virus. De patiënten heb je ingedeeld in twee groepen (opgeknapt, niet opgeknapt). Je wilt dan toetsen of de uitkomstmaat verschilt over deze twee groepen. Je schrijft dat de hoeveelheid virus niet normaal verdeeld is. Je zou dit opnieuw kunnen bekijken voor het verschil in virushoeveelheid. Eventueel zou een log-transformatie kunnen helpen de data minder scheef te krijgen (je bekijkt dan als het ware een log-reductiefactor). De twee groepen kunnen dan of met ongepaarde t-toets of met een niet-parametrische toets (Mann-Whitney U toets) vergeleken worden.

Kan ik bij ongelijke groepsgrootte de t-toets gebruiken?

Ik wil binnen mijn studiepopulatie groepen vergelijken op basis van verschillende variabelen. Als ik groepen maak kom ik bij een vergelijking op 14 proefpersonen in de ene groep en 97 in de andere groep uit. Dit is een erg groot verschil en ik vroeg me af of dit niet een te sterke invloed heeft op het resultaat? Mijn vraag is dus of ik in SPSS gewoon de t-toets mag gebruiken voor de vergelijking van deze twee groepen of wat anders het alternatief zou zijn.

De t-toets houdt bij de berekening rekening met de beschikbare aantallen (in de degrees of freedom), het is dus in principe geen bezwaar dat er ongelijke groepsgroottes zijn. Wat (bij de standaard t-test) wel gelijk verondersteld wordt is de spreiding (variantie) in beide groepen. En verder wordt er natuurlijk een normale verdeling verondersteld. Daar zou je nog eens kritisch naar kunnen kijken. Bij kleinere groepen (n=14) is de normaliteitsaanname soms niet goed hard te maken. Het kan dan 'veilig' zijn om een niet-parametrische test te gebruiken, zoals de Mann-Whitney U toets.

Wanneer kunnen we gelijke varianties aannemen in de t-toets?

We hebben een vraag over t-toetsen op data met ongelijke variantie. In het soort experimenten die wij doen komt bijna nooit voor dat groepen ongelijke variantie vertonen, maar een enkele keer wel. Wij vroegen ons af wat me moeten doen als er in een experiment met meer dan 2 groepen, 1 groep is waarvan de variantie significant anders is. Moeten we dan bijvoorbeeld een Welch-test doen voor vergelijkingen met de groep die andere variantie vertoont en een Student t-test voor de vergelijkingen tussen groepen met dezelfde variantie? Of moeten we in dat geval binnen het hele experiment of zelfs experimenten een test gebruiken die niet uitgaat van gelijke variantie? Of kunnen we stellen dat het die ene keer toeval is dat de variantie anders is en gewoon de testen gebruiken die van gelijke variantie uit gaan? Het lijkt ons niet wenselijk dat we verschillende datasets/experimenten of zelfs groepen binnen experiment statistisch anders moeten behandelen terwijl het type data hetzelfde is.

Hier zijn de richtlijnen niet zwart-wit. Je kunt meewegen wat je verwachtingen zijn van de variantie (of je denkt dat het toeval is). Daarbij zou ik in ogenschouw houden wat de sample size is en dus hoe overtuigend de data je vertellen dat er ongelijke varianties zijn. Daarnaast is het sowieso van belang voordat je groepen onderling vergelijkt een sterke ‘overall’ test te doen (One-way ANOVA of niet-parametrisch equivalent).

Gepaarde t-toets

Wanneer gebruik ik de gepaarde t-toets?

Als je wilt toetsen of de gemiddelden van twee maal gemeten, gepaarde, variabelen aan elkaar gelijk zijn, kun je de gepaarde t-toets gebruiken. Bijvoorbeeld als je wilt testen of de bloedwaarden voor en na het toedienen van een medicijn van elkaar verschillen.

De gepaarde t-toets veronderstelt dat het verschil tussen twee gepaarde metingen normaal verdeeld is (eigenlijk: dat de steekproevenverdeling van gemiddelde verschillen normaal verdeeld is). Om te beoordelen of je data geschikt is voor een gepaarde t-toets, kun je voor ieder paar het verschil tussen de twee metingen berekenen en het histogram plotten. Met een formele toets de normaliteit van jouw data testen, zoals met de Kolmogorov-Smirnoff-toets, wordt in deze context afgeraden [1]. Hoe groter de steekproef, hoe minder je je - dankzij de central limit theorem - om de normaliteit van de data druk hoeft te maken. In deze blogpost wordt uitgelegd wat de central limit theorem is en waarom die hier relevant is.

One sample t-toets

Wanneer gebruik ik de one sample t-toets?

Als je wilt toetsen of het gemiddelde van een variabele (bijvoorbeeld lengte) in een populatie gelijk is aan een bepaalde, vooraf gespecificeerde, waarde kun je de one sample t-toets gebruiken. Bijvoorbeeld als je de hypothese wilt toetsen of de gemiddelde lengte van mannen met bepaalde aandoening lager is dan de (bekende) Nederlands gemiddelde lengte van mannen (1.82 m).

De one sample t-toets veronderstelt dat de variabele een normale verdeling heeft in de populatie. Om redelijkerwijs aan te kunnen nemen dat de gemeten waardes in een studie sample uit een normale verdeling afkomstig zijn kun je een histogram maken van de data.

Waar vind ik de t-toets in SPSS?

Je vindt de t-toetsen in SPSS 28 onder Analyze->Compare Means.


Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.