Chi-kwadraat toets: Difference between revisions
No edit summary |
No edit summary |
||
(11 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
{{auteurs| | {{auteurs| | ||
|mainauthor= [[user:Nan van Geloven|ir. N. van Geloven]] | |mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]] | ||
|coauthor= | |coauthor= | ||
}} | }} | ||
De Chi-kwadraat toets beoordeelt of het verschil tussen twee proporties werkelijk bestaat of slechts "toevallig" is. | De Chi-kwadraat toets beoordeelt of het verschil tussen twee (of meerdere) proporties werkelijk bestaat of slechts "toevallig" is. | ||
Line 10: | Line 10: | ||
== Wanneer gebruik ik de Chi-kwadraat toets? == | == Wanneer gebruik ik de Chi-kwadraat toets? == | ||
De Chi-kwadraat toets kan gebruikt worden om te toetsen of het verschil tussen twee proporties in een klassieke 2x2 tabel significant is. Traditioneel wordt er voor de [[Fisher's exact toets]] gekozen ipv een Chi-kwadraat wanneer er lage aantallen (geobserveerde count ~<10 of expected count <5) in de 2x2 tabel voorkomen. De Chi-kwadraat test is dan niet meer nauwkeurig. Omdat [[Fisher's exact toets]] in de huidige statistische pakketten even snel uitgerekend kan worden als een chi-kwadraat test is er geen bezwaar meer om deze exacte test (chi-kwadraat gebruikt een benadering) altijd te gebruiken bij het analyseren van een 2x2 (of een | De Chi-kwadraat toets kan gebruikt worden om te toetsen of het verschil tussen twee proporties in een klassieke 2x2 tabel significant is. Traditioneel wordt er voor de [[Fisher's exact toets]] gekozen ipv een Chi-kwadraat wanneer er lage aantallen (geobserveerde count ~<10 of expected count <5) in de 2x2 tabel voorkomen. De Chi-kwadraat test is dan niet meer nauwkeurig. Omdat [[Fisher's exact toets]] in de huidige statistische pakketten even snel uitgerekend kan worden als een chi-kwadraat test is er geen bezwaar meer om deze exacte test (chi-kwadraat gebruikt een benadering) altijd te gebruiken bij het analyseren van een 2x2 (of een m x n) tabel. In het algemeen zal de Chi-kwadraat toets minder conservatief (sneller significant) toetsen dan de Fisher's exact toets. | ||
Voorbeeld van het gebuik van de Chi-kwadraat toets: | Voorbeeld van het gebuik van de Chi-kwadraat toets: | ||
Line 34: | Line 34: | ||
|colspan="4" rowspan="2"| *Variables are denoted as percentage (cases/n). **Group differences were tested with the chi-square test. | |colspan="4" rowspan="2"| *Variables are denoted as percentage (cases/n). **Group differences were tested with the chi-square test. | ||
|} | |} | ||
==Hoe toets ik het verschil tussen groepen voor een 0-1-2 uitkomstmaat?== | |||
''Ik heb twee groepen: allergische patienten (n=52) versus gezonde controles (n=14). Vervolgens is de groep allergische ptn onderverdeeld in 4 subgroepen, die ik wil vergelijken met elkaar en met de gezonde controles.De uitkomstmaat is uitgedrukt als mate van aankleuring op een 3-punts schaal (0= geen aankleuring, 1= enige aankleuring, 2= uitgebreide aankleuring). Welke analyse kan ik doen? | |||
Voor de 3-punts schaal zou je een chi-kwadraat toets kunnen gebruiken. Dit kan zowel voor de 'overall' vergelijking over de 5(?) groepen als bij inzoomen op 2 groepen onderling. Wat je nog kunt overwegen is een chi-square test for trend te gebruiken. Hierbij kijk je naar verschillen '1 kant op', bijvoorbeeld als er bij allergische patienten 50% geen aankleuring heeft en 50% uitgebreide aankleuring en bij gezonder controles heeft 100% enige aankleuring, dan zal een gewone chi-square test hier een verschil bemerken, maar een chi-square test for trend niet omdat ie geen structureel meer of minder aankleuring ziet. Als je de chi-square test for trend ook wilt gebruiken bij de vergelijking over de 5(?) subgroepen, dan moet er ook in die subgroepen een logische ordening zitten, bijv van weinig naar veel allergisch. De uitslag van de chi-square test for trend vind je in SPSS onder 'linear by linear'. | |||
==Hoe toets ik het verschil tussen groepen voor een uitkomstmaat op een 1-5 schaal?== | |||
''Ik vind het moeilijk in te schatten of de uitkomsten van de losse vragen normaal verdeeld zijn. Alle items hebben een uitkomst op een 5-punts schaal. Welke toets kan ik gebruiken voor het vergelijken van deze items tussen de twee groepen? | |||
Een uitkomstmaat die enkel de waardes 1-5 kan aannemen is niet mooi normaal verdeeld te veronderstellen. Een [[Mann-Whitney U toets]] zou kunnen, maar heeft door de weinige antwoordopties ook weinig onderscheidend vermogen. Als er voldoende aantallen in de verschillende cellen van de 2x5 tabel zijn, is het optie om voor de per item vergelijkingen (tussen 2 groepen naar ik begrijp) een chi square test for trend te doen. | |||
== Waar vind ik de Chi-kwadraat toets in SPSS?== | == Waar vind ik de Chi-kwadraat toets in SPSS?== | ||
Je vindt de test in SPSS | Je vindt de test in SPSS onder Analyse->Descriptive Statistics->Crosstabs. Vink onder de knop "Statistics..." Chi-square aan. Zie ook [http://www-01.ibm.com/support/docview.wss?uid=swg21477269 deze IBM help pagina] voor informatie over het uitvoeren van een Chi square test for trend in SPSS. | ||
== Referenties == | == Referenties == | ||
* Agresti A (1990) Categorical Data Analysis. John Wiley & sons, New York. | * Agresti A (1990) Categorical Data Analysis. John Wiley & sons, New York. | ||
* [http://thestatsgeek.com/2013/07/22/ab-testing/ A/B testing and Pearson's chi-squared test of independence op TheStatsGeek.com]. Een heldere Engelstalige uitleg over de Chi-kwadraat toets inclusief een voorbeeld van hoe deze toets in [[Statistische software#R|R]] uit te voeren. | |||
{{onderschrift}} | |||
Latest revision as of 08:27, 20 August 2015
Auteur | dr. ir. N. van Geloven | |
Co-Auteur | ||
auteurschap op deze site |
De Chi-kwadraat toets beoordeelt of het verschil tussen twee (of meerdere) proporties werkelijk bestaat of slechts "toevallig" is.
Wanneer gebruik ik de Chi-kwadraat toets?
De Chi-kwadraat toets kan gebruikt worden om te toetsen of het verschil tussen twee proporties in een klassieke 2x2 tabel significant is. Traditioneel wordt er voor de Fisher's exact toets gekozen ipv een Chi-kwadraat wanneer er lage aantallen (geobserveerde count ~<10 of expected count <5) in de 2x2 tabel voorkomen. De Chi-kwadraat test is dan niet meer nauwkeurig. Omdat Fisher's exact toets in de huidige statistische pakketten even snel uitgerekend kan worden als een chi-kwadraat test is er geen bezwaar meer om deze exacte test (chi-kwadraat gebruikt een benadering) altijd te gebruiken bij het analyseren van een 2x2 (of een m x n) tabel. In het algemeen zal de Chi-kwadraat toets minder conservatief (sneller significant) toetsen dan de Fisher's exact toets.
Voorbeeld van het gebuik van de Chi-kwadraat toets:
Table 1. Baseline characteristics of the patients | |||
---|---|---|---|
Variable* | Treated Group | Placebo Group | p-value** |
Gender - Male | 61% (146/240) | 69% (161/234) | 0.07 |
Family history disease | 21% (50/240) | 15% (36/234) | 0.12 |
*Variables are denoted as percentage (cases/n). **Group differences were tested with the chi-square test. |
Hoe toets ik het verschil tussen groepen voor een 0-1-2 uitkomstmaat?
Ik heb twee groepen: allergische patienten (n=52) versus gezonde controles (n=14). Vervolgens is de groep allergische ptn onderverdeeld in 4 subgroepen, die ik wil vergelijken met elkaar en met de gezonde controles.De uitkomstmaat is uitgedrukt als mate van aankleuring op een 3-punts schaal (0= geen aankleuring, 1= enige aankleuring, 2= uitgebreide aankleuring). Welke analyse kan ik doen?
Voor de 3-punts schaal zou je een chi-kwadraat toets kunnen gebruiken. Dit kan zowel voor de 'overall' vergelijking over de 5(?) groepen als bij inzoomen op 2 groepen onderling. Wat je nog kunt overwegen is een chi-square test for trend te gebruiken. Hierbij kijk je naar verschillen '1 kant op', bijvoorbeeld als er bij allergische patienten 50% geen aankleuring heeft en 50% uitgebreide aankleuring en bij gezonder controles heeft 100% enige aankleuring, dan zal een gewone chi-square test hier een verschil bemerken, maar een chi-square test for trend niet omdat ie geen structureel meer of minder aankleuring ziet. Als je de chi-square test for trend ook wilt gebruiken bij de vergelijking over de 5(?) subgroepen, dan moet er ook in die subgroepen een logische ordening zitten, bijv van weinig naar veel allergisch. De uitslag van de chi-square test for trend vind je in SPSS onder 'linear by linear'.
Hoe toets ik het verschil tussen groepen voor een uitkomstmaat op een 1-5 schaal?
Ik vind het moeilijk in te schatten of de uitkomsten van de losse vragen normaal verdeeld zijn. Alle items hebben een uitkomst op een 5-punts schaal. Welke toets kan ik gebruiken voor het vergelijken van deze items tussen de twee groepen?
Een uitkomstmaat die enkel de waardes 1-5 kan aannemen is niet mooi normaal verdeeld te veronderstellen. Een Mann-Whitney U toets zou kunnen, maar heeft door de weinige antwoordopties ook weinig onderscheidend vermogen. Als er voldoende aantallen in de verschillende cellen van de 2x5 tabel zijn, is het optie om voor de per item vergelijkingen (tussen 2 groepen naar ik begrijp) een chi square test for trend te doen.
Waar vind ik de Chi-kwadraat toets in SPSS?
Je vindt de test in SPSS onder Analyse->Descriptive Statistics->Crosstabs. Vink onder de knop "Statistics..." Chi-square aan. Zie ook deze IBM help pagina voor informatie over het uitvoeren van een Chi square test for trend in SPSS.
Referenties
- Agresti A (1990) Categorical Data Analysis. John Wiley & sons, New York.
- A/B testing and Pearson's chi-squared test of independence op TheStatsGeek.com. Een heldere Engelstalige uitleg over de Chi-kwadraat toets inclusief een voorbeeld van hoe deze toets in R uit te voeren.
Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.
De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.