KEUZE TOETS
Schema welke toets bij welke vergelijking
type vergelijking | |||||||
---|---|---|---|---|---|---|---|
1 groep | 2 groepen | >2 groepen | |||||
vs. referentie | gepaard | ongepaard | gepaard | ongepaard | |||
type
uit- komst- maat |
(semi-)
continu |
normaal | 1 sample t-toets | gepaarde t-toets | linear mixed models | One-way ANOVA | |
niet normaal | sign toets | Wilcoxon signed rank toets | Mann-Whitney U toets | Friedman toets | Kruskal Wallis | ||
categorisch | binair (proportie) | z-test voor proporties | McNemars test | Chi-kwadraat toets / | GLMM / GEE | Chi-kwadraat toets / | |
nominaal / ordinaal | x | McNemars toets / | Chi-kwadraat toets (trend) / | GLMM / GEE | Chi-kwadraat toets / |
Schema welke analyse bij welke associatie
type associatie | ||||||
---|---|---|---|---|---|---|
crosssectioneel | longitudinaal | |||||
2 variabelen | meer variabelen | 2 variabelen | meer variabelen | |||
type
uit- komst- maat |
(semi-)
continu |
normaal | Pearson's rho | Lineaire regressie | Herhaalde metingen | |
niet
normaal |
Spearman's rho / | Niet lineaire regressie | ||||
categorisch | binair
(proporties) |
odds ratio/ risk ratio/
risk difference |
Logistische regressie | Survival analyse | Cox regressie | |
nominaal
/ordinaal |
x | multinomiale logistische regressie | x | x |
Van welk type is mijn uitkomstmaat?
Heb ik gepaarde of ongepaarde data?
Hoe beoordeel ik de normaliteit van mijn data?
Wanneer concludeert de Shapiro Wilk test dat data niet normaal verdeeld is?
Ik dacht dat een Shapiro-Wilk test met p<0.05 betekende dat de data niet normaal verdeeld zijn. Nu heb ik van een collega een syntax ingekeken waar een grens van 0.9 wordt aangehouden. Wat is nou waar?
Formeel gezien, moet je bij een p<0.05 de nul hypothese verwerpen. In jouw geval, zou je dus op basis van de p-waarde moeten besluiten om de data als niet normaal te zien. Echter, wanneer je voldoende data hebt, kun je zelfs een irrelevant, maar statistisch significante afwijking van de normale verdeling vinden. De test statistic W van de Shapiro-Wilk test loopt van 0 tot 1, waarbij 1 betekent, dat de data perfect normaal verdeeld zijn. Vaak wordt meer naar deze waarde gekeken, dan naar de p-waarde, waarbij voor de W een ondergrens van 0.90 gehanteerd wordt. Als de test-stastistic W groter is dan 0.90 kan de data als normaal verdeeld beschouwd worden. (Er zijn veel voorbeelden waarbij de W > 0.99 is, terwijl de p < 0.05 is.)
Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.