Outliers: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
(New page: ==Welke analyse kies is als er bij het weglaten van outliers een andere conclusie uitkomt?== ''Ik heb mijn parametrische toets 2 keer gedraaid, een keer met en een keer zonder de outliers....)
 
mNo edit summary
 
Line 1: Line 1:
==Welke analyse kies is als er bij het weglaten van outliers een andere conclusie uitkomt?==
==Welke analyse kies ik als er bij het weglaten van outliers een andere conclusie uitkomt?==
''Ik heb mijn parametrische toets 2 keer gedraaid, een keer met en een keer zonder de outliers. Er komt een andere conclusie uit. Wat betekent dat? Zou dit betekenen dat er bij het vinden van een verschil in de sensitiviteitsanalyse, toch naar een nonparametrische test moet worden gegrepen voor juiste analyse van de data? Of is het waardevoller om beiden conclusies na een parametrische test te beschrijven en te vermelden. Ik neem aan dat wanneer een test (bijv [[One-way ANOVA|ANOVA]]) significant wordt door een outlier, dat resultaat niet geldig is. Maar dat andersom, wanneer een resultaat significant wordt zonder de outlier, het resultaat me vertelt dat er een verschil is de populatie, maar dat de outlier dat verschil heeft verborgen. Dus, bij verschil non-parametrisch gaan of beiden parametrische resultaten beschrijven?
''Ik heb mijn parametrische toets 2 keer gedraaid, een keer met en een keer zonder de outliers. Er komt een andere conclusie uit. Wat betekent dat? Zou dit betekenen dat er bij het vinden van een verschil in de sensitiviteitsanalyse toch naar een nonparametrische test moet worden gegrepen voor juiste analyse van de data? Of is het waardevoller om beide conclusies na een parametrische test te beschrijven en te vermelden? Ik neem aan dat wanneer een test (bijvoorbeeld [[One-way ANOVA|ANOVA]]) significant wordt door een outlier, dat resultaat niet geldig is. Maar dat andersom, wanneer een resultaat significant wordt zonder de outlier, het resultaat me vertelt dat er een verschil is in de populatie, maar dat de outlier dat verschil heeft verborgen. Dus, bij verschil non-parametrisch gaan of beiden parametrische resultaten beschrijven?


Indien de outlier wel of niet meenemen een verschillende conclusie geeft, betekent het dat je geen robuuste analyse hebt. Deze is daarmee niet valide (het maakt daarbij niet uit of ie nou met of zonder outliers sign was). Advies is dan inderdaad om niet-parametrische toets te gebruiken. Als het goed is verandert de conclusie van die toets niet als je enkele ouliers wel of niet meeneemt. Uiteindelijk neem je natuurlijk alle data die verzameld is mee (tenzij je duidelijk ziet dat de meting technisch verkeerd gegaan is oid).
Indien de outlier wel of niet meenemen een verschillende conclusie geeft, betekent het dat je geen robuuste analyse hebt. Deze is daarmee niet valide (het maakt daarbij niet uit of ie nou met of zonder outliers significant was). Advies is dan inderdaad om niet-parametrische toets te gebruiken. Als het goed is verandert de conclusie van die toets niet als je enkele outliers wel of niet meeneemt. Uiteindelijk neem je natuurlijk alle data die verzameld is mee (tenzij je duidelijk ziet dat de meting technisch verkeerd gegaan is o.i.d.).


{{onderschrift}}
{{onderschrift}}

Latest revision as of 15:57, 21 April 2022

Welke analyse kies ik als er bij het weglaten van outliers een andere conclusie uitkomt?

Ik heb mijn parametrische toets 2 keer gedraaid, een keer met en een keer zonder de outliers. Er komt een andere conclusie uit. Wat betekent dat? Zou dit betekenen dat er bij het vinden van een verschil in de sensitiviteitsanalyse toch naar een nonparametrische test moet worden gegrepen voor juiste analyse van de data? Of is het waardevoller om beide conclusies na een parametrische test te beschrijven en te vermelden? Ik neem aan dat wanneer een test (bijvoorbeeld ANOVA) significant wordt door een outlier, dat resultaat niet geldig is. Maar dat andersom, wanneer een resultaat significant wordt zonder de outlier, het resultaat me vertelt dat er een verschil is in de populatie, maar dat de outlier dat verschil heeft verborgen. Dus, bij verschil non-parametrisch gaan of beiden parametrische resultaten beschrijven?

Indien de outlier wel of niet meenemen een verschillende conclusie geeft, betekent het dat je geen robuuste analyse hebt. Deze is daarmee niet valide (het maakt daarbij niet uit of ie nou met of zonder outliers significant was). Advies is dan inderdaad om niet-parametrische toets te gebruiken. Als het goed is verandert de conclusie van die toets niet als je enkele outliers wel of niet meeneemt. Uiteindelijk neem je natuurlijk alle data die verzameld is mee (tenzij je duidelijk ziet dat de meting technisch verkeerd gegaan is o.i.d.).

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.