Standaardfout/standard error: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
 
(6 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{auteurs|
{{auteurs|
|mainauthor= [[user:Nan van Geloven|ir. N. van Geloven]]
|mainauthor= [[user:Nan van Geloven|dr. ir. N. van Geloven]]
|coauthor=  
|coauthor=  
}}
}}
De standaardfout van een schatting geeft de precisie van die schatting weer. De standaardfout (Engels standard error (SE)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Formeel geeft de waarde de spreiding (standaard deviatie) van de schatting weer als er meerdere samples zouden zijn, waarbij er bij iedere sample opnieuw de schatting gemaakt wordt.  
De standaardfout van een schatting geeft de precisie van die schatting weer. De standaardfout (Engels: standard error (SE)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Formeel geeft de waarde de spreiding (standaarddeviatie) van de schatting weer als er meerdere samples zouden zijn, waarbij er bij iedere sample opnieuw de schatting gemaakt wordt.  


==Hoe bereken ik de SE van een procentuele toename?==
==Hoe bereken ik de SE van een procentuele toename?==
''Ik heb in een controle (1) en een interventie (2) groep een mean en SE. Als samenvattende maat bereken ik de procentuele toename in de interventie groep tov de controle groep: (mean_2 - mean_1) / mean_1 * 100%. Hoe kan ik een SE berekenen van deze percentuele toename?
''Ik heb in een controlegroep (1) en een interventiegroep (2) een mean en SE. Als samenvattende maat bereken ik de procentuele toename in de interventiegroep t.o.v. de controlegroep: (mean_2 - mean_1) / mean_1 * 100%. Hoe kan ik een SE berekenen van deze percentuele toename?


Het is niet gebruikelijk om een SE te berekenen op deze 'procentuele' schaal. Reden hiervoor is dat als je bijv een 30% decrease zou hebben met een SE van 20%, je bij het doorrekenen naar een 95% [[betrouwbaarheidsinterval]] op 'rare' negatieve percentages (30% +/- 1,95*20%) uit zou komen. In het algemeen gebruik je de SE op een schaal waar je met redelijkheid kunt aannemen dat een normale verdeling geldt (om dezelfde reden wordt er bijvoorbeeld bij [[logistische regressie]] de SE vermeld bij de regressiecoefficienten en niet bij de odds ratio). Je kunt wel de SE berekenen op een getransformeerde schaal. In het bijzonder zou je hier de natuurlijk logarithme van de fold increase kunnen gebruiken:
Het is niet gebruikelijk om een SE te berekenen op deze 'procentuele' schaal ([https://en.wikipedia.org/wiki/Relative_change#Percentage_change relatieve verandering]). Reden hiervoor is dat als je bijvoorbeeld een 30% decrease zou hebben met een SE van 20%, je bij het doorrekenen naar een 95% [[betrouwbaarheidsinterval]] op 'rare' negatieve percentages (30% +/- 1,95*20%) uit zou komen. In het algemeen gebruik je de SE op een schaal waar je met redelijkheid kunt aannemen dat een normale verdeling geldt (om dezelfde reden wordt er bijvoorbeeld bij [[logistische regressie]] de SE vermeld bij de regressiecoëfficiënten en niet bij de odds ratio). Je kunt wel de SE berekenen op een getransformeerde schaal. In het bijzonder zou je hier de natuurlijk logaritme van de fold increase (de ratio van de twee gemiddelden) kunnen gebruiken:
 
<math> ln(FI) = ln(\frac{mean_2}{mean_1}) = ln(mean_2) - ln(mean_1)</math>.


ln (mean_2/mean_1) = ln(mean_2) - ln(mean_1).


De bijbehorende SE op deze schaal is (dit kun je berekenen met behulp van de [http://en.wikipedia.org/wiki/Variance#Approximating_the_variance_of_a_function delta methode]):
De bijbehorende SE op deze schaal is (dit kun je berekenen met behulp van de [http://en.wikipedia.org/wiki/Variance#Approximating_the_variance_of_a_function delta methode]):


wortel (SE_1^2 / mean_1^2 + SE_2^2 / mean_2^2).
<math> SE_{ln(FI)} = \sqrt{\frac{SE_1^2}{mean_1^2} + \frac{SE_2^2}{mean_2^2}}</math>.
 
Op deze getransformeerde schaal zou je wel berekeningen kunnen doen (bijvoorbeeld poolen van studieresultaten of berekenen van een 95% betrouwbaarheidsinterval voor beschrijving).  
 
 
Vanaf de op deze schaal uitgerekende getallen kun je altijd weer terug transformeren naar een maat van relatieve verandering, met behulp van de volgende omzetting:
 
<math>\frac{mean_2-mean_1}{mean_1} = e^{ln(\frac{mean_2}{mean_1})} - 1 </math>
 
==Hoe bereken ik de standard error van een standaarddeviatie?==
 
De standard error van de schatting van een standaarddeviatie kan berekend worden als:


Op deze getransformeerde schaal zou je wel berekeningen kunnen doen (bijv poolen van studieresultaten of berekenen van een 95% betrouwbaarheidsinterval voor beschrijving). Vanaf de op deze schaal uitgerekende getallen kun je altijd weer terug transformeren, met behulp van de volgende omzetting:
<math> SE_s = \frac {s}{\sqrt{2*(n-1)}} </math> '''≈''' <math> 0.71 *  SE_{mean} </math>,


(mean_2-mean_1)/mean_1 = e^(ln(mean_2/mean_1)) - 1
waarbij s de sample standaarddeviatie en n het aantal waarnemingen. Zie ook deze [http://www.minerazzi.com/tutorials/a-tutorial-on-standard-errors.pdf tutorial] en het paper van [https://www.tqmp.org/RegularArticles/vol10-2/p107/p107.pdf Harding et al. 2014].


==Referenties ==
==Referenties ==


*[http://www.bmj.com/cgi/reprint/331/7521/903 Douglas G. Altman, J Martin Bland, Statistical Notes, Standard deviations and standard errors, BMJ 2005;331:903]
*[http://www.bmj.com/cgi/reprint/331/7521/903 Douglas G. Altman, J Martin Bland, Statistical Notes, Standard deviations and standard errors, BMJ 2005;331:903]
*[http://thestatsgeek.com/2013/06/30/standard-deviation-versus-standard-error/ Standard error versus standard deviation on TheStatsGeek.com] Een zeer heldere Engelstalige uitleg over deze twee grootheden.


<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
{{onderschrift}}
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.
 
Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
<div>

Latest revision as of 11:51, 11 June 2024

Auteur dr. ir. N. van Geloven
Co-Auteur
auteurschap op deze site

De standaardfout van een schatting geeft de precisie van die schatting weer. De standaardfout (Engels: standard error (SE)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Formeel geeft de waarde de spreiding (standaarddeviatie) van de schatting weer als er meerdere samples zouden zijn, waarbij er bij iedere sample opnieuw de schatting gemaakt wordt.

Hoe bereken ik de SE van een procentuele toename?

Ik heb in een controlegroep (1) en een interventiegroep (2) een mean en SE. Als samenvattende maat bereken ik de procentuele toename in de interventiegroep t.o.v. de controlegroep: (mean_2 - mean_1) / mean_1 * 100%. Hoe kan ik een SE berekenen van deze percentuele toename?

Het is niet gebruikelijk om een SE te berekenen op deze 'procentuele' schaal (relatieve verandering). Reden hiervoor is dat als je bijvoorbeeld een 30% decrease zou hebben met een SE van 20%, je bij het doorrekenen naar een 95% betrouwbaarheidsinterval op 'rare' negatieve percentages (30% +/- 1,95*20%) uit zou komen. In het algemeen gebruik je de SE op een schaal waar je met redelijkheid kunt aannemen dat een normale verdeling geldt (om dezelfde reden wordt er bijvoorbeeld bij logistische regressie de SE vermeld bij de regressiecoëfficiënten en niet bij de odds ratio). Je kunt wel de SE berekenen op een getransformeerde schaal. In het bijzonder zou je hier de natuurlijk logaritme van de fold increase (de ratio van de twee gemiddelden) kunnen gebruiken:

.


De bijbehorende SE op deze schaal is (dit kun je berekenen met behulp van de delta methode):

.

Op deze getransformeerde schaal zou je wel berekeningen kunnen doen (bijvoorbeeld poolen van studieresultaten of berekenen van een 95% betrouwbaarheidsinterval voor beschrijving).


Vanaf de op deze schaal uitgerekende getallen kun je altijd weer terug transformeren naar een maat van relatieve verandering, met behulp van de volgende omzetting:

Hoe bereken ik de standard error van een standaarddeviatie?

De standard error van de schatting van een standaarddeviatie kan berekend worden als:

,

waarbij s de sample standaarddeviatie en n het aantal waarnemingen. Zie ook deze tutorial en het paper van Harding et al. 2014.

Referenties

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.