Wie heeft het antwoord op mijn vraag over de berekening van de populatie- en steekproefvariantie?

Dirk, 58 jaar
28 februari 2017

Bij de berekening van de populatievariantie in de statistiek deelt men door n (met n = het aantal populatie-elementen), wat logisch is. Bij de berekening van de steekproefvariantie deelt men echter door slechts (n - 1). Van waar dit verschil in berekeningswijze?

Antwoord

Beste Dirk, 

Hieronder een poging tot een kort intuïtief antwoord. 

De bedoeling is uit een (beperkte) steekproef toch een betrouwbare schatter voor de populatieparameter te berekenen. Het betreft hier de gemiddelde som van de kwadraten van de afwijkingen t.o.v. de centrale waarde. 

Het probeem is dat om geheel correct te zijn, je daarvoor in principe de populatiewaarde voor de centrale waarde zou moeten gebruiken, maar die is dus niet gekend. 

Bij het berekenen van de steekproefvariantie wordt daarvoor dus de gemiddelde waarde als schatter voor de populatieparameter gebruikt. Je gebruikt dan echter eigenlijk twee keer dezelfde steekproefgegevens om eerst een schatter voor de centrale waarden, en vervolgens hiermee de gemiddelde kwadratensom te berekenen. Zonder bijkomende correctie leidt dit tot een zogenaamde onzuivere schatter. Je kunt dit bekijken als een soort ingebouwde terugkoppeling van de eerste schatter op de tweede. Om te corrigeren voor het verlies van 1 vrijheidsgraad voor de berekening van het gemiddelde zelf, wordt de kwadratensom uitgemiddeld over de resterende n-1 vrijheidsgraden. 

Voor een vollediger statistische verantwoording verwijs ik naar statistische vakliteratuur omtrent het gebruik van de Student t-distributie

 

Philippe J. Roussel

Senior Reliability Research Engineer

imec

Reacties op dit antwoord

Er zijn nog geen reacties op deze vraag.

Enkel de vraagsteller en de wetenschapper kunnen reageren op een antwoord.

Zoek andere vragen

© 2008-2020
Ik heb een vraag wordt gecoördineerd door het
Koninklijk Belgisch Instituut voor Natuurwetenschappen