Variantie

Uit testwiki
Naar navigatie springen Naar zoeken springen
Voorbeeld voor twee verzamelingen van 19 getallen (0, 5, ..., 90 en 0, 37, 38, ..., 53, 90).

De variantie is in de statistiek een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken.

De variantie meet min of meer het gemiddelde van het kwadraat van deze afwijkingen. Die waarden kunnen de waarden van een populatie zijn, dan spreekt men van de populatievariantie. Betreft het de waarden van een verdeling, dan is de variantie een maat voor de "breedte" van deze verdeling, en spreekt men meestal gewoon van de variantie van deze verdeling. Is de betrokken verdeling de kansverdeling van een stochastische variabele X, dan spreekt men over de variantie van X.

Betreft het de uitkomsten van een steekproef, dan spreekt men van steekproefvariantie.

De populatievariantie is een parameter (eigenschap) van de populatie; de steekproefvariantie s2 is een steekproeffunctie, een schatter van de populatievariantie. De wortel uit de variantie wordt standaardafwijking, standaarddeviatie of spreiding genoemd.

Populatie

De formule voor de populatievariantie, meestal aangeduid met σ2 is:

σ2=1Ni=1N(xiμ)2

met μ het populatiegemiddelde, N de populatieomvang, en x1,,xN de populatie-elementen.

Er is een kortere rekenformule:

σ2=1Ni=1Nxi2μ2

Deze wordt als volgt afgeleid:

(xiμ)2=(xi22xiμ+μ2)=xi22μxi+μ2=xi22μNμ+Nμ2=
=xi2Nμ2

Links en rechts delen door N geeft het gezochte resultaat.

Bij het werpen met een (eerlijke) dobbelsteen kunnen de ogenaantallen 1 t/m 6 met gelijke kans van 1/6 als uitkomst optreden. Het verwachte ogenaantal (populatiegemiddelde) van een worp is daarom:

μ=161+162+163+164+165+166=312

De mogelijke afwijkingen van het verwachte ogenaantal zijn:

1312=212
2312=112
3312=12
4312=12
5312=112
6312=212

die elk met kans 1/6 voorkomen. De (populatie)variantie σ2 is dus:

σ2=16(212)2+16(112)2+16(12)2+16(12)2+16(112)2+16(212)2=3512.

De (populatie)standaardafwijking σ is dan:

σ=35121,71,

een waarde tussen de mogelijke positieve afwijkingen.

Steekproef

Om de variantie in een populatie of kansverdeling te berekenen, zijn alle waarden nodig. Vaak zijn die echter niet beschikbaar en wordt de variantie geschat aan de hand van een aselecte steekproef. Men berekent als schatting de steekproefvariantie, aangeduid door s2 en gedefinieerd door:

s2=1n1i=1n(xix¯)2

Hierin is n de steekproefgrootte, xi de steekproefelementen en x¯ het steekproefgemiddelde.

Ook voor s2 is er een praktischer rekenformule:

s2=1n1xi2nn1x¯2

Het voordeel van deze versie dat men bij het verwerken van de steekproefresultaten het gemiddelde en de variantie in een moeite door kan berekenen (met de eerste formule zou men de reeks waarden tweemaal langs moeten lopen).

De zo gedefinieerde steekproefvariantie is een zogeheten zuivere schatter van de variantie. Dat houdt in dat bij veel herhalingen, het gemiddelde van de schattingen convergeert naar de te schatten variantie.

In de Nederlandse statistische terminologie wordt echter ook de schatter:

sn2=1ni=1n(xix¯)2

als steekproefvariantie aangeduid. Deze schatter die daadwerkelijk het gemiddelde van de kwadratische afwijkingen van het steekproefgemiddelde berekent, kan opgevat worden als de populatievariantie van de steekproef als populatie. Zoals gemakkelijk te zien is, scheelt deze schatter slechts een factor (n1)/n van de eerder genoemde. Praktisch gezien, en zeker als de steekproefomvang s2 groot is, is er weinig verschil tussen beide schatters. De schatter sn is natuurlijk niet meer zuiver. Echter is het de zogenaamde meest aannemelijke schatter van de variantie in het geval van een normale verdeling.

Omdat zowel zuiverheid als meest aannemelijkheid van een schatter theoretisch belangrijke eigenschappen zijn, heeft verschil van opvatting daarover tussen de hoogleraren statistiek destijds, ertoe geleid dat beide schatters de naam steekproefvariantie hebben.

Voorbeelden

Voorbeeld 1

Gooien we 10 keer met de 6 kantige dobbelsteen, met als resultaat de ogenaantallen:

3, 5, 3, 1, 6, 4, 1, 3, 2, 4,

dan is het steekproefgemiddelde:

x¯=110(3+5+3+1+6+4+1+3+2+4)=3,2

De afwijkingen van het gemiddelde ogenaantal zijn:

33,2=0,2
53,2=+1,8
33,2=0,2
13,2=2,2
63,2=+2,8
43,2=+0,8
13,2=2,2
33,2=0,2
23,2=1,2
43,2=+0,8

De (steekproef)variantie is dus:

s2=19((0,2)2+1,82+(0,2)2+(2,2)2+2,82+0,82+(2,2)2+(0,2)2+(1,2)2+0,82)2,62

en de (steekproef)standaardafwijking s is:

s2,621,62

Voorbeeld 2

Een steekproef ter grootte van n=5 levert de resultaten 1, 2, 3, 4, 5. Dus x¯=3. De variantie is

s2=151((13)2+(23)2+(33)2+(43)2+(53)2)=14(4+1+0+1+4)=212

en de (steekproef)standaardafwijking s is:

s=2,51,58

Kansverdeling

Als de populatieverdeling gegeven is als kansverdeling van een stochastische variabele X, is de variantie (van X) gedefinieerd als de verwachtingswaarde van de kwadratische afwijkingen van de verwachtingswaarde van X:

var(X)=E[(XE[X])2].

Ook hier is weer een alternatieve rekenformule:

var(X)=E[X2]E[X]2.

Analogie

In de mechanica is het analogon van de variantie het traagheidsmoment van een voorwerp, dus van een massaverdeling.

Het elektrische vermogen van een zuivere wisselstroom, dus gemiddeld 0, is evenredig met het gemiddelde kwadraat van de spanning, dus een constante maal de variantie van dat signaal.

Zie ook

Sjabloon:Navigatie beschrijvende statistiek