Scheefheid

Uit testwiki
Naar navigatie springen Naar zoeken springen
Voorbeeld van rechtsscheef verdeelde data

In de statistiek is scheefheid (Engels: skewness) een maat voor asymmetrie van een kansverdeling.

Definitie

De scheefheid γ1 is het derde gestandaardiseerde moment, mits dit bestaat, van de kansverdeling:

γ1=μ3σ3

Hierin is μ3 het derde centrale moment en σ de standaardafwijking. De scheefheid kan dus ook geschreven worden als

γ1=E[(Xμ)3](E[(Xμ)2])3/2

met X een stochastische variabele verdeeld volgens de gegeven kansverdeling en μ=EX de verwachtingswaarde daarvan.

Een symmetrische verdeling heeft een scheefheid γ1=0. Voorbeelden van symmetrische verdelingen zijn de normale verdeling, de uniforme verdeling (discreet en continu) en de binomiale verdeling met succeskans p=1/2.

Een verdeling heet rechtsscheef, als deze aan de rechterkant een langere en zwaardere staart heeft dan aan de linkerkant. Bij deze verdeling is de mediaan kleiner dan de verwachtingswaarde. Deze benaming is enigszins verwarrend, omdat dit automatisch inhoudt dat de meeste massa zich juist links van de verwachtingswaarde bevindt (zie grafiek). Voor zo'n verdeling geldt dat γ1>0. Een voorbeeld van een rechtsscheve verdeling is de Gamma-verdeling. Voor de Γ(k,θ)-verdeling geldt dat γ1=1/2k.

Als de zwaardere staart zich aan de linkerkant bevindt, heet de verdeling linksscheef. Voor zo'n verdeling geldt dat γ1<0. Een voorbeeld van een linksscheve verdeling is de Beta(1,0)-verdeling met de kansdichtheid f(x)=1/(1x)(0<x<1), en scheefheid γ1=0,94.

Steekproef

De scheefheid van een verdeling kan aan de hand van de uitkomst x1,,xn van een aselecte steekproef geschat worden door de momentschatter:

g1=ni=1n(xix¯)3(i=1n(xix¯)2)3/2,

waarin x¯ het steekproefgemiddelde is. Omdat deze schatter geen zuivere schatter is, dat wil zeggen Eg1γ1, wordt in praktijk meestal de volgende, wel zuivere, schatter gebruikt

G1=n(n1)n2g1

Andere maten van asymmetrie

Karl Pearson suggereerde twee asymmetrie-maten die eenvoudiger te berekenen zijn:

Deze maten zijn echter minder gebruikelijk geraakt sinds de opkomst van de computer, die het berekenen van de gewone scheefheidsmaat vergemakkelijkte.

Sjabloon:Navigatie beschrijvende statistiek