Stelling van Cochran

Uit testwiki
Naar navigatie springen Naar zoeken springen

De stelling van Cochran is in de statistiek een stelling die voornamelijk toegepast wordt in de variantie-analyse. De stelling is geformuleerd door de Schotse wiskundige William Gemmell Cochran.

In de variantie-analyse wordt veelvuldig een som van kwadraten uiteengelegd in andere kwadraatsommen zoals in het volgende voorbeeld. Stel X1, ..., Xn is een aselecte steekproef uit een normale verdeling met verwachtingswaarde μ en standaardafwijking σ. Dan kan geschreven worden:

i=1n(Xiμ)2=i=1n(XiX¯+X¯μ)2=
=i=1n(XiX¯)2+i=1n(X¯μ)2+2i=1n(XiX¯)(X¯μ)=
=i=1n(XiX¯)2+i=1n(X¯μ)2

Deelt men beide leden door σ2 dan ontstaat:

i=1n(Xiμσ)2=i=1n(XiX¯σ)2+n(X¯μσ)2,

een uitdrukking waarvan het linkerlid bestaat uit de som van kwadraten van standaardnormaal verdeelde toevalsvariabelen, en het rechterlid bestaat uit twee termen waarvan elk de som van kwadraten is van lineaire combinaties van de toevalsvariabelen uit het linkerlid.

De stelling van Cochran gaat over zulke uitdrukkingen.

Stelling

Zij Z1, ..., Zn onderling onafhankelijke, standaardnormaal verdeelde toevalsvariabelen en

i=1nZi2=Q1++Qk,

waarin elke Qi de som is van kwadraten van lineaire combinaties van de Z 's, waarvoor geldt dat de som van de rangen van de Q 's gelijk is aan n. D.w.z. als ri de rang is van Qi, wordt verondersteld dat:

r1++rk=n.

De stelling van Cochran zegt nu dat Q1, ..., Qk onderling onafhankelijk zijn en elke Qi chi-kwadraatverdeeld is met ri vrijheidsgraden.

NB. De kwadraatsom Qi kan geschreven worden als de kwadratische vorm:

Qi=ZTAiZ,

waarin Z de vector is van de Z 's en A een n×n-matrix is. De rang van Qi is de rang van de matrix Ai

Alternatieve formulering

Zij Z1, ..., Zn onderling onafhankelijke, standaardnormaal verdeelde toevalsvariabelen en A1, ..., Ak symmetrische n×n-matrices waarvoor geldt:

A1++Ak=In.

Noem ri=rang(Ai), dan impliceert elk van de volgende uitspraken de overige twee.

  • r1++rk=n
  • 1σ2ZTAiZ is chi-kwadraatverdeeld met ri vrijheidsgraden (Ai is dus positief semidefiniet)
  • ZTAiZ en ZTAjZ zijn onderling onafhankelijk voor ij

Voorbeeld

In het voorbeeld hierboven is de rang van

Q1=n(X¯μσ)2=ZTA1Z

gelijk aan 1, en de rang van

Q2=i=1n(XiX¯σ)2=ZTA2Z

gelijk aan n1 zodat aan de voorwaarden van de stelling voldaan is. In deze uitdrukkingen is:

Zi=Xiμσ,
A1=[1n1n1n1n1n1n1n1n1n]

en

A2=InA1

Volgens de stelling zijn beide uitdrukkingen dus onderling onafhankelijk en elk chi-kwadraatverdeeld, met respectievelijk 1 en n1 vrijheidsgraden. Dit betekent onder meer dat voor een aselecte steekproef uit een normale verdeling, het steekproefgemiddelde en de steekproefvariantie onderling onafhankelijk zijn.