Cramérs V

Uit testwiki
Naar navigatie springen Naar zoeken springen

Cramérs V is een door de Zweedse wiskundige en statisticus Harald Cramér ontwikkelde associatiemaat voor twee categorische variabelen, dus variabelen die slechts op nominale schaal gemeten zijn.

Populatie

De simultane verdeling van de beide variabelen A en B wordt gegeven door de kansen

pij=P(A=Ai,B=Bj),i=1,,r;j=1,,k

De χ2-grootheid die de simultane kansen vergelijkt met de kansen bij onafhankelijkheid, is:

χp2=i,j(pijpipj)2pipj=i,jpij2pipj1

Daarin is

pi=jpij

en analoog

pj=ipij

Bij statistische onafhankelijkheid tussen beide variabelen geldt:

pij=pipj;

dus:

χp2=0

Bij volledige samenhang tussen de beide variabelen zijn er evenveel rijen als kolommen ( r=k) en is (eventueel na herschikking):

pii=pi=pi

en

pij=0,ij,

zodat:

χp2=k1

Voor de populatie is Cramérs V de parameter:

Vp=χp2min(r1,k1),

met een waarde minimaal 0 bij onderlinge onafhankelijkheid en maximaal 1 bij volledige samenhang.

Steekproef

De parameter Vp kan geschat worden op basis van een steekproef uit de simultane verdeling van de variabelen A en B. De steekproef is gegeven in de vorm van de kruistabel met r rijen en k kolommen en waargenomen frequenties (nij) van de uitkomsten (Ai,Bj). Een geschikte schatter is de steekproeffunctie, die ook aangeduid wordt als Cramérs V:

V=χ2/nmin(r1,k1)

Daarin is χ2 de chi-kwadraatgrootheid:

χ2=i,j(nijninjn)2ninjn=ni,j(nijnninjn2)2ninjn2,

met (ni) en (nj) respectievelijk de rij- en kolomsommen en n de steekproefomvang, dus ook de totale som.

De steekproeffuncie V kan ook gebruikt worden als toetsingsgrootheid.

Zie ook