Hypergeometrische verdeling

Uit testwiki
Naar navigatie springen Naar zoeken springen

In de kansrekening is de hypergeometrische kansverdeling een discrete kansverdeling die de kansen geeft op de aantallen successen bij een vast aantal trekkingen zonder terugleggen uit een eindige populatie. Het is het analogon van de binomiale verdeling als er sprake is van een steekproef zonder terugleggen. De kansen op succes en mislukking veranderen dus per trekking en zijn afhankelijk van vorige uitkomsten.

Definitie

In een serie van n aselecte trekkingen zonder terugleggen uit een eindige populatie ter grootte N, waarin M successen en NM mislukkingen zijn, wordt de kans op m successen voor m=0,1,,n gegeven door:

p(m)=(Mm)(NMnm)(Nn).

Als de stochastische variabele X het aantal successen bij de n trekkingen voorstelt, geldt:

P(X=m|N,M,n)=p(m)

en zegt men dat X hypergeometrisch verdeeld is met parameters N,M en n.

Verwachtingswaarde en variantie

De verwachtingswaarde van een hypergeometrisch verdeelde stochastische variable X is:

E(X)=nMN

De variantie is:

var(X)=nMN(1MN)NnN1

De variantie verschilt een factor

NnN1

van de variantie in het geval van trekken met terugleggen of bij trekken uit een oneindige populatie met succeskans p=M/N. De wortel uit deze factor

NnN1

heet eindige populatie-correctiefactor of correctiefactor voor eindige populatie.

Voorbeeld

Stel in een bak bevinden zich 5 blauwe en 4 rode ballen. Er worden willekeurig 3 ballen uit de bak gepakt. Hoe groot is de kans dat er (precies) twee blauwe ballen bij die 3 zijn?

In dit geval is N=9,M=5 en n=3. De kans op m=2 blauwe ballen is dus:

P(X=2|9,5,3)=(52)(41)(93)=10484=0,476

Op eenzelfde manier kunnen de kansen op 0 blauwe ballen (4.8%); 1 blauwe bal (35.7%) en 3 blauwe ballen (11.9%) bepaald worden.

Sjabloon:Navigatie kansverdelingen