Yules Q

Uit testwiki
Naar navigatie springen Naar zoeken springen

In de statistiek is Yules Q een associatiemaat (maat van samenhang) tussen twee dichotome variabelen. De maat is ontwikkeld door George Udny Yule in 1900[1]. De variabelen kunnen echt dichotoom zijn (positief/negatief, ja/neen, man/vrouw, e.d.), of kunstmatig dichotoom (kleiner dan 5/gelijk aan of groter dan 5, onder het vriespunt/boven het vriespunt, e.d.).

Als X{x0,x1} en Y{y0,y1} de dichotome variabelen zijn, wordt het resultaat van een steekproef van n paren (Xi,Yi) gegeven door de aantallen:

N00: het aantal uitkomsten (x0,y0)
N01: het aantal uitkomsten (x0,y1)
N10: het aantal uitkomsten (x1,y0)
N11: het aantal uitkomsten (x1,y1)

De formule voor Yules Q luidt dan:

Q=N00N11N01N10N00N11+N01N10

De genoemde frequenties worden meestal aanschouwelijk voorgesteld in een kruistabel zoals hieronder.

Y=y0 Y=y1
X=x0 N00 N01
X=x1 N10 N11

In vereenvoudigde vorm wordt de tabel wel als volgt genoteerd:

Y=y0 Y=y1
X=x0 a b
X=x1 c d

De waarde van Yules Q varieert van −1 tot 1. Een waarde in de buurt van 0 duidt op geen of geringe samenhang tussen de variabelen. Een waarde in de buurt van 1 wijst op een zekere positieve samenhang, een waarde in de buurt van −1 op een zekere negatieve samenhang.

Bij kunstmatige binaire variabelen moet men ernaar streven de relatieve frequenties van elk van de twee mogelijkheden voor elke variabele in de buurt van 50% te nemen teneinde de betrouwbaarheid van Q zo hoog mogelijk te houden.

Yules Q tendeert tot overschatting van de graad van het verband tussen binaire variabelen te leiden en wordt derhalve in de praktijk weinig gebruikt.

Verband met andere associatiematen

De relatie tussen Yules Q en Yules Y, een andere associatiemaat, is gegeven door:

Q=2Y1+Y2

De relatie tussen Yules Q en de odds ratio (OR) wordt, mits deze bestaat, gegeven door:

Q=adbcad+bc=adbc1adbc+1=OR1OR+1

Yules Q is gelijk aan Goodman en Kruskals γ voor een 2×2-tabel.


Sjabloon:Appendix

  1. George Udny Yule, On the association of attributes in statistics, Phil.Trans.A, 194, 257--319, 1900.