3. Démonstrations mathématiques

Pour matheux...Quelques démonstrations à propos du test de Mann - Whitney.

Dans la suite on suppose de deux échantillons A(x1, x2...,xi...xn) et B(y1, y2...,yi...ym) d'effectifs n et m respectivement.

3.1 Démo. Ux+Uy=nm

\( Ux=\sum_{i=1}^{n} \sum_{j=1}^{m} (1~si~y_j < x_i~ou~0,5~si~y_j=x_i~sinon~0) \\ Uy=\sum_{j=1}^{m} \sum_{i=1}^{n} (1~si~x_i < y_j~ou~0,5~si~x_i=y_j~sinon~0) \\ Ux+Uy = \sum_{i=1}^{n} \sum_{j=1}^{m} (1~si~y_j < x_i~ou~0,5~si~y_j=x_i~sinon~0) + \sum_{j=1}^{m} \sum_{i=1}^{n} (1~si~x_i < y_j~ou~0,5~si~x_i=y_j~sinon~0)\\ Ux+Uy = \sum_{i=1}^{n} \sum_{j=1}^{m} (1~si~y_j < x_i~ou~0,5~si~y_j=x_i~sinon~0) + \sum_{j=1}^{m} \sum_{i=1}^{n} (1~si~y_j > x_i~ou~0,5~si~x_i=y_j~sinon~0)\\ Ux+Uy = \sum_{i=1}^{n} \sum_{j=1}^{m} ((1~si~y_j < x_i~ou~0,5~si~y_j=x_i~sinon~0)~et~(1~si~y_j > x_i~ou ~0,5~si~y_j=x_i~sinon~0 ))\\ \)

Ainsi, on ajoute 1 si yj<xi, mais aussi 1 si yj>xi et 0,5+0,5=1 en cas d'égalité. Donc on obtient :

\( Ux+Uy = \sum_{i=1}^{n} \sum_{j=1}^{m} 1 = nm \)

3.2 Démo. de la relation Ux=Wx-n(n+1)/2

On suppose que les xi ont été ordonnés : x1<x2<x3 ... et de même pour les yi et on va donner la démonstration dans les cas où il n'y a pas d'ex-aequo.

On réalise le rangement des xi et yi par ordre croissant. On appelle R1 le rang de x1 (le plus petit des xi) dans cette suite, R2 celui de x2 (le 2° plus petit des xi), R3 celui de x3, ... Rn celui de xn (le plus grand des xi).

En se rappelant la définition même de Ux, on en déduit R1+R2+...+Rn=Ux+1+2+...+n

En se rappelant la définition même de Wx (somme des rangs des xi), on en déduit Wx = Ux + 1+2+...+n

Soit Ux = Wx + n(n+1)/2

Remarque. En cas d'ex-aequo, comme on traite les ex-aequo en rang moyen, ça ne change rien à la formule ci-dessus.

3.3 Démo. Ux ∈ [0,nm] et E(Ux) = nm/2 (même chose pour Uy) et U ∈ [0,nm/2]

On va raisonner avec Wx.

Le cas où tous les xi sont inférieurs à tous les yj donne la valeur minimale de Wx soit 1+2+...+n = n(n+1)/2

Le cas où tous les xi sont supérieurs à tous les yj donne la valeur mximale de Wx soit (m+1)+(m+2)+...+(m+n) = nm+n(n+1)/2

On vient de voir en $3.2 que Ux = Wx + n(n+1)/2. On en déduit Ux ∈ [0,nm]

 

Le test est construit sous l'hypothèse H0 que tous les individus xi et yj proviennent de la même population. Ux et Uy ont donc la me loi de probabilité et donc la même espérance. On a vu en $3.1 que Ux+Uy=nm. Donc E(Ux+Uy)=nm. Mais on vient de voir que E(Ux)=E(Uy). Donc E(Ux)=E(Uy)=nm/2.

 

Par définition U=min(Ux,Uy). Raisonnons par l'absurde en supposant U<nm/2. On aurait donc Ux+Uy <2(nm)/2=nm. Or on a vu en $3.1 que Ux+Uy=nm. Il y a contradiction.

3.4 Comment construire une table de proba. de Mann-Withney. Exemple de calculs de probabilités pour Ux (ou Uy)

Cas à 2 échantillons (indépendants) d'effectifs 5.

On va se placer dans le cas de deux échantillons A(x1, x2,x3, x4, x5) et B(y1, y2, y3, y4, y5) d'effectifs 5 (n=m=5).

Sous l'hypothèse H0 de 2 tirages de 5 dans une même population parente, il y 10! possibilités de rangements et ces 10! possibilités sont alors équiprobables. 10! = 3 628 800. On a donc 3 628 800 cas possibles de rangements, équiprobales, sous H0.

Calcul de p(Ux=0)

Il est plus facile de travailler avec la somme des rangs de l'échantillon A (Wx) que la variable Ux, donc on va utiliser la propriété Wx = Ux + n(n+1)/2. Appliqué à notre cas, cela donne W = U + 5*6/2 = U + 15.

Donc p(Ux=0) ⇔ p(Wx=15)

Une seule possibilité pour obtenir une somme de rangs à 15 : {1,2,3,4,5} : 1+2+3+4+5 = 15. Tous les xi doivent être plus petits que tous les yi !

Ok, mais on a alors 5! permutations possibles pour attribuer les xi dans cet ensemble (puisqu'ils sont 5 à ranger) et pour chacune des attributions 5! permutations possibles des yi (5 yi à ranger "au-dessus" des yi).

Conclusion pour p(Ux=0), on a 5!5! cas favorables pour 10! cas possibles.

p(Ux=0)=5!5!/10! = 120*120/30628 800 = 0,003968 = 0,004

Calcul de p(Ux≤1)

p(Ux≤1) ⇔ p(Wx≤16)

Il faut donc trouver toutes les sommes de rangs possibles pour obtenir 15 ou 16 (avec 5 éléments rangés).

Pour faire 15, une seule addition possible, on l'a vu : 1+2+3+4+5

Pour faire 16, on a 1+2+3+4+6 et rien d'autre.

Ok, mais "à chaque addition qui va bien" on a 5! permutations possibles pour attribuer les xi (puisqu'ils sont 5 à ranger) et pour chacune des attributions 5! permutations possibles des yi qui vont être rangés dans chaque série.

Conclusion pour p(Ux≤1), on a 2 fois (5!5! cas favorables pour 10! cas possibles).

p(Ux≤1)=2*(5!5!/10!) = 2*(120*120/30628 800) = 0,007937 = 0,008

Calcul de p(Ux≤2)

p(Ux≤2) ⇔ p(Wx≤17)

Il faut donc trouver toutes les sommes de rangs possibles pour obtenir 15 ou 16 ou 17 (avec 5 éléments rangés).

Pour faire 15, une seule addition possible, on l'a vu : 1+2+3+4+5

Pour faire 16, une seule addition possible, on l'a vu : 1+2+3+4+6.

Pour faire 17, deux possibilités et deux seulement : 1+2+3+4+7 et 1+2+3+5+6.

Ok, mais "à chaque addition qui va bien" on a 5! permutations possibles pour attribuer les xi (puisqu'ils sont 5 à ranger) et pour chacune des attributions 5! permutations possibles des yi qui vont être rangés dans chaque série.

Conclusion pour p(Ux≤2), on a 4 fois (5!5! cas favorables pour 10! cas possibles).

p(Ux≤2)=4*(5!5!/10!) = 4*(120*120/30628 800) = 0,00159 = 0,016

Calcul de p(Ux≤3)

p(Ux≤3) ⇔ p(Wx≤18)

Il faut donc trouver toutes les sommes de rangs possibles pour obtenir 15 ou 16 ou 17 ou 18(avec 5 éléments rangés).

Pour faire 15, une seule addition possible, on l'a vu : 1+2+3+4+5

Pour faire 16, une seule addition possible, on l'a vu : 1+2+3+4+6.

Pour faire 17, deux possibilités et deux seulement : 1+2+3+4+7 et 1+2+3+5+6.

Pour faire 18, trois possibilités et trois seulement : 1+2+3+4+8 et 1+2+3+5+7 et 1+2+4+5+6.

Ok, mais "à chaque addition qui va bien" on a 5! permutations possibles pour attribuer les xi (puisqu'ils sont 5 à ranger) et pour chacune des attributions 5! permutations possibles des yi qui vont être rangés dans chaque série.

Conclusion pour p(Ux≤2), on a 7 fois (5!5! cas favorables pour 10! cas possibles).

p(Ux≤2)=7*(5!5!/10!) = 7*(120*120/30628 800) = 0,0277 = 0,028. On dépasse déjà le seuil unilatéral 2,5% soit le seuil bilatéral 5%.

Calcul de p(Ux≤4)

p(Ux≤4) ⇔ p(Wx≤19)

Il faut donc trouver toutes les sommes de rangs possibles pour obtenir 15 ou 16 ou 17 ou 18 ou 19(avec 5 éléments rangés).

Pour faire 15, une seule addition possible, on l'a vu : 1+2+3+4+5

Pour faire 16, une seule addition possible, on l'a vu : 1+2+3+4+6.

Pour faire 17, deux possibilités et deux seulement : 1+2+3+4+7 et 1+2+3+5+6.

Pour faire 18, trois possibilités et trois seulement : 1+2+3+4+8 et 1+2+3+5+7 et 1+2+4+5+6.

Pour faire 19, cinq possibilités et cinq seulement : 1+2+3+4+9 et 1+2+3+5+8 et 1+2+3+6+7 et 1+2+4+5+7 et 1+3+4+5+6.

Ok, mais "à chaque addition qui va bien" on a 5! permutations possibles pour attribuer les xi (puisqu'ils sont 5 à ranger) et pour chacune des attributions 5! permutations possibles des yi qui vont être rangés dans chaque série.

Conclusion pour p(Ux≤2), on a 12 fois (5!5! cas favorables pour 10! cas possibles).

p(Ux≤2)=7*(5!5!/10!) = 12*(120*120/30628 800) = 0,0476 = 0,048. Ca y est, on atteint le seuil 5% unilatéral...

retour en haut de page