2. Estimateur non biaisé de la variance


La loi normale parente est de moyenne µ et d'écart-type σ. Soit V(X) sa variance, V(X)=σ2


• (s)2=Σ(xi-m)2/(n-1) est un estimateur sans biais de V(X)=(σ)2     (ce qui signifie que l'espérance de (s)2 est égale à (σ)2 : E((s)2)=(σ)2)


Très souvent l'origine du n-1 reste un mystère ... pourquoi pas n qui correspondrait à l'effectif de l'échantillon ? La raison vous en est donnée si vous lisez la suite.
Dans cette suite on montre que Σ(xi-m)2/(n) est un estimateur biaisé de (σ)2 car l'espérance de Σ(xi-m)2/(n) n'est pas (σ)2 mais (σ)2*(n-1)/n.


Origine du n-1 dans les variances expérimentales, un peu de maths :

Soit un estimateur de variance à partir d'un échantillon qui utiliserait la formule variance estimée vb =Σ(xi-m)2/n

Comme Σ(xi - m)2 = Σ(xi)2-(Σxi)2/n , on peut écrire :

vb =Σ(xi-m)2/n = (1/n)*Σ(xi)2 - Σxi)2/(n*n) = (1/n)*Σ(xi)2 - m2

Et on va alors pouvoir calculer l'espérance de vb E(vb).

E(vb) = E[(1/n)*Σ(xi)2 - m2]

devient E(vb) = E[(1/n)*Σ(xi)2] - E[m2]

devient E(vb) = (1/n)*E[Σ(xi)2] - E[m2]

devient E(vb) = (1/n)*n*E[(xi)2] - E[m2]

devient E(vb) = E[(xi)2] - E[m2]

Comme on sait que pour une variable aléatoire y : V(y)=E[(y-E(y))2] = E(y2)-(E(y))2 on a la relation E(y2) = (E(y))2 + V(y).
On peut appliquer cette relation à nos affaires et il vient :

E(vb) = [(E(xi))2 + V(xi)] - [(E(m))2 + V(m)]

Comme E(m)=E(X) et comme V(m)=(1/n)(V(X)) on va écrire :

E(vb) = [(E(X))2 + V(X)] - [(E(X))2 + (1/n)*V(X)]

E(vb) = V(X)] - (1/n)*V(X) = V(X)*(n-1)/(n)

Conclusion : l'espérance d'une variance qui serait calculée par Σ(xi-m)2/n n'est pas V(X) mais V(X)*(n-1)/(n). Donc pour avoir un estimateur non biaisé de la variance V(X) de la loi parente il faut Σ(xi-m)2/(n-1). CQFD.