Petite excursion dans l'univers de la métrologie pour étudiants en BTS Biotechnologies

Ce que ce chapitre propose

La progression est organisée autour d'exercices pratiques.

Le contenu couvre le programme du BTS biotechnologies.


Préalable. Ce qu'il faut savoir en "proba. statistiques" avant de commencer.

0.1 Histogramme de distribution

Soit une distribution de n valeurs yi. On peut les organiser pour les représenter en histogramme de distribution.

Pour cela il faut :

Voici un exemple.

histogramme exemple

retour en haut de page


0.2 Moyenne, variance, écart-type, population, échantillon

On suppose une distribution n valeurs yi.

Les valeurs collectées concernent la population entière

Les valeurs collectées sont un échantillon

$$ moyenne = \overline{y}=\cfrac { \sum\limits_{n=1}^{n} {y_i}} {n} $$

Si les n valeurs collectées ne sont qu'un échantillon d'une population (qui peut être infinie), la moyenne des valeurs collectées n'est qu'une estimation de la moyenne de la population

$$ Estimation~de~moyenne = \overset {\sim}{y}=\cfrac { \sum\limits_{n=1}^{n} {y_i}} {n} $$
$$ variance = V(y) = \cfrac {1} {n} \sum\limits_{n=1}^{n} {(y_i - \overline {y})^2} $$

La variance est un indicateur de dispersion des valeurs : elle est toujours positive, ne s’annule que pour une série statistique dont tous les termes ont la même valeur, est d’autant plus grande que les valeurs sont étalées et est invariante par ajout d’une constante. Et elle a l'avantage d'être cumulative (voir ci-après).

Fonction VAR.P avec un tableur.

Si on a un échantillon et que la moyenne de la population n'est pas connue, c'est à dire qu'on ne connaît qu'une estimation de la moyenne grâce à l'échantillon alors :

$$ Estimation~non~biaisée~de~variance \\ = \overset {\sim} {V(y)} = \cfrac {1} {n-1} \sum\limits_{n=1}^{n} {(y_i - \overset {\sim} {y})^2} $$

Fonction VAR avec un tableur.

$$ Ecart-type = \sigma = \sqrt {V(y)} = \sqrt {\cfrac {1} {n} \sum\limits_{n=1}^{n} {(y_i - \overline {y})^2}} $$

L'écart-type est l'indicateur de dispersion le plus "parlant" car il s'exprime dans l'unité des valeurs de la série statistique.

Attention. Dès qu'on a des calculs à réaliser, faut travailler avec les variances (faciles à combiner) et seulement en fin de calculs passer en écart-type.

Fonction ECARTYPE.P avec un tableur.

$$ Estimation~non~biaisée~d'écart-type \\ = s = \sqrt { \overset {\sim} V(y)} = \sqrt {\cfrac {1} {n-1} \sum\limits_{n=1}^{n} {(y_i - \overset {\sim} {y})^2}} $$

Fonction ECARTYPE avec un tableur.

On doit souvent combiner des variables aléatoires. On retiendra :

retour en haut de page

0.3 Distributions sur ℜ, loi normale

Si on imagine un histogramme avec énormément de valeurs, on pourrait construire un histogramme en fréquence avec un nombre immense de classes qui couvriraient des intervalles tout petit. Si on s'imagine tendre vers l'infini (et au-delà) on "voit" que l'histogramme va tendre vers une courbe "lisse" : on des probabilité sur ℜ.

la fonction densité de probabilité s'utilise et se "visualise" ainsi (et c'est fondamental de bien le comprendre)

Soit p(x,δx) la probabilité que la variable aléatoire soit située entre x - δx et x + δx ; on a :

$$ p(x,\delta x) = \int_{x-\delta x}^{x + \delta x} f(x) dx $$
densité de probabilité

La surface de la zone en hachurée sur le schéma représente la probabilité que la variable x soit comprise entre x + δx et x - δx.
Evidemment, la surface totale inscrite sous la courbe est égale à 1.

La loi de distribution normale (Laplace et Gauss) est la distribution sur ℜ à connaître ! Elle est symétrique centrée sur sa moyenne et on ne peut pas ne pas savoir que l'intervalle moyenne ± 2 écart-type correspond à une probabilité de 0,95. (La valeur exacte n'est pas 2 mais 1,96 ...).

retour en haut de page