Soit une population de taille N sur laquelle est observée une caractéristique dont on connaît la moyenneet la variance . Lorsqu'on prélève un individu dans cette population le résultat observé est aléatoire et constitue donc une observation d'une v.a. X de moyenne et de variance .

 OBJECTIF:
Si on prélève n individus dans cette population, on obtient n valeurs x1, x2, ..., xn. Peut-on à priori avoir une idée de la manière dont seront distribuées ces n observations, quelle en sera la moyenne, la variance, etc...

On supposera que la taille de la population est infinie, ou que le taux de sondage est faible (n/N < 10 %).

La première observation x1 peut être considérée comme une observation d'une variable aléatoire X1 de même loi que X;
La deuxième observation x
2 peut être considérée comme une observation d'une variable aléatoire X2 de même loi que X;
...........
La nième observation x
n peut être considérée comme une observation d'une variable aléatoire Xn de même loi que X;

Définition: Les v.a. (X1, X2, ...., Xn) indépendantes et de même loi constituent un échantillon

Définition: Toute application définie sur l'échantillon est appelée statistique

Exemples de statistiques importantes:
est appelée moyenne d'échantillon

est appelée variance d'échantillon (ou encore quasi-variance ou variance corrigée d'échantillon pour éviter les confusions avec la variance de la population où la différence tient dans le dénominateur)

Remarque: malgré la similitude, ne pas confondre ces statistiques qui sont des v.a., donc des applications avec les valeurs prises par ces applications sur un ensemble de n individus qui sont des valeurs numériques.

 

1) MOYENNE d'échantillon

Soit (X1, X2, ..., Xn) un échantillon d'une v.a. X de loi quelconque.
Notons = E(X) = E(Xi) ; = V(X) = V(Xi)

2) FREQUENCE ou PROPORTION d'échantillon

C'est la statistique dans le cas particulier où les Xi suivent des lois de Bernouilli de paramètre p (c.à.d. prennent la valeur 1 avec une probabilité p et la valeur 0 avec une probabilité 1-p)

 

3) VARIANCE d'échantillon

Soit (X1, X2, ..., Xn) un échantillon d'une v.a. X de loi quelconque.
Notons = E(X) = E(Xi) ; = V(X) = V(Xi)

4) APPLICATION

Les résultats de ce chapitre permettent de répondre aux problèmes dits d'échantillonnage ou de contrôle:

La démarche de construction d'un intervalle contenant la caractéristique à contrôler est toujours la même.

t étant une observation de la caractéristique T à contrôler, on choisit une statistique f(T) dont on connaît la loi.
étant fixé, il est possible de trouver a et b tel que P[a < f(T) < b] = 1-
, ce qui est équivalent à représente l'application réciproque de f.
L'intervalle
appelé intervalle de contrôle contient la caractéristique à contrôler avec une probabilité 1-.
1- est appelé coefficient de confiance
est appelé seuil ou niveau

Remarques:
a) Pour n fixé, plus est grand, plus l'intervalle est petit, c.à.d. plus la fiabilité diminue, plus la précision augmente.
b) Pour fixé, plus n grandit, plus la précision augmente.

Dans la construction d'intervalles de contrôle, 3 éléments interviennent:
-
taille de l'échantillon
-
fiabilité du résultat représentée par le coefficient de confiance
-
précision du résultat représentée par l'amplitude de l'intervalle de confiance.
Les exercices se présentent toujours de la même manière: 2 des éléments ci-dessus sont donnés, et on demande de déterminer le 3°.

Le tableau ci-dessous envisage tous les cas auxquels vous pouvez être confrontés.

 Paramètre d'échantillon à contrôler

 loi de la population

 statistique

 loi
 moyenne normale ou quelconque avec n > 30    N(0 ; 1)
ou ~ N(0 ; 1)
               exemple 1
 variance s² normale

 
 à n-1 d.d.l.
               exemple 2
 proportion f n > 50  ~ N(0 ; 1)
               exemple 3