qq
Elément de statistiques et de probabilités
sommaire - retour - suite

Sommaire

1. Statistique descriptive

1.1 Vocabulaire
1.2 Représentation d'une variable discrète
1.3 Représentation d'une variable continue
1.4 Caractéristiques
1.5 Fréquences cumulées
1.6 Statistiques à deux variables
1.7 Interprétation de la répartition

2. Probabilité

2.1 Probabilité sur la loi normale
2.2 Loi normale centrée réduite
2.3 Probabilité sur la loi normale centrée réduite
2.4 Utilisation d'un tableau pour calculer une probabilité quelconque


Eléments de statistiques et de probabilités

En science physique ou en industrie, on peut-être amené à répéter une même mesure un grand nombre de fois.

Exemples :

- vérification d'une cote dans une fabrication sérielle ou pré-sérielle en vue de valider l'outil ou le montage de fabrication.

- réalisation d'un contrôle qualité à la réception ou avant la livraison de pièces industrielles.

- répétabilité d'un phénomène physique pour valider une loi.

Le cours qui suit donne les éléments de base qui permettront dans la plupart des cas d'exploiter de telles mesures.

Partie 1 : statistique descriptive

1.1. Vocabulaire

population : l'ensemble des objets sujets de la mesure ou de l'étude (personnes, série de pièces, ...)

échantillon : nombre représentatif d'une population lorsque celle-ci est trop grande. Les statistiques seront alors réalisés sur l'échantillon.

individu : un élément de la population

variable statistique : caractère des individus sur lequel porte l'étude statistique (âge, taille, cote, ...)

caractère quantitatif : le caractère est mesurable (âge, taille, cote, ...)

caractère qualitatif : il n'est pas mesurable (sexe, couleur, ...) ; il faut alors le quantifier (sexe : H=0, F=1)

variable discrète : le caractère ne prend que des valeurs précises ou déterminées (c'est le cas des caractères qualitatifs)

variable continue : le caractère peut avoir n'importe quelle valeur dans un intervalle déterminé.

effectif total : nombre total N d'individus de la population ou de l'échantillon.

fréquence : nombre d'individus possédant une valeur déterminée d'un caractère, divisé par l'effectif total.

1.2. Représentation d'une variable discrète

valeurs du caractère x1 x2 ... xp
effectifs n1 n2 ... np
fréquences n1/N n2/N ... np/N

On représente les différentes fréquences d'une variable discrète sous forme de diagramme bâton.

ou de camembert.

On peut représenter les effectifs ou les fréquences.

1.3. Représentation d'une variable continue

Une variable continue pouvant prendre une infinité de valeurs, il faut les regrouper dans des classes (intervalles) adjacentes.

Classes [X0 ; X1[ [X1 ; X2[ ... [Xp-1 ; Xp[
largeur de classe X1-X0 X2-X1 ... Xp-Xp-1
Centre des classes x1 x2 ... xp
effectifs n1 n2 ... np
fréquences n1/N n2/N ... np/N
Le centre de classe est le milieu de l'intervalle :

La largeur de classe se nomme aussi amplitude.

La représentation peut se faire sous forme d'histogramme :

- les largeurs des rectangles sont celles des largeurs des classes

- les aires des rectangles sont proportionnels aux effectifs des classes


k = coeficient de proportionalité à choisir selon la taille du graphe que l'on veut obtenir.


Si les largeurs sont toutes égales, alors les hauteurs des rectangles sont proportionnelles aux effectifs : h1 = k.n1

Un tel histogramme est surtout une représentation graphique de la répartition des mesures. Son exploitation reste limitée.

Une autre représentation sera celle en nuage de points. Voir le paragraphe 5.

1.4. Caractéristiques

Moyenne

N est l'effectif :

Variance

Ecart type

L'écart type (sigma) informe de la répartition des mesures. Si est faible, les mesures restent proches de la valeur moyenne.

grand
petit

1.5. Fréquences cumulées

Classes [X0 ; X1[ [X1 ; X2[ ... [Xp-1 ; Xp[
largeur de classe X1-X0 X2-X1 ... Xp-Xp-1
Centre des classes x1 x2 ... xp
effectifs n1 n2 ... np
fréquences n1/N n2/N ... np/N
Fréquences cumulées n1/N n1/N + n2/N ... Σ ni / N

 

 

1.6. Statistiques à deux variables

Recherche d'un lien entre deux caractères

C'est souvent le cas en science.

Exemple : tension de sortie en fonction de la tension d'entrée d'un montage électronique.

abscisse x x1 x2 ... xp
ordonnée y y1 y2 ... yp

La représentation se fait en nuage de points.

Voir la formation à Excel : tracer une courbe y=f(x)

On cherche alors la corrélation entre x et y. On modélise ; on ajuste.

Voir la formation à Excel : modélisation ; utilisation du solveur

En plus de l'équation du modèle, un logiciel de modélisation pourra fournir le coefficient de corrélation (ou de détermination) R.

Dans l'exemple du graphique ci-dessus le modèle utilisé sera la droite affine y = a.x + b. La modélisation consite à chercher les meilleures valeurs de a et b.

Si 0,5 < R2 < 1 on peut dire que l'ajustement du modèle y=f(x) est satisfaisant (plus R2 est proche de 1, meilleur est l'ajustement).

Si R2 < 0,5 l'ajsutement n'est pas parfait. Le modèle ne s'ajuste pas au nuage de points.

Représentation en nuage de points d'une variable continue aléatoire.

Exemple : mesure d'une même cote sur une pièce en fabrication sérielle (contrôle qualité).

Les mesures sont regroupées selon le tableau vu au paragraphe 3.

On représente alors les effectifs par classe (ou les fréquences) en fonction des centres des classes.

Centre des classes (x) x1 x2 ... xp
fréquences (y) n1/N n2/N ... np/N

En général les points se répartissent selon une courbe dite "courbe de Gauss".

L'équation mathématique correspondant à cette courbe est nommée loi normale ou distribution normale ou loi de Laplace-Gauss.

Formule donnée pour information mais sans grand intérêt ici.

1.7. Interprétation de la répartition

La courbe est étalée. l'écart type est grand. L'intervalle d'incertitude de la mesure est grand. La précision est faible.
La courbe est concentrée prêt de la valeur moyenne. l'écart type est petit. L'intervalle d'incertitude de la mesure est faible. La précision est grande.

Partie 2 : probabilité

2.1. Probabilité sur la loi normale

Les calculs de probabilité sur la distribution normale sont difficiles à réaliser.

Voici quelques résultats

64% de l'effectif ou de l'echantillon possède une valeur comprise dans l'intervalle ± autour de la valeur moyenne.

Exemple

La vérification d'une cote sur cent pièces donne une valeur moyenne de 4,35 mm. L'écart type et de 0,25 mm. La répartion des mesures obéit à la loi normale.

Alors on peut dire que 64 pièces sur le 100 possèdent une cote comprise entre 4,10 mm et 4,60 mm.

2.2. Loi normale centrée réduite

Pour trouver le pourcentage de l'effectif dans n'importe quel intervalle, on utilise alors une table de valeur. Mais il faut avant cela normaliser la loi normale par un changement de variable pour obtenir la loi normale centrée réduite.

Loi normale centrée réduite

Le changement de variable est :
L'équation de la loi normale centrée réduite est : (pour information)

2.3. Probabilité sur la loi normale centrée réduite

La probabilité p qu'une valeur t quelconque du caractère se trouve dans l'intervalle -∞ < t < +∞ est de 1 (100%)

ou simplement

La probabilité p qu'une valeur quelconque du caractère se trouve dans l'intervalle -∞ < t < t1 est appelée

ou simplement

p(t1) se lit dans une table (voir pargraphe suivant).

La probabilité p qu'une valeur t quelconque du caractère se trouve dans l'intervalle - < t < -t1 est

La loi normale étant symétrique, on remarque que

 

La probabilité p qu'une valeur quelconque du caractère se trouve dans l'intervalle symétrique -t1 < t < +t1, se calcule à partir de p(t1)

2.4. Utilisation du tableau pour calculer une probabilité quelconque

Prenons l'exemple d'une pièce mécanique sur laquelle on veut vérifier une cote x de 10,00 mm ± 0,05 mm

Après plusieurs dizaines de contrôles on trouve une valeur moyenne de 10,00 mm et un écart type de 0,15 mm.

On veut connaître le pourcentage de pièces dont la cote x est dans l'intervalle [9,95 mm ; 10,05 mm]

Etape 1 : changement de variable x -> t

t1 est sans dimension.

Etape 2 : recherche de la probabilité p(t1)

Télécharger la table

Etape 3 : calcul de probabilité sur l'intervalle -t1 < t < +t1

Etape 4 : changement de variable t -> x

Il n'y a rien à faire.

Environ 26% de vos pièces seront correctes avec une cote à 10,00 mm ± 0,05 mm

(Il faudra revoir votre montage d'usinage)

Remarques

  1. De la même façon il est tout aussi facile de faire un calcul de probabilité sur un intervalle non symétrique pour , par exemple, vérifier une cote de 10,00 mm -0,05 mm +0,10 mm.
  2. Calcul en ligne de p(x)

© Claude Divoux, 17 février 2005