Vider les textes à trous
Sun Arrows Moon
Actuelle
Arrows
Autre
Return Index

Pourcentages et statistiques

Pourcentages

Calcul d'une évolution

$$V_A = V_D \times \left(1+\frac{t}{100} \right) \qquad(\ \nearrow \ ) $$
$$V_A = V_D \times \left(1-\frac{t}{100} \right) \qquad(\ \searrow \ ) $$
$$ avec \enspace \left \{ \begin{gather*} V_D : valeur \ de \ d{é}part \\ V_A : valeur \ d'arriv\textit{é}e \\ t : taux \ \textit{à} \ appliquer \ (en \ \%) \end{gather*} \right \}$$

Le calcul d'une évolution

Soient \(V_D\) la valeur de départ et \(t\) la taux à appliquer pour déterminer \(V_A\) la valeur d'arrivée.

La valeur d'arrivée vaut alors :

$$V_A = V_D + V_D \times \frac{t}{100} $$

On factorise par \(V_D\) puis :

$$V_A = V_D \times \left(1+\frac{t}{100} \right) $$

À noter que dans le cas d'une diminution, le contexte va dépendre de la forme que prendre la taux :

Taux d'évolution

$$\tau =\frac{V_A - V_D}{V_D} \times 100 \qquad \bigl[\% \bigr] $$
$$ avec \enspace \left \{ \begin{gather*} V_D : valeur \ de \ d{é}part \\ V_A : valeur \ d'arriv\textit{é}e \end{gather*} \right \}$$

Lexique du langage statistique

Population

Les études statistiques portent généralement sur une population, qu'on appelle des individus.

Caractère

Un critère d'étude sur une population s'appelle un caractère, et à chaque individu correspondra au plus une valeur.

Ce caractère peut être :

Effectif

L'effectif \(e_i\) est le nombre d'individus concerné par le caractère \(x_i\).

Fréquence

La fréquence est le rapport entre nombre d'individus concerné par un certain caractère, sur l'effectif total.

$$ F(x_i) = \frac{e_i}{N}$$
$$ avec \enspace \left \{ \begin{gather*} x_i : le \ caract\textit{è}re \ \textit{é}tudi\textit{é} \\ e_i : l'effectif \ concern\textit{é} \ par \ le \ caract\textit{è}re \ \textit{é}tudi\textit{é} \\ N : l'effectif \ total \end{gather*} \right \}$$

Moyennes

Dans cette partie, on distinguera deux manières d'écrire le nombre d'éléments d'une donnée statistique :

Avec une série de données ordinaire :

Indice
1
2
3
...
n
Donnée
$$ x_1 $$
$$ x_2 $$
$$ x_3 $$
$$ ... $$
$$ x_n $$
Effectif
$$ e_1 $$
$$ e_2 $$
$$ e_3 $$
$$ ... $$
$$ e_n $$

On calcule différents types de moyenne.

Moyenne arithmétique

La moyenne arithmétique est celle que l'on calcule généralement dans les bulletins de notes :

  1. Calcul simple

  2. $$ M_A(X) = \frac{x_1 + x_2 + x_3 \ + \ \dots + \ \ x_n}{n} $$

    Ou encore écrite sous forme de somme :

    $$ M_A(X) = \frac{1}{n} \sum_{k=1}^n x_k$$
  3. Calcul avec la prise en compte d'effectifs

  4. $$ M_A(X) = \frac{e_1x_1 + e_2x_2 + e_3x_3 \ + \ \dots + \ \ e_nx_n}{N} $$

    Ou encore écrite sous forme de somme :

    $$ M_A(X) = \frac{1}{N} \sum_{k=1}^{n} \Bigl[ e_k \ x_k \Bigr] $$
  5. Linéarité de la moyenne

    1. Sur un l'ajout d'une quantité \(Q\)

    2. Si l'on ajoute (ou retire) une certaine quantité \(Q\) à toutes les valeurs d'une série de données, alors la moyenne se verra augmentée de cette même quantité.

      Linéarité de la moyenne (ajout)

      Si l'on reprend la formule de la moyenne sous forme de somme :

      $$ M_A(X) = \frac{1}{n} \sum_{k=1}^n x_k$$

      En ajoutant une quantité réelle \(Q \in \mathbb{R}\), on a :

      $$ M_A(X)' = \frac{1}{n} \sum_{k=1}^n \bigl[ x_k + Q \bigr]$$
      $$ M_A(X)' = \frac{1}{n} \left( \sum_{k=1}^n x_k + \sum_{k=1}^n Q\right) $$

      La somme des \(A\) sur \(n\) itérations vaut \(n \times Q\), donc :

      $$ M_A(X)' = \frac{1}{n} \left( \sum_{k=1}^n x_k + nQ\right) $$
      $$ M_A(X)' = \frac{1}{n} \sum_{k=1}^n x_k + Q $$

      La moyenne de départ a bien augmenté de \(Q\).

    3. Sur l'application d'un coefficient \(C\)

    4. Si l'on multiplie (ou divise) par un coefficient \(C\) toutes les valeurs d'une série de données, alors la moyenne s'en verra multipliée par ce même coefficient.

      Linéarité de la moyenne (coefficient)

      Si l'on reprend la formule de la moyenne sous forme de somme :

      $$ M_A(X) = \frac{1}{n} \sum_{k=1}^n x_k$$

      En mulitpliant par un coefficient réel \(C \in \mathbb{R}\), on a :

      $$ M_A(X)^* = \frac{1}{n} \sum_{k=1}^n \bigl[ x_k \times C \bigr]$$

      Avec l'opérateur somme, on a le droit de sortir les constantes, donc :

      $$ M_A(X)^* = C \times \frac{1}{n} \sum_{k=1}^n x_k $$

      La moyenne de départ a bien été multipliée par \(C\).

Moyenne géométrique

La moyenne géométrique est un type de moyenne beaucoup plus sensible que la moyenne arithmétique aux valeurs les plus élevées, mais beaucoup plus sensible pour les valeurs les plus basses d'une série de données.

Dans tous les cas, on aura :

$$M_G(X) \leqslant M_A(X)$$
  1. Calcul simple

  2. $$ M_G(X) = \sqrt[n]{x_1 \ x_2 \ x_3 \ \ \dots \ \ \ x_n} $$

    Ou encore écrite sous forme de produit :

    $$ M_G(X) = \left( \prod_{k=1}^n x_k \right)^{\frac{1}{n}}$$
  3. Calcul avec la prise en compte d'effectifs

  4. $$ M_G(X) = \sqrt[N]{x_1^{e_1} \ x_2^{e_2} \ x_3^{e_3} \ \dots \ x_n^{e_n}} $$

    Ou encore écrite sous forme de produit :

    $$ M_G(X) = \left( \prod_{k=1}^n x_k^{e_k} \right)^{\frac{1}{N}}$$

Médiane, quartiles

Avant de chercher la médiane \((M)\) et les quartiles \((Q_1, Q_3)\), il faut dans un premier temps ranger les données en ordre croissant (ou par ordre alphabétique), en laissant les répétitions éventuelles.

Médiane : \(M\)

La médiane

La médiane est la valeur centrale d'un jeu de données.

Dans le cas d'un nombre pair de valeurs, on prend moyenne des deux valeurs centrales.

Dans les faits, c'est la valeur du \(\frac{n}{2}\)-ième individu.

Quartiles

Les quartiles

Les quartiles (premier et troisième) sont les valeurs pour lesquelles respectivement \(25 \ \%\) et \(75 \ \%\) des valeurs leur sont inférieures.

  1. 1 er quartile : \(Q_1\)

  2. Dans les faits, c'est la valeur du \(\frac{n}{4}\)-ième individu.

    Peut importe le résultat, dans tous les cas on arrondit à la valeur supérieure.


    Exemple :

    $$X = \Bigl \{ 10, \ 10, \ 11, \ 11, \ 12, \ 14, \ 16 \Bigr \}$$
    $$(n = 7) \Longrightarrow \frac{n}{4} = 1.75$$

    On doit prendre la \(2\) ième valeur :

    $$X = \Bigl \{ 10, \ \textcolor{#AB6464}{10}, \ 11, \ 11, \ 12, \ 14, \ 16 \Bigr \}$$
    $$\textcolor{#AB6464}{Q_1 = 10} $$
  3. 3 ième quartile : \(Q_3\)

  4. Dans les faits, c'est la valeur du \(\frac{3n}{4}\)-ième individu.

    De la même manière, arrondit à la valeur supérieure.


    Exemple :

    $$X = \Bigl \{ 10, \ 10, \ 11, \ 11, \ 12, \ 14, \ 16 \Bigr \}$$
    $$(n = 7) \Longrightarrow \frac{3n}{4} = 5.25$$

    On doit prendre la \(6\) ième valeur :

    $$X = \Bigl \{ 10, \ 10, \ 11, \ 11, \ 12, \ \textcolor{#AB6464}{14}, \ 16 \Bigr \}$$
    $$\textcolor{#AB6464}{Q_3 = 14} $$
  5. Écart inter-quartile : \(Q_3 - Q_1\)

  6. L'écart inter-quartile est un indicateur de dispersion.

    On le calcule par la différence des quartiles :

    $$\Delta_Q = Q_3 - Q_1$$

Variance, écart-type

Variance

Dans cette partie, on notera \(\overline{x}\) la moyenne d'une série de valeurs \( X = \Bigl \{ x_1, \ x_2, \ \dots , \ x_n \Bigr\}\) :

$$\overline{x} = \frac{x_1 + x_2 + x_3 \ + \ \dots + \ \ x_n}{n} $$

La variance est alors la moyenne (arithmétique) des carrés des écarts à la moyenne. Cette donnée sera utile par la suite pour la calcul de l'écart-type.

  1. Calcul simple

    1. Première forme

    2. $$V(X) = \frac{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + \ (x_3 - \overline{x})^2 + \ \dots \ + \ (x_n - \overline{x})^2}{n}$$

      Ou encore écrite sous forme de somme :

      $$V(X) = \frac{1}{n} \sum_{k=1}^{n} (x_k - \overline{x})^2 $$
    3. Seconde forme

    4. $$V(X) = \frac{(x_1)^2 + (x_2)^2 + \ (x_3)^2 + \ \dots \ + \ (x_n)^2}{n} - \ \overline{x}^2 $$

      Ou encore écrite sous forme de somme :

      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} x_k^2 - \ \overline{x}^2 $$
      Les deux formes de la formule de la variance (sans effectif)

      En démarrant de la première formule, définition de la variance :

      $$V(X) = \frac{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + \ (x_3 - \overline{x})^2 + \ \dots \ + \ (x_n - \overline{x})^2}{n}$$

      Soit, sous forme de somme :

      $$V(X) = \frac{1}{n} \sum_{k=1}^{n} (x_k - \overline{x})^2 $$

      On développe alors l'identité remarquable :

      $$V(X) = \frac{1}{n} \sum_{k=1}^{n} \left[ (x_k)^2 - 2 \ x_k \ \overline{x} + \overline{x}^2 \right]$$

      On sépare maintenant chaque élément de la somme :

      $$V(X) = \frac{1}{n}\left[ \sum_{k=1}^{n} (x_k)^2 - \sum_{k=1}^{n}2 \ x_k \ \overline{x} + \sum_{k=1}^{n} \overline{x}^2 \right]$$
      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - 2 \times \frac{1}{n}\sum_{k=1}^{n} x_k \ \overline{x} + \frac{1}{n}\sum_{k=1}^{n} \overline{x}^2 $$

      Le dernier terme est une constante, on peut donc simplifier cette somme :

      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - 2 \times \frac{1}{n}\sum_{k=1}^{n} x_k \ \overline{x} + \frac{1}{n} \times n \times \overline{x}^2 $$
      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - 2 \times \frac{1}{n}\sum_{k=1}^{n} x_k \ \overline{x} + \overline{x}^2 $$

      Or, dans le terme central, on reconnaît la définition de la moyenne :

      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - 2 \times \textcolor{#AB6464}{\frac{1}{n}\sum_{k=1}^{n} x_k} \ \overline{x} + \overline{x}^2 $$

      Que l'on remplace :

      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - 2 \times \textcolor{#AB6464}{\overline{x}} \ \overline{x} + \overline{x}^2 $$

      Puis finalement

      $$V(X) = \frac{1}{n}\sum_{k=1}^{n} (x_k)^2 - \overline{x}^2 $$
  2. Calcul avec la prise en compte d'effectifs

    1. Première forme

    2. $$V = \frac{e_1(x_1 - \overline{x})^2 + e_2(x_2 - \overline{x})^2 + \ e_3(x_3 - \overline{x})^2 + \ \dots \ + \ e_n(x_n - \overline{x})^2}{N}$$
    3. Seconde forme

    4. $$V = \frac{e_1(x_1)^2 + e_2(x_2)^2 + \ e_3(x_3)^2 + \ \dots \ + \ e_n(x_n)^n}{N} - \ \overline{x}^2 $$

      Ou encore écrite sous forme de somme :

      $$V = \frac{\left[ \sum\limits_{k=1}^{n} e_k \ x_k^2 \right]}{N} - \ \overline{x}^2 $$

Écart-type

L'écart-type est un indicateur de dispersion d'une série statistique.

Il permet de savoir quel est l'écart moyen entre une donnée et la moyenne de cette même série.

$$ \sigma = \sqrt{V} $$