L'exercice suivant est automatiquement et aléatoirement généré par ataraXy.
Si vous regénérez la page (F5) les valeurs seront changées.
La correction se trouve en bas de page.
Exercice
Dans le tableau ci dessous on a représenter
- Le nombre d'élève en terminale génarale qui prennent l'option "mathématiques expertes" par lycée en \( X\) .
- Le taux de réussite à l'épreuve du baccalauréat par lycée en \( Y\) .
Pour un caractère statistique \( Z\) on note \( \overline{Z}\) la moyenne.
Dans la dernière ligne, on a réalisé la somme des colonnes.
\[\begin{array}{|*{8}{r|}}\hline\# & X & X-\overline{X} & (X-\overline{X})^2 & Y & Y-\overline{Y} & (Y-\overline{Y})^2 & (X-\overline{X})(Y-\overline{Y})\\\hline
1&401&179.72&32299.28&79.5&0.144&0.021&25.88\\\hline
2&83&-138.28&19121.36&79.3&-0.056&0.003&7.744\\\hline
3&172&-49.28&2428.52&68.4&-10.956&120.034&539.912\\\hline
4&259&37.72&1422.8&81.7&2.344&5.494&88.416\\\hline
5&401&179.72&32299.28&89.7&10.344&106.998&1859.024\\\hline
6&342&120.72&14573.32&67.9&-11.456&131.24&-1382.968\\\hline
7&172&-49.28&2428.52&76.8&-2.556&6.533&125.96\\\hline
8&131&-90.28&8150.48&67.3&-12.056&145.347&1088.416\\\hline
9&132&-89.28&7970.92&78.8&-0.556&0.309&49.64\\\hline
10&370&148.72&22117.64&79.1&-0.256&0.066&-38.072\\\hline
11&296&74.72&5583.08&87.4&8.044&64.706&601.048\\\hline
12&29&-192.28&36971.6&84.7&5.344&28.558&-1027.544\\\hline
13&69&-152.28&23189.2&76.6&-2.756&7.596&419.684\\\hline
14&68&-153.28&23494.76&63.4&-15.956&254.594&2445.736\\\hline
15&408&186.72&34864.36&95.3&15.944&254.211&2977.064\\\hline
16&234&12.72&161.8&82.5&3.144&9.885&39.992\\\hline
17&116&-105.28&11083.88&83.1&3.744&14.018&-394.168\\\hline
18&239&17.72&314&92.1&12.744&162.41&225.824\\\hline
19&63&-158.28&25052.56&76.6&-2.756&7.596&436.22\\\hline
20&418&196.72&38698.76&77.8&-1.556&2.421&-306.096\\\hline
21&11&-210.28&44217.68&68.9&-10.456&109.328&2198.688\\\hline
22&219&-2.28&5.2&83.9&4.544&20.648&-10.36\\\hline
23&406&184.72&34121.48&83.4&4.044&16.354&747.008\\\hline
24&124&-97.28&9463.4&72.6&-6.756&45.644&657.224\\\hline
25&369&147.72&21821.2&87.1&7.744&59.97&1143.944\\\hline
\Sigma&5532&0&451855.08&1983.9&0&1573.984&12518.216\\\hline
\end{array}\]
- Réaliser le nuage de points de ces données.
- Déterminer la moyenne des \( X\) .
- Déterminer l'écart-type des \( Y\) .
- Déterminer la droite de régression linéaire.
- La régression linéaire est-elle justifiée ?
Cliquer ici pour afficher la solution
Exercice
-
- La moyenne des \( X\) est la sommes des valeurs divisé par le nombre de note, ici \( 25\) . Ainsi \( \overline{X}\simeq\dfrac{5532}{25}\simeq 221.28\) .
- L'écart-type des \( Y\) est la racine carré de la somme des \( (Y-\overline{Y})^2\) divisé par le nombre de note, ici \( 25\) . Ainsi \( \sigma_X\simeq\sqrt{\dfrac{1573.984}{25}}\simeq 7.935\) .
- Déterminons les coefficients \( \hat{a}=\dfrac{cov(X, Y)}{\sigma_X^2}\) et \( \hat{b}=\overline{Y}-\hat{a}\overline{X}\) .
A cette fin, il faut calculer la covariance, la variance de \( X\) et la moyenne des \( Y\) . La covariance est la somme des \( (X-\overline{X})(Y-\overline{Y})\) sur l'effectif, cela donne donc \( cov(X, Y)\simeq\dfrac{12518.216}{25}\simeq 500.728\) . De la même manière on trouve \( \overline{Y}\simeq\dfrac{1983.9}{25}\simeq79.356\) et \( \sigma_X\simeq\sqrt{\dfrac{451855.08}{25}}\simeq 134.44\)
Dans ce cas \( \hat{a}=\dfrac{cov(X, Y)}{\sigma_X^2}\simeq\dfrac{500.728}{18074.1136}\simeq0.028\) . Et pour \( \hat{b}\simeq\dfrac{1983.9}{25}-\left(0.028\times\dfrac{5532}{25}\right)\simeq73.226\) .
- Déterminons le coefficient de corrélation linéaire simple. \( corr(X, Y)=\dfrac{cov(X, Y)}{\sigma_X\sigma_Y}\simeq\dfrac{500.728}{134.44\times 7.935}\simeq 0.469\) . Puisque le coefficient de corrélation est, en valeur absolue, assez loin de 1, on en déduit que la régression linéaire n'est pas justifiée.