L'exercice suivant est automatiquement et aléatoirement généré par ataraXy.
Si vous regénérez la page (F5) les valeurs seront changées.
La correction se trouve en bas de page.
Dans le tableau ci dessous on a représenter
- Les notes en probabilités en \( X\) .
- Les notes en statistiques en \( Y\) .
- Dans la colonne \( Red\) on a représenté si l'étudiant a redoublé au cours de sa scolarité ou non..
Pour un caractère statistique \( Z\) on note \( \overline{Z}\) la moyenne.
Dans la dernière ligne, on a réalisé la somme des colonnes.
\[\begin{array}{|*{9}{r|}}\hline\# & Red& X & X-\overline{X} & (X-\overline{X})^2 & Y & Y-\overline{Y} & (Y-\overline{Y})^2 & (X-\overline{X})(Y-\overline{Y})\\\hline
1&oui&5&-5.52&30.47&11.5&-2.768&7.662&15.279\\\hline
2&oui&7.2&-3.32&11.022&12.3&-1.968&3.873&6.534\\\hline
3&non&15.6&5.08&25.806&17.8&3.532&12.475&17.943\\\hline
4&non&5.9&-4.62&21.344&13.3&-0.968&0.937&4.472\\\hline
5&non&13&2.48&6.15&16.8&2.532&6.411&6.279\\\hline
6&non&15.9&5.38&28.944&19.8&5.532&30.603&29.762\\\hline
7&oui&18.1&7.58&57.456&21.3&7.032&49.449&53.303\\\hline
8&oui&7.3&-3.22&10.368&10.9&-3.368&11.343&10.845\\\hline
9&non&12&1.48&2.19&20&5.732&32.856&8.483\\\hline
10&oui&17.9&7.38&54.464&19.4&5.132&26.337&37.874\\\hline
11&oui&18.9&8.38&70.224&33.2&18.932&358.421&158.65\\\hline
12&non&16.5&5.98&35.76&19.2&4.932&24.325&29.493\\\hline
13&non&2.5&-8.02&64.32&0.2&-14.068&197.909&112.825\\\hline
14&non&13.3&2.78&7.728&17.3&3.032&9.193&8.429\\\hline
15&non&0.8&-9.72&94.478&3&-11.268&126.968&109.525\\\hline
16&non&3.9&-6.62&43.824&2.7&-11.568&133.819&76.58\\\hline
17&non&4.1&-6.42&41.216&3.2&-11.068&122.501&71.057\\\hline
18&non&8.3&-2.22&4.928&13.4&-0.868&0.753&1.927\\\hline
19&non&12.4&1.88&3.534&15&0.732&0.536&1.376\\\hline
20&oui&12.9&2.38&5.664&17.9&3.632&13.191&8.644\\\hline
21&oui&15&4.48&20.07&19.8&5.532&30.603&24.783\\\hline
22&oui&9.9&-0.62&0.384&16.1&1.832&3.356&-1.136\\\hline
23&oui&6.8&-3.72&13.838&11.5&-2.768&7.662&10.297\\\hline
24&non&10&-0.52&0.27&9.1&-5.168&26.708&2.687\\\hline
25&oui&9.8&-0.72&0.518&12&-2.268&5.144&1.633\\\hline
\Sigma&&263&0&654.97&356.7&0&1243.035&807.544\\\hline
\end{array}\]
- Réaliser le nuage de points de ces données.
- Déterminer la moyenne des \( X\) .
- Déterminer l'écart-type des \( Y\) .
- Déterminer la droite de régression linéaire.
- La régression linéaire est-elle justifiée ?
Cliquer ici pour afficher la solution
-
- La moyenne des \( X\) est la sommes des valeurs divisé par le nombre de note, ici \( 25\) . Ainsi \( \overline{X}\simeq\dfrac{263}{25}\simeq 10.52\) .
- L'écart-type des \( Y\) est la racine carré de la somme des \( (Y-\overline{Y})^2\) divisé par le nombre de note, ici \( 25\) . Ainsi \( \sigma_X\simeq\sqrt{\dfrac{1243.035}{25}}\simeq 7.051\) .
- Déterminons les coefficients \( \hat{a}=\dfrac{cov(X, Y)}{\sigma_X^2}\) et \( \hat{b}=\overline{Y}-\hat{a}\overline{X}\) .
A cette fin, il faut calculer la covariance, la variance de \( X\) et la moyenne des \( Y\) . La covariance est la somme des \( (X-\overline{X})(Y-\overline{Y})\) sur l'effectif, cela donne donc \( cov(X, Y)\simeq\dfrac{807.544}{25}\simeq 32.302\) . De la même manière on trouve \( \overline{Y}\simeq\dfrac{356.7}{25}\simeq14.268\) et \( \sigma_X\simeq\sqrt{\dfrac{654.97}{25}}\simeq 5.119\)
Dans ce cas \( \hat{a}=\dfrac{cov(X, Y)}{\sigma_X^2}\simeq\dfrac{32.302}{26.204161}\simeq1.233\) . Et pour \( \hat{b}\simeq\dfrac{356.7}{25}-\left(1.233\times\dfrac{263}{25}\right)\simeq1.298\) .
- Déterminons le coefficient de corrélation linéaire simple. \( corr(X, Y)=\dfrac{cov(X, Y)}{\sigma_X\sigma_Y}\simeq\dfrac{32.302}{5.119\times 7.051}\simeq 0.895\) . Puisque le coefficient de corrélation est, en valeur absolue, suffisamment proche de 1, on en déduit que la régression linéaire est justifiée.