Vous disposez de \( 100\) valeurs \( x_i\) et \( y_i\) représentées dans le dessin ci dessous.
Un statisticien vous souffle que ce nuage de point semble suivre une courbe \( \dfrac{a}{x_i}+\dfrac{b}{x_i^2}\) .
Déterminer les meilleures estimations de \( a\) et \( b\) .
Appliquons la méthodes des moindre carrés, et déterminons les minimum de
\[f(a, b)=\sum_i\left(y_i-\dfrac{a}{x_i}-\dfrac{b}{x_i^2}\right)^2\]
Pour simplifier les notations, posons \( z_i=\dfrac{1}{x_i}\) , on a donc, \( f(a, b)=\sum_i\left(y_i-{a}{z_i}-{b}{z_i^2}\right)^2\) .
Déterminons ses points critiques :
\[\dfrac{\partial f}{\partial a}=\sum_i-2z_i\left(y_i-{a}{z_i}-{b}{z_i^2}\right)\]
\[\dfrac{\partial f}{\partial b}=\sum_i-2z_i^2\left(y_i-{a}{z_i}-{b}{z_i^2}\right)\]
\begin{eqnarray*}
\left\{
\begin{array}{rcl}
\dfrac{\partial f}{\partial a}&=&0\\
\dfrac{\partial f}{\partial b}&=&0
\end{array}
\right.
&\Rightarrow &
\left\{
\begin{array}{rcl}
\sum_i-2z_i\left(y_i-{a}{z_i}-{b}{z_i^2}\right)&=&0\\
\sum_i-2z_i^2\left(y_i-{a}{z_i}-{b}{z_i^2}\right)&=&0
\end{array}
\right.
\\
&\Rightarrow &
\left\{
\begin{array}{rcl}
\sum_i z_i\left(y_i-{a}{z_i}-{b}{z_i^2}\right)&=&0\\
\sum_i z_i^2\left(y_i-{a}{z_i}-{b}{z_i^2}\right)&=&0
\end{array}
\right.
\\
&\Rightarrow &
\left\{
\begin{array}{rcl}
\sum_i z_iy_i-{a}{z_i^2}-{b}{z_i^3}&=&0\\
\sum_i z_i^2y_i-{a}{z_i^3}-{b}{z_i^4}&=&0
\end{array}
\right.
\\
&\Rightarrow &
\left\{
\begin{array}{rcl}
\overline{zy}-a\overline{z^2}-b\overline{z^3}&=&0\\
\overline{z^2y}-a\overline{z^3}-b\overline{z^4}&=&0
\end{array}
\right.
\\
&\Rightarrow &
\left\{
\begin{array}{rcl}
a\overline{z^2}+b\overline{z^3}&=&\overline{zy}\\
a\overline{z^3}+b\overline{z^4}&=&\overline{z^2y}
\end{array}
\right.
\\
&\Rightarrow &
\left\{
\begin{array}{rcl}
a\overline{z^2}\cdot\overline{z^3}+b\overline{z^3}\cdot\overline{z^3}&=&\overline{zy}\cdot\overline{z^3}\\
a\overline{z^3}\cdot\overline{z^2}+b\overline{z^4}\cdot\overline{z^2}&=&\overline{z^2y}\cdot\overline{z^2}
\end{array}
\right.
\end{eqnarray*}
La différence des deux lignes donne :
\( b(\overline{z^3}^2-\overline{z^4}\cdot\overline{z^2})=\overline{zy}\cdot\overline{z^3}-\overline{z^2y}\cdot\overline{z^2}\) et donc \( b=\dfrac{\overline{zy}\cdot\overline{z^3}-\overline{z^2y}\cdot\overline{z^2}}{\overline{z^3}^2-\overline{z^4}\cdot\overline{z^2}}\) et \( a=\dfrac{\overline{zy}-b\overline{z^3}}{\overline{z^2}}\) (il faudrait prendre toutes les précaution mathématiques et s'assurer que les opérations effectuées dans le système ou les dénominateurs des fractions qui apparaissent soient bien définies ; dans la pratique de la statistique les cas d'erreurs sont très rare).