Contenu
Lorsque des scientifiques, des économistes ou des statisticiens font des prédictions basées sur des théories puis rassemblent des données réelles, ils ont besoin d'un moyen de mesurer la variation entre les valeurs prédites et les valeurs mesurées. Ils se basent généralement sur l’erreur quadratique moyenne (MSE), qui est la somme des variations des points de données individuels au carré et divisée par le nombre de points de données moins 2. Lorsque les données sont affichées sur un graphique, vous déterminez le MSE par additionner les variations des points de données de l'axe vertical. Sur un graphique x-y, ce sont les valeurs y.
Pourquoi carré les variations?
Multiplier la variation entre les valeurs prédites et les valeurs observées a deux effets souhaitables. Le premier est de s'assurer que toutes les valeurs sont positives. Si une ou plusieurs valeurs étaient négatives, la somme de toutes les valeurs pourrait être peu réaliste et donner une représentation médiocre de la variation réelle entre les valeurs prédites et les valeurs observées. Le second avantage de la quadrature est de donner plus de poids aux différences plus importantes, ce qui garantit qu'une valeur élevée pour MSE signifie des variations de données importantes.
Exemple d'algorithme de calcul de stock
Supposons que vous ayez un algorithme qui prédit quotidiennement les prix d'un stock particulier. Lundi, il prédit que le cours des actions sera à 5,50 $, le mardi à 6,00 $, le mercredi à 6,00 $, le jeudi à 7,50 $ et le vendredi à 8,00 $. En considérant le lundi comme le jour 1, vous avez un ensemble de points de données qui se présente comme suit: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) et (5, 8,00). Les prix réels sont les suivants: lundi 4,75 $ (1, 4,75); Mardi 5,35 $ (2, 5,35); Mercredi 6,25 $ (3, 6,25); Jeudi 7,25 $ (4, 7,25); et vendredi: 8,50 $ (5, 8,50).
Les variations entre les valeurs y de ces points sont respectivement de 0,75, 0,65, -0,25, 0,25 et -0,50, le signe négatif indiquant une valeur prédite inférieure à celle observée. Pour calculer l'EQM, vous devez d'abord mettre au carré chaque valeur de variation, ce qui élimine les signes moins et donne 0,5625, 0,4225, 0,0625, 0,0625 et 0,25. En sommant ces valeurs, on obtient 1,36 et en divisant par le nombre de mesures moins 2, soit 3, on obtient la MSE, qui se révèle être 0,45.
MSE et RMSE
Des valeurs plus faibles pour les MSE indiquent un accord plus étroit entre les résultats prévus et observés, et un MSE de 0,0 indique un accord parfait. Il est important de se rappeler, cependant, que les valeurs de variation sont au carré. Lorsqu'une mesure d'erreur est requise dans les mêmes unités que les points de données, les statisticiens prennent l'erreur quadratique moyenne (RMSE). Ils l'obtiennent en prenant la racine carrée de l'erreur quadratique moyenne. Pour l'exemple ci-dessus, le RSME serait 0,671 ou environ 67 cents.