L’erreur quadratique moyenne (RMSE) est un moyen standard de mesurer l’erreur d’un modèle dans la prédiction de données quantitatives. Officiellement elle est définie comme suit:
nous allons essayer de comprendre les raisons de cette mesure de l’erreur de sens à partir d’un point de vue mathématique., Ignorant la division par n, en vertu de la racine carrée, la première chose on peut remarquer une ressemblance avec la formule de la distance Euclidienne entre deux vecteurs dans ℝⁿ:
de Ce nous raconte de manière heuristique que RMSE peut être considéré comme une sorte de (normalisé) la distance entre le vecteur des valeurs prédites et le vecteur des valeurs observées.
Mais pourquoi divisons-nous par n sous la racine carrée ici?, Si nous continuons à n (le nombre d’observations) fixe, il n’est de redimensionner la distance Euclidienne d’un facteur √(1/n). Il est un peu difficile de voir pourquoi c’est la bonne chose à faire, alors plongeons un peu plus profondément.,
Imaginez que nos valeurs observées sont déterminés par l’ajout aléatoire « erreurs” à chacune des valeurs prédites, comme suit:
Ces erreurs, considérés comme des variables aléatoires, pourrait avoir distribution Gaussienne de moyenne m et d’écart-type σ, mais d’une autre distribution avec un carré intégrable PDF (fonction de densité de probabilité) serait aussi travailler., Nous voulons penser à ŷᵢ comme une quantité physique sous-jacente, comme la distance exacte de mars au soleil à un moment donné dans le temps. Notre quantité observée yᵢ serait alors la distance de Mars au soleil telle que nous la mesurons, avec quelques erreurs provenant d’un mauvais calibrage de nos télescopes et du bruit de mesure des interférences atmosphériques.,
La moyenne µ de la distribution de nos erreurs correspondent à une persistance des préjugés venant de la mauvaise calibration, tandis que l’écart-type σ correspond à la quantité de bruit de mesure. Imaginez maintenant que nous connaissons exactement la moyenne μ de la distribution pour nos erreurs et que nous aimerions estimer l’écart type σ., Nous pouvons voir à travers un peu de calcul:
Ici, E est l’attente, et Var(…) est la variance. On peut remplacer la moyenne des attentes E sur la troisième ligne par la E sur la quatrième ligne où ε est une variable avec la même distribution que chacune des eᵢ, car les erreurs eᵢ sont identiquement distribuées, et donc leurs carrés ont tous la même espérance.
rappelez-vous que nous avons supposé que nous connaissions déjà μ exactement., Autrement dit, le biais persistant dans nos instruments est un biais connu, plutôt qu’un biais inconnu. Nous pourrions donc aussi bien corriger ce biais dès le départ en soustrayant μ de toutes nos observations brutes. Autrement dit, Nous pourrions aussi bien supposer que nos erreurs sont déjà distribuées avec la moyenne μ = 0. Cela branchant dans l’équation ci-dessus et en prenant la racine carrée des deux côtés, on obtient:
l’Avis de la gauche semble familier!, Si nous avons supprimé L’attente E de l’intérieur de la racine carrée, c’est exactement notre formule pour la forme RMSE avant. Le théorème central limite nous dit que lorsque n augmente, la variance de la quantité Σᵢ(y — yᵢ)2 / n = σᵢ (eᵢ) 2 / N devrait converger vers zéro. En fait, une forme plus nette du théorème central limite nous dit que sa variance devrait converger vers 0 asymptotiquement comme 1 / n. cela nous dit que Σᵢ (ŷᵢ — yᵢ)2 / n est un bon estimateur pour E = σ2. Mais alors RMSE est un bon estimateur pour l’écart type σ de la distribution de nos erreurs!,
nous devrions également maintenant avoir une explication de la division par n sous la racine carrée en RMSE: cela nous permet d’estimer l’écart type σ De l’erreur pour une observation unique typique plutôt qu’une sorte d ‘ « erreur totale”. En divisant par n, Nous gardons cette mesure d’erreur cohérente lorsque nous passons d’une petite collection d’observations à une collection plus grande (elle devient simplement plus précise lorsque nous augmentons le nombre d’observations). Pour le dire autrement, RMSE est un bon moyen de répondre à la question: « à quelle distance devrions-nous nous attendre à ce que notre modèle soit sur sa prochaine prédiction?,”
pour résumer notre discussion, RMSE est une bonne mesure à utiliser si nous voulons estimer l’écart-type σ d’une valeur observée typique à partir de la prédiction de notre modèle, en supposant que nos données observées peuvent être décomposées comme suit: