Root Mean Square Error (RMSE) egy szabványos módszer a modell hibájának mérésére a mennyiségi adatok előrejelzésében. Hivatalosan ez határozza meg a következőképpen:
próbáljuk meg, hogy vizsgálja meg miért ezt az intézkedést a hiba értelme a matematikai szempontból., Figyelmen kívül hagyva az osztály n alatt a négyzetgyök, az első dolog, amit észre a hasonlóságot, hogy a képlet a Euklideszi távolság a két vektor a ℝⁿ:
Ez azt mondja, heuristically, hogy RMSE lehet úgy, mint valamiféle (normalizált) távolság a vektor a becsült értékek, valamint a vektor a megfigyelt értékek.
de miért osztjuk n-vel a négyzetgyök alatt?, Ha az N-t(a megfigyelések számát) rögzítjük, akkor csak az euklideszi távolságot számítjuk √(1/n) tényezővel. Ez egy kicsit trükkös, hogy miért ez a helyes dolog, úgyhogy ásni egy kicsit mélyebb.,
Képzeld el, hogy a megfigyelt értékek határozzák meg, hozzátéve random “hibát”, hogy minden, a becsült értékek a következők szerint:
Ezek a hibák, úgy, mint véletlen változó, lehet, hogy Gauss eloszlás jelenti, μ, valamint a szórás σ, de bármilyen más megoszlása a tér-integrable PDF (sűrűségfüggvényt) is működik., Azt akarjuk gondolni, ŷᵢ, mint egy mögöttes fizikai mennyiség, mint például a pontos távolság a Mars a nap egy adott időpontban. A megfigyelt yᵢ mennyiség akkor a Marstól a Napig terjedő távolság lenne, amikor mérjük, néhány hiba a teleszkópok téves kalibrálásából, valamint a légköri interferencia mérési zajából származik.,
A μ a megoszlása a hibák felelne meg a kitartó elfogultság jön a mis-kalibrálás, míg a szórás σ felelne meg az összeg a mérési zaj. Képzeljük el most, hogy pontosan tudjuk a hiba eloszlásának Közép μ-ját, és szeretnénk megbecsülni a σ szórást., Egy kis számításon keresztül láthatjuk, hogy: