das Verständnis der OLS-Methode für die Einfache Lineare Regression

die Lineare Regression ist eine Familie von algorithmen beschäftigt in überwachten machine-learning-Aufgaben (erfahren Sie mehr über das betreute lernen, Sie können Lesen Sie meine früheren Artikel hier). Da wir wissen, dass überwachte ML-Aufgaben normalerweise in Klassifikation und Regression unterteilt sind, können wir lineare Regressionsalgorithmen in der letzteren Kategorie zusammenfassen., Es unterscheidet sich von der Klassifizierung aufgrund der Art der Zielvariablen: In der Klassifizierung ist das Ziel ein kategorialer Wert (‚Ja/Nein‘, ‚rot/blau/grün‘, ‚Spam/nicht Spam’…); Auf der anderen Seite beinhaltet die Regression numerische, kontinuierliche Werte als Ziel, daher wird der Algorithmus aufgefordert, eine kontinuierliche Zahl anstelle einer Klasse oder Kategorie vorherzusagen. Stellen Sie sich nämlich vor, Sie möchten den Preis eines Hauses anhand einiger relativer Merkmale vorhersagen: Die Ausgabe Ihres Modells ist der Preis, daher eine fortlaufende Zahl.,

Regressionsaufgaben können in zwei Hauptgruppen unterteilt werden: diejenigen, die nur ein Merkmal verwenden, um das Ziel vorherzusagen, und diejenigen, die mehr als ein Merkmal für diesen Zweck verwenden. Um Ihnen ein Beispiel zu geben, betrachten wir die obige Hausaufgabe: Wenn Sie den Preis nur anhand seiner Quadratmeter vorhersagen möchten, geraten Sie in die erste Situation (ein Merkmal); Wenn Sie den Preis basierend auf seinen Quadratmetern, seiner Position und der Lebensfähigkeit der Umgebung vorhersagen möchten, werden Sie in die zweite Situation geraten (mehrere Merkmale, in diesem Fall drei).,

Im ersten Szenario ist der Algorithmus, den Sie wahrscheinlich verwenden, die einfache lineare Regression, über die wir in diesem Artikel sprechen werden. Auf der anderen Seite verwenden Sie wahrscheinlich eine multiple lineare Regression, wenn Sie mehreren Funktionen gegenüberstehen, die die Zielvariable erklären können.,

Einfache lineare Regression ist ein statistisches Modell, das in ML-Regressionsaufgaben weit verbreitet ist und auf der Idee basiert, dass die Beziehung zwischen zwei Variablen durch die folgende Formel erklärt werden kann:

Wobei ei der Fehlerterm und α, β die wahren (aber unbeobachteten) Parameter der Regression sind., Der Parameter β stellt die Variation der abhängigen Variablen dar, wenn die unabhängige Variable eine einheitliche Variation aufweist: Wenn mein Parameter gleich 0,75 ist, wenn mein x um 1 zunimmt, erhöht sich meine abhängige Variable um 0,75. Andererseits stellt der Parameter α den Wert unserer abhängigen Variablen dar, wenn die unabhängige gleich Null ist.,

Visualisieren wir es grafisch:

Jetzt die Idee der einfachen linearen Regression besteht darin, die Parameter α und β zu finden, für die der Fehlerterm minimiert wird. Genauer gesagt minimiert das Modell die quadratischen Fehler: In der Tat möchten wir nicht, dass unsere positiven Fehler durch die negativen kompensiert werden, da sie für unser Modell gleichermaßen bestraft werden.,

This procedure is called Ordinary Least Squared error — OLS.

Let’s demonstrate those optimization problems step by step.,r α:

Einmal erhalten die Werte von α und β, die das Quadrat minimieren fehler, die Gleichung unseres Modells sieht folgendermaßen aus:

Zusammenfassend können Sie das OLS als eine strategie, um aus Ihrem Modell eine „gerade Linie“ zu erhalten, die so nah wie möglich an Ihren Datenpunkten liegt., Obwohl OLS nicht die einzige Optimierungsstrategie ist, ist es die beliebteste für diese Art von Aufgaben, da die Ausgaben der Regression (dh Koeffizienten) unvoreingenommene Schätzer der realen Werte von Alpha und Beta sind. Nach dem Gauss-Markov-Theorem sind die OLS-Schätzer α und β nach einigen Annahmen des linearen Regressionsmodells (Linearität in Parametern, Zufallsstichprobe von Beobachtungen, bedingtes Mittel gleich Null, Fehlen von Multikollinearität, Homoskedastizität von Fehlern) die besten linearen unvoreingenommenen Schätzer (BLAU) der reellen Werte von α und β.,

Wenn Sie dieses Thema interessant fanden und eine praktische Anwendung mit Python von dem sehen möchten, was Sie bisher gelesen haben, können Sie meinen Artikel hier lesen.

Good Mood

das Verständnis der OLS-Methode für die Einfache Lineare Regression

Schreibe einen Kommentar Antworten abbrechen

Archive

Meta