Wednesday 8 November 2017

Ordinary Least Squares Regression In Stata Forex


Willkommen am Institut für Digitale Forschung und Bildung Stata Analysis Tools Gewichtete Least Squares Regression HINWEIS: Dieses Ado wurde auf Ersuchen des Autors mitgetragen. Wir schlagen seinen Gebrauch nicht vor und werden nicht mehr unterstützt. Gewichtete kleinste Quadrate stellen eine Methode für den Umgang mit Heterosedastizität zur Verfügung. Mit dem Befehl wls0 können verschiedene WLS-Lösungen berechnet werden. Sie können wls0 über das Internet herunterladen, indem Sie findit wls0 eingeben (siehe Wie kann ich den Befehl findit verwenden, um nach Programmen zu suchen und zusätzliche Hilfe für weitere Informationen über die Verwendung von findit zu erhalten). Wir verwenden ein Beispiel Datensatz, der Heterosedastizität, hetdata zeigt. Die Residual-versus-Income-Skala zeigt deutliche Hinweise auf Heterosedastizität. Lets versuchen eine WLS Gewichtung proportional zum Einkommen. Der WLS-Typ, abse. Verwendet den Absolutwert der Residuen und in diesem Fall keine Konstante. Der Restplot ist besser. Wir können versuchen, andere Möglichkeiten, wie, Gewichtung proportional zu Einkommen und Einkommen quadriert. Schließlich können wir versuchen, eine weitere Variation. Dieses Mal werden wir die Anpassung proportional zum Logarithmus der quadrierten Residuen machen. Zusätzlich zu den Gewichtstypen abse und loge2 gibt es quadrierte Residuen (e2) und quadrierte Anpassungswerte (xb2). Das Finden der optimalen WLS-Lösung erfordert detaillierte Kenntnisse Ihrer Daten und versucht verschiedene Kombinationen von Variablen und Arten von Gewichtung. Der Inhalt dieser Website darf nicht als eine Bestätigung einer bestimmten Website, eines Buches oder Softwareprodukts durch die Universität von Kalifornien ausgelegt werden.13.1 - Gewichtete kleinste Quadrate Die Methode der gewöhnlichen kleinsten Quadrate nimmt an, dass es eine konstante Varianz der Fehler gibt (Die sogenannte Homosedastizität). Die Methode der gewichteten kleinsten Quadrate kann verwendet werden, wenn die gewöhnliche Kleinste-Quadrate-Annahme einer konstanten Varianz in den Fehlern verletzt wird (was als Heterosedastizität bezeichnet wird). Das betrachtete Modell ist, wo jetzt (epsilon) angenommen wird (multivariate) normal verteilt mit Mittelwertvektor 0 und nichtkonstante Varianz-Kovarianz-Matrix begin left (Anfang sigma amp 0 amp ldots amp 0 0 amp sigma amp ldots amp 0 vdots amp vdots Amp ddots amp vdots 0 amp 0 amp ldots amp sigma Ende rechts). End Wenn wir den Reziprokwert jeder Varianz (sigma) als Gewicht (wi 1sigma) definieren, dann sei die Matrix W eine Diagonalmatrix, die diese Gewichte enthält: begin textbf left (begin w amp 0 amp ldots amp 0 0amp w amp Ldots amp 0 vdots amp vdots amp ddots amp vdots 0amp 0 amp ldots amp w Ende rechts). Die gewichtete Schätzung der kleinsten Quadrate ist dann Mit dieser Einstellung können wir einige Beobachtungen machen: Da jedes Gewicht umgekehrt proportional zur Fehlerabweichung ist, spiegelt es die Informationen in dieser Beobachtung. So hat eine Beobachtung mit kleiner Fehlerabweichung ein großes Gewicht, da sie relativ mehr Informationen enthält als eine Beobachtung mit großer Fehlerabweichung (geringes Gewicht). Die Gewichte müssen bis zu einer Proportionalitätskonstante bekannt (oder häufiger geschätzt) werden. Um zu veranschaulichen, betrachten Sie den berühmten 1878 galton. txt-Datensatz, der aus 7 Messungen von X Parent (Erbsendurchmesser in Zoll der Mutterpflanze) und Y Progeny (durchschnittlicher Erbsendurchmesser in Zoll von bis zu 10 Pflanzen, die aus Samen der Stammpflanze gezüchtet wurden, besteht ). Ebenfalls im Datensatz enthalten sind Standardabweichungen, SD. Der Nachkommenerbsen, die von jedem Elternteil gezüchtet wurden. Diese Standardabweichungen reflektieren die Information in den Antwort-Y-Werten (dies sind Durchschnittswerte), so daß bei der Schätzung eines Regressionsmodells die Obervationen mit einer großen Standardabweichung abgewichtet und die Beobachtungen mit einer kleinen Standardabweichung aufgewichtet werden sollten. Mit anderen Worten sollten wir gewichtete kleinste Quadrate mit Gewichten gleich 1 SD 2 verwenden. Die resultierende angepasste Gleichung von Minitab für dieses Modell ist: Nachkommen 0.12796 0,2048 Elternteil Vergleichen Sie dies mit der angepassten Gleichung für das gewöhnliche Modell der kleinsten Quadrate: Nachkommen 0,12703 0,2100 Elternteil Gleichungen sind sehr unterschiedlich, aber wir können eine gewisse Intuition in die Auswirkungen der Verwendung von gewichteten kleinsten Quadraten gewinnen, indem wir ein Scatterplot der Daten mit den zwei überlagerten Regressionslinien betrachten: Die schwarze Linie stellt die OLS-Anpassung dar, während die rote Linie die WLS-Anpassung darstellt. Die Standardabweichungen neigen dazu, sich zu erhöhen, wenn der Wert von Elternteil zunimmt, so dass die Gewichte dazu neigen, abzunehmen, wenn der Wert von Elternteil zunimmt. So wird auf der linken Seite des Graphen, wo die Beobachtungen aufgewichtet werden, die rote eingepasste Linie etwas näher an den Datenpunkten gezogen, während auf der rechten Seite des Graphen, wo die Beobachtungen nach unten gewichtet werden, die rote eingepasste Linie etwas weiter von den Datenpunkten entfernt ist. Für dieses Beispiel waren die Gewichte bekannt. Es gibt andere Umstände, in denen die Gewichte bekannt sind: In der Praxis ist für andere Arten von Datensätzen die Struktur von W gewöhnlich unbekannt, so daß wir zuerst eine gewöhnliche kleinste Quadrate (OLS) - Regression ausführen müssen. Wenn die Regressionsfunktion geeignet ist, ist der i-te quadrierte Rest aus der OLS-Anpassung eine Schätzung von (sigmai2) ​​und der i-te absolute Rest ist eine Schätzung von (sigmai) (die dazu neigt, ein nützlicherer Schätzer in der Gegenwart zu sein Der Ausreißer). Die Residuen sind viel zu variabel, um direkt bei der Schätzung der Gewichte (wi,) verwendet zu werden. Daher verwenden wir entweder die quadratischen Residuen, um eine Varianzfunktion oder die absoluten Residuen zu schätzen, um eine Standardabweichungsfunktion zu schätzen. Wir verwenden diese Varianz - oder Standardabweichungsfunktion, um die Gewichte abzuschätzen. Einige mögliche Varianz - und Standardabweichungsfunktionsschätzungen umfassen: Wenn ein Restdiagramm gegen einen Prädiktor eine Megaphonform aufweist, dann rückgängig machen die Absolutwerte der Residuen gegen diesen Prädiktor. Die resultierenden angepaßten Werte dieser Regression sind Schätzungen von (Sigma). (Und denken Sie daran (wi 1sigma)). Wenn eine Residualkurve gegen die eingepassten Werte eine Megaphonform aufweist, dann die Absolutwerte der Residuen gegen die eingefügten Werte zurückrechnen. Die resultierenden angepaßten Werte dieser Regression sind Schätzungen von (Sigma). Wenn ein Residuenplot der quadrierten Residuen gegen einen Prädiktor einen Aufwärtstrend zeigt, dann regressieren die quadrierten Residuen gegen diesen Prädiktor. Die resultierenden angepaßten Werte dieser Regression sind Schätzungen von (Sigma 2). Wenn eine Residualkurve der quadrierten Residuen gegen die eingepassten Werte einen Aufwärtstrend zeigt, dann regressieren sie die quadrierten Residuen gegen die angepassten Werte. Die resultierenden angepaßten Werte dieser Regression sind Schätzungen von (Sigma 2). Nach Verwendung einer dieser Methoden zur Schätzung der Gewichte (wi) verwenden wir diese Gewichte bei der Schätzung eines gewichteten Regressionsmodells der kleinsten Quadrate. Wir betrachten einige Beispiele für diesen Ansatz im nächsten Abschnitt. Einige wichtige Punkte bezüglich der gewichteten kleinsten Quadrate sind: Die Schwierigkeit in der Praxis besteht darin, Abschätzungen der Fehlerabweichungen (oder Standardabweichungen) zu bestimmen. Die gewichteten Schätzungen der kleinsten Quadrate der Koeffizienten sind üblicherweise fast dieselben wie die gewöhnlichen ungewichteten Schätzungen. In Fällen, in denen sie sich erheblich unterscheiden, kann das Verfahren iteriert werden, bis sich die geschätzten Koeffizienten stabilisieren (oft in nicht mehr als ein oder zwei Iterationen). Dies wird iterativ wiedergewichtete kleinste Quadrate genannt. In einigen Fällen können die Werte der Gewichte auf Theorie oder vorheriger Forschung basieren. In entworfenen Experimenten mit einer großen Anzahl von Replikaten können Gewichte direkt aus den Probenvariationen der Antwortvariablen bei jeder Kombination von Prädiktorvariablen abgeschätzt werden. Die Verwendung von Gewichten wird (legitim) die Breite der statistischen Intervalle beeinflussen. Navigation

No comments:

Post a Comment