Tuesday, 28 February 2017

Recht Zensur In Stata Forex

HINWEIS: Die IDRE Statistical Consulting Group wird im Februar die Website auf das WordPress CMS migrieren, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen im Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group mit einem Geschenk Stata Datenanalyse Beispiele Tobit Analysis Versionsinfo: Der Code für diese Seite wurde in Stata 12 getestet. Das Targetmodell, auch zensiertes Regressionsmodell genannt, wurde entwickelt Um lineare Beziehungen zwischen Variablen abzuschätzen, wenn entweder links - oder rechtszensierend in der abhängigen Variablen (auch bekannt als Zensieren von unten bzw. oben). Eine Zensierung von oben findet statt, wenn Fälle mit einem Wert bei oder oberhalb einer Schwelle alle den Wert dieser Schwelle annehmen, so daß der wahre Wert gleich dem Schwellenwert sein kann, aber er könnte auch höher sein. Im Falle der Zensur von unten werden Werte, die bei oder unterhalb einer Schwelle fallen, zensiert. Bitte beachten Sie: Der Zweck dieser Seite ist, zu zeigen, wie man verschiedene Datenanalyse-Befehle verwendet. Es deckt nicht alle Aspekte des Forschungsprozesses, die Forscher erwartet werden, zu tun. Dabei werden insbesondere die Datenreinigung und - prüfung, die Überprüfung der Annahmen, die Modelldiagnose und die möglichen Folgeanalysen nicht berücksichtigt. Beispiele für die Umkehrung des Rückgangs Beispiel 1. In den 1980er Jahren gab es ein Bundesgesetz, das die Geschwindigkeitsmesswerte auf nicht mehr als 85 Meilen pro Stunde beschränkte. Wenn Sie also versuchen wollten, ein Fahrzeug mit einer Höchstgeschwindigkeit aus einer Kombination von Pferdestärke und Motorgröße vorhersagen zu lassen, würden Sie eine Lektüre von nicht mehr als 85 erhalten, unabhängig davon, wie schnell das Fahrzeug wirklich reiste. Dies ist ein klassischer Fall der Rechtszensur (Zensierung von oben) der Daten. Das einzige, was wir sicher sind, ist, dass diese Fahrzeuge waren mindestens 85 Stundenmeilen unterwegs. Beispiel 2. Ein Forschungsprojekt untersucht das Blei in Trinkwasser als Funktion des Alters eines Haus - und Familieneinkommens. Das Wasser-Test-Kit kann keine Bleikonzentrationen unter 5 ppb erkennen. Die EPA hält über 15 ppb für gefährlich. Diese Daten sind ein Beispiel für Linkszensur (Zensur von unten). Beispiel 3. Betrachten wir die Situation, in der wir ein Maß für die akademische Eignung (skaliert 200-800) haben, die wir unter Verwendung von Lese - und Mathematik-Test-Scores sowie der Art des Programms, in dem der Schüler eingeschrieben ist, modellieren (akademisch, allgemein Oder beruflich). Das Problem hierbei ist, dass Schüler, die alle Fragen auf dem akademischen Eignungstest korrekt beantworten, eine Punktzahl von 800 richtig erhalten, obwohl es wahrscheinlich ist, dass diese Schüler nicht wirklich in Eignung gleich sind. Das gleiche gilt für Studenten, die alle Fragen falsch beantworten. Alle diese Schüler haben eine Punktzahl von 200, obwohl sie nicht alle von gleicher Eignung sein können. Beschreibung der Daten Lets verfolgen Beispiel 3 von oben. Wir haben eine hypothetische Datendatei, tobit. dta mit 200 Beobachtungen. Die akademische Aptitude-Variable ist apt, die Lese-und Mathe-Test Partituren gelesen werden bzw. Mathematik. Die Variable prog ist die Art des Programms, in dem der Schüler ist, es ist eine kategorische (nominale) Variable, die drei Werte annimmt, akademisch (prog 1), allgemein (prog 2) und beruflich (prog 3). Sehen wir uns die Daten an. Beachten Sie, dass in diesem Datensatz der niedrigste Wert von apt 352 ist. Keine Schüler erhielten eine Punktzahl von 200 (d. H. Die niedrigste Punktzahl möglich), was bedeutet, dass, obwohl eine Zensierung von unten möglich war, sie nicht im Datensatz vorkommt. Betrachtet man das obige Histogramm, das die Verteilung von apt zeigt. Können wir die Zensur in den Daten sehen, das heißt, es gibt weit mehr Fälle mit Noten von 750 bis 800, als man erwarten würde, den Rest der Verteilung zu betrachten. Unten ist ein alternatives Histogramm, das den Überschuss von Fällen, in denen apt 800 hervorgehoben wird, weiter hervorhebt. Im nachfolgenden Histogramm erzeugt die diskrete Option ein Histogramm, wobei jeder eindeutige Wert von apt einen eigenen Balken aufweist. Die Option freq bewirkt, dass die y-Achse mit der Frequenz für jeden Wert und nicht mit der Dichte markiert wird. Da apt stetig ist, sind die meisten Werte von apt im Dataset eindeutig, obwohl nahe an der Mitte der Verteilung gibt es einige Werte von apt, die zwei oder drei Fälle haben. Der Spike ganz rechts im Histogramm ist der Balken für Fälle, in denen apt 800, die Höhe dieser Balken relativ zu allen anderen deutlich zeigt die überschüssige Anzahl von Fällen mit diesem Wert. Weiter gut erforschen die bivariate Beziehungen in unserem Datensatz. In der letzten Zeile der Scatterplot-Matrix, die oben gezeigt ist, sehen wir die Scatterplots, die read und apt zeigen. Sowie Mathe und apt. Beachten Sie die Sammlung von Fällen an der Spitze eines jeden Streudiagramm aufgrund der Zensur in der Verteilung von apt. Analysemethoden, die Sie berücksichtigen könnten Im Folgenden finden Sie einige Analysemethoden, die Ihnen begegnet sind. Einige der aufgeführten Methoden sind recht vernünftig, während andere entweder aus der Bevorzugung gefallen oder haben Einschränkungen. Tobit-Regression, der Schwerpunkt dieser Seite. OLS Regression - Sie konnten diese Daten mit OLS-Regression zu analysieren. OLS-Regression behandelt die 800 als die tatsächlichen Werte und nicht als die obere Grenze der Top-akademischen Eignung. Eine Beschränkung dieses Ansatzes besteht darin, dass OLS, wenn die Variable zensiert wird, inkonsistente Schätzungen der Parameter liefert, was bedeutet, dass die Koeffizienten aus der Analyse sich nicht notwendigerweise den Quottruequot-Populationsparametern nähern, wenn die Probengröße zunimmt. Eine ausführlichere Erörterung der Probleme der Verwendung der OLS-Regression mit zensierten Daten finden Sie unter Long (1997, Kapitel 7). Trunkierte Regression - Es gibt manchmal Verwirrung über den Unterschied zwischen verkürzten Daten und zensierten Daten. Bei zensierten Variablen befinden sich alle Beobachtungen im Datenbestand, aber wir kennen die Quottruequot-Werte von einigen von ihnen nicht. Bei der Trunkierung werden einige der Beobachtungen aufgrund des Wertes der Variablen nicht in die Analyse einbezogen. Wenn eine Variable zensiert wird, liefern Regressionsmodelle für abgeschnittene Daten inkonsistente Schätzungen der Parameter. Eine ausführlichere Diskussion über Probleme bei der Verwendung von Regressionsmodellen für verkürzte Daten zur Analyse zensierter Daten finden Sie in Long (1997, Kapitel 7). Tobit-Regression Unten führen wir das Target-Modell mit read aus. Math Und prog apt vorhersagen. Die Option ul () im Befehl tobit gibt den Wert an, bei dem die Rechtszensierung beginnt (d. h. die obere Grenze). Es gibt auch eine ll () - Option, um den Wert der linken Zensur (die untere Grenze) anzugeben, die in diesem Beispiel nicht benötigt wurde. Das i. Bevor prog anzeigt, dass prog ein Faktor ist, der variabel ist (d. H. Kategorische Variable), und dass er in dem Modell als eine Reihe von Dummy-Variablen enthalten sein sollte. Beachten Sie, dass diese Syntax in Stata 11 eingeführt wurde. Die endgültige Log-Wahrscheinlichkeit (-1041.0629) wird am oberen Rand der Ausgabe angezeigt, es kann in Vergleichen von verschachtelten Modellen verwendet werden, aber wir zeigen hier kein Beispiel. Auch an der Spitze der Ausgabe sehen wir, dass alle 200 Beobachtungen in unserem Datensatz verwendet wurden (weniger Beobachtungen wären verwendet worden, wenn irgendeine unserer Variablen fehlende Werte hätte). Das Wahrscheinlichkeitsverhältnis chi-Quadrat von 188.97 (df4) mit einem p-Wert von 0.0001 sagt uns, dass unser Modell als Ganzes wesentlich besser passt als ein leeres Modell (d. h. ein Modell ohne Prädiktoren). In der Tabelle sehen wir die Koeffizienten, ihre Standardfehler, die t-Statistik, die zugehörigen p-Werte und das 95 Konfidenzintervall der Koeffizienten. Die Koeffizienten für das Lesen und die Mathematik sind ebenso statistisch signifikant wie der Koeffizient für Prog 3. Tobit-Regressionskoeffizienten werden in ähnlicher Weise wie OLS-Regressionskoeffizienten interpretiert, der lineare Effekt jedoch auf der unzensierten latenten Variable, nicht auf dem beobachteten Ergebnis. Siehe McDonald und Moffitt (1980) für weitere Details. Für eine Einerhöhung des Lesens. Gibt es einen 2,7-Punkte-Anstieg in der vorhergesagten Wert von apt. Eine Erhöhung der Mathematik um eine Einheit ist mit einer Erhöhung des prognostizierten Werts von apt um 5,91 Einheiten verbunden. Die Begriffe für Prog haben eine etwas andere Interpretation. Der prognostizierte Wert von apt beträgt für Schüler in einem Berufsprogramm (prog 3) 46,14 Punkte niedriger als für Studierende in einem akademischen Programm (prog 1). Das statistische Nebensigma ist analog zur Quadratwurzel der Restvarianz der OLS-Regression. Der Wert von 65,67 kann mit der Standardabweichung der akademischen Eignung verglichen werden, die 99,21 betrug, eine wesentliche Reduktion. Die Ausgabe enthält auch eine Schätzung des Standardfehlers von Sigma sowie des 95 Konfidenzintervalls. Schließlich liefert die Ausgabe eine Zusammenfassung der Anzahl der linkszensierten, unzensierten und rechtszensierten Werte. Wir können für einen Gesamteffekt von Prog mit dem Test-Befehl testen. Im Folgenden sehen wir, dass der Gesamteffekt von prog statistisch signifikant ist. Wir können auch zusätzliche Hypothesen über die Unterschiede in den Koeffizienten für verschiedene Ebenen der Prog. Im Folgenden wird untersucht, dass der Koeffizient für prog 2 gleich dem Koeffizienten für prog 3 ist. In der nachfolgenden Ausgabe sehen wir, dass der Koeffizient für prog 2 signifikant von dem Koeffizienten für prog 3 abweicht Unser Modell passt. Dies kann insbesondere beim Vergleich konkurrierender Modelle nützlich sein. Eine Methode, um dies zu tun, besteht darin, die vorhergesagten Werte auf der Grundlage des Modells des Todes mit den beobachteten Werten in dem Datensatz zu vergleichen. Im Folgenden verwenden wir Vorhersage, um prognostizierte Werte von apt basierend auf dem Modell zu generieren. Als nächstes korrelieren wir die beobachteten Werte von apt mit den vorhergesagten Werten (yhat). Die Korrelation zwischen den prognostizierten und beobachteten Werten von apt beträgt 0,7825. Wenn wir diesen Wert quadrieren, erhalten wir die multiple quadratische Korrelation, dies zeigt, dass die vorhergesagten Werte etwa 61 (0,78252 0,6123) ihrer Varianz mit apt teilen. Zusätzlich können wir den benutzerdefinierten Befehl fitstat verwenden, um eine Vielzahl von Anpassungsstatistiken zu erzeugen. Weitere Informationen zu fitstat erhalten Sie, indem Sie findit fitstat eingeben (siehe Wie kann ich den Befehl findit verwenden, um nach Programmen zu suchen und zusätzliche Hilfe für weitere Informationen über die Verwendung von findit zu erhalten). Stata Online-Handbuch tobit Ähnliche Stata-Befehle cnreg - zensiert normale Regression, in denen die zensierenden Werte von Beobachtung zu Beobachtung ändern können. Intreg - Intervallregression, bei der Beobachtungen Punktdaten, Intervalldaten, linkszensierte Daten oder rechtszensierte Daten sein können. References Long, J. S. (1997). Regressionsmodelle für kategorische und begrenzte abhängige Variablen. Thousand Oaks, CA: Sage Veröffentlichungen. McDonald, J. F. und Moffitt, R. A. 1980. Die Verwendung der Tobit-Analyse. Der Bericht über Wirtschaft und Statistik Vol. 62 (2): 318-321. Tobin, J. (1958). Schätzung der Beziehungen für begrenzte abhängige Variablen. Econometrica 26: 24-36. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt von der Universität von Kalifornien ausgelegt werden. Stata: Datenanalyse und statistische Software Neue Funktionen für zensierte Ergebnisse und Modellsituationen Wir können oft nicht beobachten oder Messen ein Ergebnis über seine gesamte Bandbreite. Tests zum Nachweis eines Toxins verlangen oft, dass das Toxin einen Schwellenwert überschreitet, bevor es nachgewiesen werden kann. Patientengewichte werden an der oberen Grenze der Waage zensiert, die verwendet wird, um sie zu messen. In Bezug auf Links - und Rechtszensur sind Intervallmessungen oder Intervallzensur. Das Einkommen kann in Bereichen (0 bis 10.000, 10.001 bis 30.000, 30.001 bis 60.000, 60.001 und höher) beurteilt werden, oder das Patientengewicht kann in Bereichen aufgezeichnet werden (0 bis 80 Pfund, 81 bis 120 Pfund, 121 bis 120 Pfund, 151 bis 180 Pfund, 181 bis 220 Pfund, 221 bis 220 Pfund) , Über 250 Pfund). Stata ist seit langem in der Lage, Regressionsmodelle mit zensierten Ergebnissen abzuschätzen. Tobit kann Modelle mit Links - oder Rechtszensur auf Festwerte schätzen. Intreg können Modelle mit Intervallmessungen oder Zensur schätzen, die sich durch Beobachtungen unterscheiden. Neu mit dem Stata-13.1-Update können Sie nun Modelle mit zensierten oder intervall-gemessenen Gauss-Ergebnissen abbilden, die auch Heckman-Stil-Auswahl, endogene Behandlungen, um durchschnittliche Behandlungseffekte (ATEs), kovariate Messfehler und nicht beobachtete Komponenten zu erhalten. Sie können endogene Regressoren in jedem Teil der Modelle enthalten. Sie können diese Modelle auch in einem Panel-Daten - oder Multilevel-Daten-Kontext mit zufälligen Effekten (Interviews) und zufälligen Koeffizienten in einem beliebigen Teil oder allen Teilen des Modells abschätzen. Alle diese Modelle können als Teile von größeren multivariaten Systemen geschätzt werden. Zensierte oder Intervall-gemessene Ergebnisse können sogar an endogenen Schaltmodellen teilnehmen. Stellen Sie sich vor, wir haben Daten über Einkommen. Diese Daten sind oft topcodiert oder zensiert an einer oberen Grenze, um die Meldungsraten zu erhöhen. Wenn diese Grenze 150.000 betrug, konnten wir ein Regressionsmodell des Einkommens für Bildung und Alter durch die Eingabe schätzen (Wir könnten Logprotokolle bevorzugen, aber der Einfachheit halber nutzen wir hier Einkommen.) Alle neuen Funktionen werden mit Hilfe der Stata 13rsquos generalisierten Strukturgleichung erhalten Modellierung commandmdash gsem. Der äquivalente gsem-Befehl ist Wir können eine endogene Kovarianz einführen, etwa Wochen, indem wir eine Gleichung für Wochen mit den Instrumenten (z1 und z2) und einer gemeinsamen unobservierten Komponente (UC) mit identifizierbaren Einschränkungen, die unter Verwendung von. Wenn wir Panel-Daten mit wiederholten Messungen an Individuen (id) haben, können wir einen Zufallseffekt (Intercept) in das Einkommensmodell einführen, indem wir REID hinzufügen. Wir können sogar einen zufälligen Koeffizienten auf das Alter addieren, indem wir eine zufällige latente Variable (RCid) mit dem Alter interagieren. Handhabung Heckman-Stil Auswahl in der gsem-Framework erfordert ein wenig Setup. Ein Beispiel, das unzensierte Ergebnisse verwendet, ist im Referenzhandbuch für die strukturelle Gleichungsmodellierung zu sehen. Für zensierte Ergebnisse müssen Sie lediglich die Option lcensored () oder rcensored () zur Option family () hinzufügen. Für Intervall-gemessene Daten fügen Sie die Unteroption ldepvar () oder udepvar () hinzu, um die untere oder obere Grenze des Intervalls anzugeben. Die abhängige Variable gibt die andere Schranke an. Ein endogenes Behandlungs-Effekt-Beispiel ohne Zensur ist in dem Referenzhandbuch für die strukturelle Gleichungsmodellierung zu sehen. Wieder fügen Sie einfach lcensored () oder rcensored () zu Familie (), wenn das Ergebnis zensiert wird. Für Intervall-gemessene Daten fügen Sie die Unteroption ldepvar () oder udepvar () hinzu, um die untere oder obere Grenze des Intervalls anzugeben. Die abhängige Variable gibt die andere Schranke an. Sie können entweder die oben gezeigten Befehle oder Statarsquos SEM Builder verwenden, um diese Modelle zu erstellen und zu schätzen. Stata 13.1 bietet alles, was Sie mit zensierten Ergebnissen. Lesen Sie über die anderen neuen Funktionen von generalisierten SEM. Hier finden Sie eine Übersicht über SEM und verallgemeinerte SEM, Links zu Videos, Links zu bearbeiteten Beispielen und sogar das vollständige PDF von Stata 13rsquos Structural Equation Modeling Reference Manual.


No comments:

Post a Comment