DSS - Wie ein Codebuch verwenden
Diese Anweisungen erläutern, welche Informationen Sie suchen sollen, wenn ein Codebuch verwendet wird, sowie, wie die Informationen in dem Codebuch zu den Aussagen übersetzen müssen Sie SAS, SPSS oder Stata Programme schreiben, die Daten zu lesen und zu analysieren.
Vor der Suche nach einem Codebuch, müssen Sie zunächst feststellen, ob Sie die Daten tatsächlich benötigen, oder wenn Sie müssen nur die Ergebnisse der Studie, das heißt, wie viele Menschen in New York lebt. Manchmal braucht man nicht auf alle Daten, die Sie gerade eine der vielen statistischen Berichte oder Zusammenfassungen in der Bibliothek verwenden können. Wenn in der Tat, die Daten benötigen Analysen zu tun, dann müssen Sie eine Studie oder Studien finden, die untersucht, was Sie suchen auf und lesen Sie die Codebuch, um sicherzustellen, dass die Studie die Art der Daten, die Sie benötigen.
Datei
Da ein Codebuch-Dateien Daten beschreibt, wäre es an dieser Stelle nützlich sein, um zu diskutieren, welche Daten-Dateien sind und die viele Formate, in denen sie kommen. Eine Datendatei ist einfach eine Computer-Datei, die Daten enthält. Die meisten Datendateien werden wie Tabellen angeordnet, wo Sie Zeilen von Informationen aus jeder Beobachtung haben (eine Person, ein Staat oder ein Unternehmen) und Spalten von Informationen verschiedene Variablen darstellen. Der Hauptunterschied zwischen einer Kalkulationstabelle und einer Datendatei ist, dass jede Spalte in einer Tabelle eine Variable in einer Datendatei entspricht. Jede Variable einer Datendatei besteht aus einer oder mehreren Spalten gemacht. Manchmal wird die Datendatei Leerzeichen zwischen den Gruppen von Spalten, die eine Variable bilden, aber die meiste Zeit wird es einfach alles zusammen laufen. Hier ist eine Beispieltabelle:
Hier ist, was die gleichen Informationen wie in einer Datendatei aussehen könnte:
Die erste Zeile der Zahlen ist nicht wirklich ein Teil der Daten, haben wir es dort setzen, so dass Sie sehen können, wie die Spalten in einer Datendatei auf die Spalten in einer Tabelle beziehen. In diesem Beispiel ist Kolonne A in der Tabelle Spalte 1 in der Datendatei ist, ist die Spalte B Spalten 2-3, ist Spalte C Spalten 4-8, und Spalte D ist Spalten 9-14. Wenn Sie genau hinsehen, können Sie sehen, dass die tatsächlichen Zahlen und Buchstaben die gleiche in beiden Dateien sind. Da die Informationen in der Datendatei alle zusammen laufen sind, müssen Sie eine Möglichkeit, zu bestimmen, wo eine Variable endet und die nächste beginnt. Diese, unter vielen anderen wichtigen Dingen werden im Codebuch gefunden. Dies ist die einfachste Format einer Datendatei und die meisten kommen wie diese. Die beiden Beispiele haben oben eine „Linie“, „Aufnahme“ oder „Karte“ von Daten für jede Beobachtung. Oft aber wird eine Datendatei mehr als eine Zeile von Daten für jede Beobachtung. Dies ist ein Halt über aus den frühen Tagen des Rechnens, wenn alle Daten auf Lochkarten eingegeben wurden, die nur 80 Spalten hatten. Wenn eine Umfrage mehr Fragen hatte, als auf eine Karte passen könnte, dann hatten die Forscher die Daten auf eine andere Karte, um fortzufahren. Dies gilt insbesondere für Dateien, die Informationen aus der gleichen Beobachtung seit mehreren Jahren haben. Hier ist ein Beispiel:
Hierarchical-Dateien können sehr schwierig zu programmieren. Wenn Sie eine hierarchische Datei analysieren müssen, sollten Sie das DSS-Labor kommen und sprechen mit einem Berater darüber, wie dies zu tun. Natürlich haben alle diese Beispiele nur ein paar Variablen, während eine reale Datendatei viele, viele mehr haben wird.
Jetzt, da wir wissen, was eine Datendatei ist, können wir mehr Sinn aus dem machen, was ein Codebuch ist. Ein Codebuch ist eine technische Beschreibung der Daten, die für einen bestimmten Zweck gesammelt wurden. Es beschreibt, wie die Daten in der Computerdatei oder Dateien angeordnet sind, was die verschiedenen Zahlen und Buchstaben bedeuten, und spezielle Anweisungen, wie die Daten richtig zu verwenden. Wie jede andere Art von „Buch“, sind einige Codebücher besser als andere. Die besten Codebücher haben:- Beschreibung der Studie: wer es getan hat, warum sie es taten, wie sie es taten.
- Sampling Informationen: Was war die Bevölkerung untersucht, wie die Probe gezogen, was war die Ansprechrate.
- Technische Informationen zu den Dateien selbst: Anzahl der Beobachtungen, Satzlänge, Anzahl der Datensätze pro Beobachtung usw.
- Struktur der Daten in der Datei: hierarchisch, mehrere Karten, etc.
- Details zu den Daten: Spalten in denen bestimmten Variablen zu finden, ob es sich um Zeichen oder numerisch, und wenn numerisch, welches Format.
- Text der Fragen und Antworten: einige haben sogar, wie viele Menschen eine bestimmte Art und Weise reagiert.
Auch wenn ein Codebuch (oder zumindest sollten) alle diese Informationen sind nicht alle Codebücher wird es auf die gleiche Weise anordnen. Später in diesem Dokument zeigen wir Ihnen, welche Informationen Sie benötigen, um das Programm zu schreiben, um die Daten zu lesen.
Sobald Sie, dass eine Datendatei festgestellt haben, hat das, was Sie wollen, können Sie die Aufgabe des Schreibens des Programms beginnen, die in dem Sie interessiert sind, extrahieren oder diese Variablen Teilmenge. Die Wahl, welche Software-Paket zu verwenden, ist bis zu Ihnen. Sie sollten sich bewusst sein, jedoch, dass die meisten der Datensammlung des Princeton nur auf Pucc zugänglich ist, die nur SAS und SPSS hat. Auf jedem Fall ist es immer eine gute Idee zu einem Berater zu sprechen, bevor Sie die Daten zu extrahieren versuchen.
Das Schreiben des Programms
Für Beispiele klicken Sie bitte hier
Codierung, wenn es nur eine Zeile von Daten für jede Beobachtung ist:
Varname 124 (F5.2)
_column (124) Varname% 5.2f
Codierung für mehr als eine Datenzeile für jede Beobachtung:
Sie benötigen besondere Aufmerksamkeit zu widmen, wie viele Zeilen es für jede Beobachtung ist, und auf welcher Linie die Variable, die Sie interessiert sind zu finden ist. Jedes Codebuch zeigt an, was die Linie kann die Variable anders gefunden werden, so müssen Sie in den Einführungsseite sehen, wie das gemacht wird. Failure, um zu verfolgen, was die Linie die Variable ist beim Lesen von der falschen Linie führen und somit für diese Variable die falschen Informationen zu lesen.
Nehmen wir an, dass in dem obigen Beispiel 2, da für jede Beobachtung fünf Datenzeilen sind. Nehmen wir an, dass weitere varname in der ersten Zeile für eine Beobachtung gefunden wird und dass CHARNAME wird in der dritten Zeile gefunden. Hier sind die Anweisungen, die Sie benötigen würden, diese Variablen zu lesen:
SPSS:
Datenliste file = 'mydata.dat' records = 5.
/ 1 Varname 124-128
3 / CHARNAME 155-166 (a).
Stata:
infile Wörterbuch _lines (5)
_Linie 1)
_column (124) Varname% 5F
_line (3)
_column (155) string CHARNAME% 12s
>
Wie Sie in jedem Programm sehen können, müssen Sie das Programm sagen, wie viele Zeilen es für jede Beobachtung ist ( „n = 5“, „Linien = 5“ und „_lines (5)). Jedes Programm hat auch eine andere Art und Weise zu identifizieren, die Sie ihnen Zeile lesen möchten Sie könnten ( „# 1“, / 1. „_line (1)“). Wenn Sie andere Variablen aus Linien 1 oder 3 lesen wollte einfach Liste zusammen, ohne den Zeilenzeiger Wiederholung für jede Variable. Das Programm wird weiterhin von der gleichen Zeile von Daten zu lesen, bis Sie ihm sagen, in der nächsten Zeile zu gehen.
Für Informationen darüber, wie hier Daten im ASCII-Format mit Datenlayout Klick lesen
Schlussfolgerung
Dies hat zu Datendateien und Codebücher eine kurze und sehr allgemeine Einführung gewesen. Wir konnten unmöglich alles abdecken Sie sich mit einem Codebuch auftreten können. Also, wenn Sie etwas tun, finden Sie nicht verstehen, fragen Sie einen Berater!