R Code meiner Master-Arbeit
Data Scientists verbringen einen großen Teil ihrer Zeit (bis zu 80 %) damit, die Daten in die richtige Form zu bringen. Dieser entscheidende Schritt ist absolut notwendig, sonst kann eine Datenanalyse nicht durchgeführt werden. Das Schweizer Haushaltspanel - den Datensatz, den ich für meine empirische Analyse in meiner Masterarbeit verwendet habe - ist ein gutes Beispiel, um meine Erfahrung mit der Datenverarbeitung zu illustrieren. Zum Beispiel musste ich das:
- Die Variablen, die aus den von mir verwendeten theoretischen Modellen abgeleitet wurden, umbenennen und auswählen,
- Die Daten vom Breit- ins Langformat (und umgekehrt) umwandeln, um die verschiedenen Familienmitglieder eines Haushalts zu unterscheiden,
- Mit fehlenden Daten (missing Values) umgehen, aber auch
- Neue Variablen auf der Grundlage bereits vorhandener Variablen erstellen.
Wie diese Punkte verdeutlichen, bestand ein wesentlicher Teil meiner Masterarbeit unter anderem darin, diesen unbereinigten Datensatz in eine Form zu bringen, die für die Anwendung der von mir gewählten quantitativen Methoden geeignet war.
DOWNLOAD MEINES R-CODES