Lerneinheit 7: Datenmanagement mit SPSS

Im siebten und letzten Kapitel dieses Kurses möchten wir uns dem wichtigen Thema "Datenmanagement und –bearbeitung mit SPSS" widmen. Hier geht es u.a. um die Fragen, wie man mit selbst erstellten oder vorhandenen SPSS-Datensätzen umgeht oder was man für ein sauberes und strukturiertes Arbeiten mit seinen Daten beachten sollte. Zu diesen Themen werden wir Ihnen vor allem im Lernschritt eins sehr viele Tipps geben.

Eine wichtige Thematik folgt auch im zweiten Lernschritt: Die Modifikation vorhandener Daten. Die Beantwortung vieler Forschungsfragen und Hypothesen erfordert zunächst einmal eine Veränderung der vorliegenden Daten. Dabei kann es sich bspw. um eine Veränderung des Skalenniveaus handeln: aus metrisch skalierten Variablen werden durch Bildung von Gruppen bspw. ordinalskalierte Variablen generiert. Eine gängige Form der Datenmodifikation ist auch die Bildung von Indizes: mehrere Variablen können bspw. zu einer neuen Variable addiert werden. Im Zentrum dieser Thematik steht immer die Bildung neuer Variablen durch "Umkodieren" oder "Berechnen".

Abschließend zeigen wir Ihnen, wie Sie bei Ihren Berechnungen bestimmte Fälle ausschließen können. SPSS bietet die Möglichkeit, eine Analyse bspw. nur auf die Gruppe der Frauen oder nur auf die Gruppe der 30-49-Jährigen zu beschränken. Alle anderen Fälle, die nicht in die Berechnung mit eingeschlossen werden sollen, werden dann "herausgefiltert". Wie Sie solche "Filter" setzen können, erfahren Sie in Lernschritt drei.

Lernziele dieser Lerneinheit:

1. Datenmanagement

Das Management und Handling von Daten und Datensätzen kann nicht wichtig genug eingeschätzt werden. Nur wer hier sauber arbeitet, hat auch nach der Datenanalyse die Chance, sein Vorgehen reproduzieren zu können. Zum richtigen Management von Daten zählen wir in diesem Rahmen auch die Datenbereinigung, ein unerlässlicher Arbeitsschritt, der vor Beginn jeder Datenanalyse durchzuführen ist.

Lernabschnitt eins behandelt das Thema "Handling von Datensätzen". Hier geht es unter anderem um eine richtige Benennung von Datensätzen.

Das wichtige Thema Datenbereinigung ist Gegenstand von Lernabschnitt zwei. Hier lernen Sie, wie Sie fehlerhafte Eingaben metrischer und diskreter Daten aufdecken und beseitigen können.

Um auch später die Ergebnisgewinnung nachvollziehen zu können, ist eine saubere Dokumentation der einzelnen Analyseschritte unerlässlich. Diesem Thema widmet sich der dritte Lernabschnitt.

2. Datenmodifikation

In der datenanalytischen Praxis ist es sehr häufig der Fall, dass Sie die Variablen zur Beantwortung Ihrer Forschungsfragen in anderer Form benötigen, als Sie sie erhoben haben. Dafür müssen Sie die erhobenen und in SPSS eingegeben Daten nachträglich modifizieren.

Ein Beispiel soll die Notwendigkeit der Datenmodifikation beim Prozess der Datenanalyse verdeutlichen. Nehmen wir an, Sie haben im Rahmen einer Befragung die TV-Nutzungsdauer als metrische Variable in Minuten erhoben. Jeder Befragte hat also im Fragebogen einen einzelnen Wert angegeben, bspw. 300 Minuten oder 180 Minuten.

Nehmen wir weiter an, Sie wollen die folgende Hypothese beantworten: TV-Vielseher überschätzen die Anzahl der Morde in Deutschland häufiger als TV-Wenigseher.

Die Prüfung dieser Hypothese erfordert eine Einteilung der Stichprobe in TV-Viel-, Wenig-, und gegebenenfalls Durchschnittsseher auf Grundlage der Variable "TV-Nutzungsdauer in Minuten". Diese ursprünglich metrische Variable muss also zu der ordinalskalierten Variable "TV-Nutzungsdauer in Gruppen" modifiziert werden. Eine solche Form der Datenbearbeitung lässt sich in SPSS ganz einfach durchführen.

In diesem Lernschritt wollen wir zwei Formen der Datenmodifikation in SPSS genauer betrachten. Hierbei handelt es sich um die Funktionen

Beide Funktionen finden Sie im Menü "Transformieren".

für Detailansicht bitte klicken

Menüpunkte "Berechnen" und "Umkodieren"

3. Datenselektion

Sehr häufig kommt es vor, dass für die Beantwortung einer Forschungsfrage oder Hypothese nur ein Teil der Daten relevant ist. Dies ist zum Beispiel dann der Fall, wenn Sie die folgende Hypothese beantworten möchten:

Jüngere Frauen überschätzen die Anzahl der Morde in Deutschland häufiger als ältere Frauen.

Zur Beantwortung dieser Hypothese müssen wir nur die Gruppe der Frauen heranziehen, die Männer können dagegen ausgeblendet werden.

SPSS stellt für diese Problemstellung die Funktion "Fälle auswählen" zur Verfügung, die wir in diesem Lernschritt genauer betrachten wollen.

Sollen mehrere Gruppen gleichzeitig selektiert werden, hilft die Funktion "Datei aufteilen" weiter, die in Lernabschnitt zwei behandelt wird.

Beide Funktionen finden Sie im Menü "Daten":

für Detailansicht bitte klicken

Menüpunkte  "Datei aufteilen" und "Fälle auswählen"