Reliabilität und Validität von Fragebögen prüfen: Methoden 2026
Ein Fragebogen ist nur so gut wie seine Messeigenschaften. Wer in der empirischen Bachelorarbeit oder Masterarbeit einen Fragebogen einsetzt — ob standardisiert oder selbst entwickelt —, muss belegen, dass das Instrument tatsächlich das misst, was es messen soll (Validität), und dies mit hinreichender Genauigkeit und Konsistenz tut (Reliabilität). Die Prüfung dieser beiden zentralen Gütekriterien des Fragebogens ist kein optionaler Zusatz, sondern methodisches Pflichtprogramm jeder quantitativen Studie.
Dieser Leitfaden erklärt die wichtigsten Reliabilitätsmaße — Cronbachs Alpha, Retest-Reliabilität, Split-Half — sowie die zentralen Validitätsformen (Inhaltsvalidität, Konstruktvalidität, Kriteriumsvalidität) und zeigt, wie die Berechnungen in SPSS und JASP durchgeführt werden.
Reliabilität und Validität — Grundlagen und Unterschied
Die Unterscheidung zwischen Reliabilität und Validität lässt sich an einem einfachen Bild veranschaulichen: Eine Waage, die bei jeder Messung 2 kg zu viel anzeigt, ist reliabel (konsistent), aber nicht valide (trifft nicht das Wahre). Eine Waage, die mal 2 kg zu viel, mal 1 kg zu wenig anzeigt, ist weder reliabel noch valide. Nur eine Waage, die stets das korrekte Gewicht anzeigt, ist beides.
Übertragen auf Fragebögen:
- Reliabilität ist die Präzision der Messung: Würde dasselbe Instrument bei denselben Personen unter gleichen Bedingungen zu einem späteren Zeitpunkt zu denselben Ergebnissen führen?
- Validität ist die Gültigkeit der Messung: Misst das Instrument tatsächlich das theoretische Konstrukt, für das es entwickelt wurde?
Reliabilität ist eine notwendige, aber nicht hinreichende Bedingung für Validität. Ein Instrument muss reliabel sein, um valide sein zu können — aber Reliabilität allein garantiert keine Validität. Dieses Verhältnis ist für die Interpretation von Messergebnissen fundamental (vgl. Döring & Bortz, 2016, S. 442 ff.).
Die Prüfung der Gütekriterien steht in engem Zusammenhang mit der Operationalisierung des theoretischen Konstrukts. Wie ein Konstrukt in messbare Items übersetzt wird, ist im Beitrag zu Operationalisierung von Variablen ausführlich beschrieben.
Reliabilitätsmaße im Überblick
Für die Prüfung der Fragebogenreliabilität stehen mehrere Verfahren zur Verfügung, die je nach Studiensituation eingesetzt werden:
| Verfahren | Prinzip | Wann geeignet? |
|---|---|---|
| Interne Konsistenz (Cronbachs α) | Korrelation aller Items einer Skala untereinander | Standardverfahren; geeignet, wenn alle Items dasselbe Konstrukt messen |
| Retest-Reliabilität | Korrelation zweier Messungen zu verschiedenen Zeitpunkten | Wenn das Konstrukt über Zeit stabil sein sollte; Abstand 2–6 Wochen empfohlen |
| Paralleltest-Reliabilität | Korrelation zweier äquivalenter Testversionen | Wenn zwei Parallelformen des Instruments vorliegen |
| Split-Half-Reliabilität | Items werden in zwei Hälften geteilt; Korrelation der Hälften | Wenn nur eine Messung möglich ist; Spearman-Brown-Korrektur notwendig |
| Interrater-Reliabilität | Übereinstimmung zwischen verschiedenen Beurteilenden | Wenn subjektive Einschätzungen oder Beobachtungen bewertet werden |
Cronbachs Alpha: Berechnung und Interpretation
Cronbachs Alpha (α) ist das in Abschlussarbeiten bei weitem am häufigsten eingesetzte Reliabilitätsmaß. Es wurde 1951 von Lee J. Cronbach veröffentlicht und misst die interne Konsistenz einer Skala — also den Grad, in dem alle Items der Skala dasselbe latente Konstrukt erfassen.
Die Formel für α lautet:
Dabei ist k die Anzahl der Items, Σσ²i die Summe der Itemvarianzen und σ²gesamt die Varianz der Gesamtskala. In der Praxis wird α nie manuell berechnet, sondern stets über Statistiksoftware.
Interpretationsrichtwerte
| α-Wert | Bewertung | Empfehlung |
|---|---|---|
| < 0,60 | Unzureichend | Items überarbeiten oder Skala revidieren |
| 0,60–0,70 | Akzeptabel (mit Vorbehalt) | Nur mit expliziter Begründung vertretbar |
| 0,70–0,80 | Gut | Standardzielwert für Abschlussarbeiten |
| 0,80–0,90 | Sehr gut | Für Publikationen empfohlen |
| > 0,95 | Zu hoch — mögliche Item-Redundanz | Auf redundante Items prüfen |
Wichtig: Cronbachs Alpha ist kein einheitliches Maß für “Reliabilität überhaupt”, sondern spezifisch für interne Konsistenz. Es setzt voraus, dass alle Items eine einzige latente Dimension messen (Eindimensionalität). Bei mehrdimensionalen Skalen sollte α separat für jede Subdimension berechnet werden.
Achtung: Ein niedriges α kann verschiedene Ursachen haben — heterogene Items, zu wenige Items, aber auch inhaltliche Mehrdimensionalität. Die Diagnose erfordert eine Analyse der Item-Trennschärfe (korrigierte Item-Skala-Korrelation, rit) und ggf. eine explorative Faktorenanalyse.
Validitätsformen im Überblick
Validität ist kein binäres Merkmal (“valide oder nicht valide”), sondern ein Kontinuum und ein mehrdimensionales Konzept. Unterschieden werden drei klassische Validitätsformen:
1. Inhaltsvalidität (content validity)
Das Instrument erfasst alle relevanten Facetten des Konstrukts vollständig und ausgewogen — nicht nur einen Ausschnitt. Inhaltsvalidität wird nicht statistisch, sondern durch Expertenbeurteilung geprüft. Typisches Instrument: Content Validity Index (CVI), bei dem Expertengruppen beurteilen, ob jedes Item “essenziell”, “nützlich” oder “nicht notwendig” für das Konstrukt ist.
2. Konstruktvalidität (construct validity)
Das Instrument misst das theoretisch postulierte Konstrukt und nicht etwas anderes. Konstruktvalidität wird über statistische Verfahren geprüft:
- Konvergente Validität: Das Instrument korreliert hoch mit anderen Maßen desselben Konstrukts.
- Diskriminanzvalidität: Das Instrument korreliert niedrig mit Maßen anderer, theoretisch unverwandter Konstrukte.
- Explorative Faktorenanalyse (EFA): Prüft, welche Faktorstruktur sich empirisch aus den Daten ergibt.
- Konfirmatorische Faktorenanalyse (KFA): Prüft, ob ein vorab theoretisch postuliertes Faktormodell zu den Daten passt.
3. Kriteriumsvalidität (criterion validity)
Das Instrument sagt ein außenvalidiertes Kriterium vorher. Unterschieden wird:
- Prädiktive Validität: Das Instrument sagt ein zukünftiges Außenkriterium vorher (z. B. ein Persönlichkeitsfragebogen sagt Berufsleistung vorher).
- Übereinstimmungsvalidität: Das Instrument korreliert mit einem gleichzeitig erhobenen Außenkriterium.
Konstruktvalidität und Faktorenanalyse
Die explorative Faktorenanalyse (EFA) wird eingesetzt, wenn die Faktorstruktur einer Skala noch nicht bekannt ist oder empirisch überprüft werden soll. Wichtige Schritte:
- Stichprobengröße prüfen: Als Faustregel gelten mindestens 5–10 Probanden pro Item, mindestens jedoch n ≥ 100. Kaiser-Meyer-Olkin-Koeffizient (KMO) ≥ 0,60 als Mindestanforderung; ≥ 0,80 als gut.
- Extraktionsmethode wählen: Hauptkomponentenanalyse (PCA) für explorative Zwecke; Maximum-Likelihood-Analyse, wenn Normalverteilung angenommen wird.
- Faktoranzahl bestimmen: Kaiser-Kriterium (Eigenwert ≥ 1), Scree-Plot, Parallelanalyse.
- Rotation: Varimax (wenn Faktoren als unkorreliert angenommen werden), Oblimin oder Promax (wenn Korrelation der Faktoren möglich).
- Interpretation: Items mit Ladungen ≥ 0,40 auf einem Faktor als bedeutsam behandeln; Querladungen ≥ 0,30 kritisch prüfen.
Die Stichprobenplanung für eine valide Faktorenanalyse ist direkt mit der Wahl des Stichprobenverfahrens verknüpft. Grundlagen dazu im Beitrag zu Stichprobenverfahren in der empirischen Forschung.
Berechnung in SPSS und JASP
Cronbachs Alpha in SPSS
Pfad: Analysieren → Skalierung → Reliabilitätsanalyse
- Alle Items der Skala in das Feld “Items” übertragen.
- Modell “Alpha” auswählen.
- Unter “Statistiken”: “Deskriptive Statistiken für Items”, “Skalierung” und “Item gelöscht” aktivieren.
- In der Ausgabe: α-Wert in der Tabelle “Reliabilitätsstatistiken”; Item-Trennschärfen in der Tabelle “Item-Skala-Statistiken” (Spalte “Korrigierte Item-Skala-Korrelation”).
Cronbachs Alpha in JASP
JASP (kostenlos, open source) bietet eine benutzerfreundliche Alternative zu SPSS:
- Daten importieren (CSV oder SPSS-Datei).
- Modul “Reliabilität” öffnen.
- Items auswählen, Alpha-Berechnung aktivieren.
- Unter “Erweitert”: Item-Statistiken und “McDonald’s Omega” hinzuschalten (Omega ist ein robusteres Maß als Alpha, wenn Eindimensionalität nicht gegeben ist).
Explorative Faktorenanalyse in SPSS
Pfad: Analysieren → Dimensionsreduktion → Faktorenanalyse
- Items in das Feld “Variablen” übertragen.
- Extraktion: Hauptkomponentenanalyse; Anzahl der Faktoren über Eigenwert-Kriterium oder fixiert.
- Rotation: Varimax (orthogonal) oder Oblimin/Promax (oblique).
- Optionen: KMO und Bartlett-Test aktivieren.
Praxistipps für die Abschlussarbeit
Für eine methodisch einwandfreie Darstellung der Güteprüfung im Methodenteil empfehlen sich folgende Schritte:
- Theoretische Begründung voranstellen: Warum wurden diese spezifischen Reliabilitäts- und Validitätsmaße gewählt? Verweis auf Methodenliteratur (Döring & Bortz, 2016; Lienert & Raatz, 1998).
- Ergebnisse vollständig berichten: Nicht nur den α-Wert, sondern auch Item-Trennschärfen und Hinweise auf problematische Items.
- Pilotstudie durchführen: Wenn möglich, den Fragebogen an einer kleinen Vorstichprobe (n = 20–30) testen und die Gütekriterien prüfen, bevor die Haupterhebung beginnt.
- Limitationen benennen: Wenn die Stichprobengröße für eine Faktorenanalyse nicht ausreicht, ehrlich begrenzte Validierungstiefe eingestehen.
- Operationalisierung transparent machen: Jede Subskala mit ihrer theoretischen Grundlage begründen.
Der breite methodische Kontext — von der Hypothesenformulierung über die Operationalisierung bis zur statistischen Auswertung — ist im Überblick zu Forschungsmethoden für Abschlussarbeiten zusammengefasst. Die Grundlagen guter wissenschaftlicher Praxis bei der Datenerhebung behandelt der Beitrag zu Forschungsethik und DSGVO.
Häufige Fragen zu Reliabilität und Validität
Was ist ein guter Cronbach’s-Alpha-Wert?
Als Faustregel gilt: α ≥ 0,70 ist für Forschungszwecke akzeptabel, α ≥ 0,80 ist gut, α ≥ 0,90 ist sehr gut. Werte unter 0,60 gelten in den meisten Disziplinen als unzureichend. Sehr hohe Werte (> 0,95) können auf redundante Items hinweisen und sollten kritisch geprüft werden.
Was ist der Unterschied zwischen Reliabilität und Validität?
Reliabilität bezeichnet die Messgenauigkeit im Sinne von Konsistenz und Stabilität — wie präzise ein Instrument misst. Validität bezeichnet, ob das Instrument das misst, was es messen soll. Ein Instrument kann reliabel (konsistent), aber nicht valide (inhaltlich falsch) sein.
Wie berechne ich Cronbach’s Alpha in SPSS?
In SPSS über: Analysieren → Skalierung → Reliabilitätsanalyse. Items der Skala übertragen, Modell “Alpha” wählen, unter “Statistiken” die Option “Item gelöscht” aktivieren. Der α-Wert erscheint in der Ausgabe unter “Reliabilitätsstatistiken”.
Was ist der Unterschied zwischen explorativer und konfirmatorischer Faktorenanalyse?
Die explorative Faktorenanalyse (EFA) sucht ohne Vorannahmen nach der Faktorstruktur im Datenmaterial. Die konfirmatorische Faktorenanalyse (KFA) prüft, ob ein vorab theoretisch postuliertes Modell zu den Daten passt, und liefert Fit-Indizes (CFI ≥ 0,95, RMSEA ≤ 0,06 als gute Richtwerte).




Lascia un commento