Deskriptive Auswertung | Umfragenwerkstatt"

Viele Fragen aus der Wirkungsmessung und anderen Anwendungsfeldern von Umfragen in zivilgesellschaftlichen Organisationen können mithilfe deskriptiver Statistik beantwortet werden. Deskriptive Statistik verwendet Ihr immer dann, wenn Ihr Aussagen über die Teilnehmenden Eurer Umfrage treffen möchtet, ohne daraus verallgemeinernde Schlüsse über größere Gruppen zu ziehen. Mit Kennzahlen und grafischen Darstellungen könnt Ihr zeigen, welche Informationen Eure Umfrage über die befragten Personen zutage gefördert hat. Ihr gegenüber steht die schließende Statistik, mit der ihr Aussagen treffen könnt, die über die befragte Gruppe hinausgehen. Dabei wird geprüft, ob beobachtete Unterschiede oder Zusammenhänge in den Daten auf Zufall innerhalb der Stichprobe beruhen oder ob sie sich mit einer gewissen Wahrscheinlichkeit auch auf die Grundgesamtheit übertragen lassen. Deskriptive Statistik beschreibt also die vorliegenden Daten und ist damit auch die Grundlage für alle weiteren Auswertungen. Schließende Statistik beurteilt, was sich aus diesen Daten über eine größere Gruppe sagen lässt.

In vielen Organisationen geht es nicht in erster Linie darum, streng auf eine große Grundgesamtheit zu schließen, sondern darum, die eigenen Teilnehmenden, Mitglieder oder Klient*innen besser zu verstehen. Genau dafür ist deskriptive Statistik sehr geeignet.

Gerade bei Evaluationen unter Teilnehmenden oder Befragungen unter Mitgliedern, die Ihr kennt oder denen Ihr schon begegnet seid, können deskriptive Darstellungen der Ergebnisse sehr hilfreich sein. Sie ermöglichen einen verständlichen Überblick darüber, welche Muster sich in den Antworten zeigen und an welchen Stellen es auffällige Unterschiede gibt. Deskriptive Statistik ist in solchen Fällen besonders nützlich, weil sie auch dann aussagekräftig sein kann, wenn keine repräsentative Stichprobe vorliegt. Für viele praktische Entscheidungen in zivilgesellschaftlichen Organisationen reicht es oft schon aus, die Antworten der tatsächlich erreichten Personen systematisch auszuwerten. Die Ergebnisse helfen dann dabei, Bedarfe zu verstehen, Angebote weiterzuentwickeln, Problemlagen früh zu erkennen und Diskussionen im Team auf eine nachvollziehbare Datengrundlage zu stellen. Außerdem hilft die deskriptive Statistik dabei, die Stichprobe genauer zu beschreiben. Ihr könnt zum Beispiel darstellen, welche Gruppen an der Befragung teilgenommen haben, wie sich die Teilnehmenden zusammensetzen und welche Perspektiven in den Daten stärker oder schwächer vertreten sind. Gerade das ist wichtig, um Ergebnisse realistisch einzuordnen und ihre Grenzen transparent zu machen.

Die Aussagen sowohl der deskriptiven als auch der schließenden Statistik sollten immer kritisch hinterfragt werden. Besonders relevant ist der sogenannte Responder Bias: In der Regel wird keine echte Zufallsstichprobe erreicht. Selbst wenn Einladungen zur Umfrage unter Klientinnen oder Mitgliedern zufällig verschickt wurden, ist meist nicht zufällig, wer tatsächlich teilnimmt. Häufig beteiligen sich eher besonders engagierte Personen oder solche, die unzufrieden sind und ihre Kritik äußern möchten. Es gibt statistische Verfahren, die versuchen, solche Verzerrungen rechnerisch zu berücksichtigen. Diese Verfahren sind jedoch oft anspruchsvoll und in der Praxis nicht immer leicht umzusetzen. Deshalb wird häufig im Text auf mögliche Verzerrungen hingewiesen und zu einer kritischen Reflexion der Ergebnisse angeregt. Eine weitere Möglichkeit besteht darin, die Ergebnisse gemeinsam mit Expertinnen zu besprechen, zum Beispiel mit den Personen, die ein evaluiertes Programm durchgeführt haben, und sie im jeweiligen Kontext zu interpretieren.

Zusammenfassend: Deskriptive Statistik ist hilfreich, weil sie

Antworten übersichtlich sichtbar macht,
Muster und mögliche Handlungsbedarfe erkennen lässt,
praktische Entscheidungen unterstützt,
auch ohne repräsentative Stichprobe nützlich sein kann,
die Grenzen der Daten transparent macht.

Die wichtigsten Kennzahlen der deskriptiven Statistik

Zum Beschreiben der Daten werden vor allem drei Kennzahlen verwendet: Streuungsmaße, Lageparameter und Zusammenhangsmaße. Hier werden nur die erklärt, die für einfache Auswertungen im zivilgesellschaftlichen Bereich wahrscheinlich Anwendung finden würden:

Lageparameter:

Arithmetisches Mittel/ Mittelwert

Dieser Wert ist identisch mit dem umgangssprachlichen Durchschnitt und bietet eine Zusammenfassung von numerischen Angaben oder Skalenwerten. Die kann für Euch zum Beispiel spannend sein, wenn Ihr die Zufriedenheit der Teilnehmenden mit einem Angebot auf einer Skala von 1-5 bewerten lasst. Dieser Wert ist allerdings sehr anfällig für Ausreißer: Wenn sich der Großteil der Nutzenden im oberen oder mittleren Bereich der Zufriedenheit bewegen, können schon wenige sehr negative Stimmen den Mittelwert nach unten ziehen.

Median

Für ähnliche Anwendungsfälle mit starken Ausreißern kann der Median hilfreich sein. Er ist der mittlere Wert einer der Größe nach geordneten Reihe von Antworten. Er teilt die Daten in zwei Hälften: 50 % der Werte liegen unter ihm, 50 % darüber, und zeigt damit, was die mittlere typische Antwortlage ist, ohne von Extremwerten zu stark beeinflusst zu werden. Der Median sagt aber nichts darüber, wie stark die Antworten streuen. Zwei Gruppen können denselben Median haben, obwohl ihre Antworten sehr unterschiedlich verteilt sind.

Modus

Der Modus gibt an, welcher Wert am häufigsten gegeben wurde – dafür muss es sich also nicht um Zahlenwerte mit sinnvoll berechenbaren Abständen wie beim Mittelwert handeln. Der Modus bietet sich an, wenn ihr wissen wollt, ob mehr Haupt- oder Ehrenamtliche an Eurer Umfrage teilgenommen haben oder welches Eurer Angebote von den Nutzenden am häufigsten genutzt wurde. Der Modus ist leicht verständlich, weil er die am häufigsten vorkommende Antwort angibt. Seine Aussagekraft ist jedoch begrenzt. Er zeigt weder, wie die übrigen Antworten verteilt sind, noch wie stark sich die Antworten unterscheiden. Außerdem kann es mehrere Modi geben oder keinen klaren Modalwert. Deshalb sollte der Modus in der Praxis möglichst zusammen mit Häufigkeiten, Prozentangaben oder der gesamten Verteilung betrachtet werden.

Streuungsmaße:

Standardabweichung

Die Standardabweichung ist ein Maß dafür, wie stark die Werte um ihren Mittelwert streuen. Sie zeigt also, ob die Antworten eher eng beieinanderliegen oder ob sie stark auseinandergehen. Dafür wird betrachtet, wie weit die einzelnen Werte im Durchschnitt vom arithmetischen Mittel entfernt sind. Der Wert gibt in der ursprünglichen Einheit an, wie unterschiedlich die einzelnen Werte zueinander sind. Die so darstellbare Unterschiedlichkeit in der Gruppe könnte zum Beispiel interessant sein, um zu erfahren, wie stark sich die Anzahl der ins Ehrenamt investierten Stunden, die Zufriedenheit oder die Zustimmung zu einer Aussage zwischen den einzelnen Antwortenden unterschiedet. Auch dieser Wert kann stark von Ausreißern beeinflusst werden.

Zusammenhangsmaße:

Korrelationskoeffizient nach Pearson

Der Pearson-Korrelationskoeffizient zeigt, ob und wie stark zwei numerische Merkmale linear zusammenhängen. Er zeigt also, ob höhere Werte der einen Variable eher mit höheren oder mit niedrigeren Werten einer anderen Variable einhergehen. Der Pearson-Korrelationskoeffizient kann Werte zwischen -1 und +1 annehmen:

+1 bedeutet einen perfekten positiven linearen Zusammenhang,
0 bedeutet keinen linearen Zusammenhang,
-1 bedeutet einen perfekten negativen linearen Zusammenhang. Ein positiver Zusammenhang bedeutet: Wenn die eine Variable steigt, steigt tendenziell auch die andere. Ein negativer Zusammenhang bedeutet: Wenn die eine Variable steigt, sinkt tendenziell die andere. Wichtig: Damit ist nicht bewiesen, dass ob eines das andere verursacht. Oder anders ausgedrückt: Korrelation ist nicht Kausalität. Andersherum ist auch nur dann ein Zusammenhang erkennbar werden, wenn dieser linear ist. Und auch hier können Ausreißer das Ergebnis stark beeinflussen. Dennoch ist dieser Koeffizient interessant, sobald es um Muster in euren Umfragen bei Zahlenwerten geht. Eine beispielhafte Frage könne sein: Geben Personen, die viele Stunden an Angeboten teilnehmen, auch hohe Zufriedenheitswerte an?

Rangkorrelationskoeffizient

Auch beim Rangkorrelationskoeffizienten sollen Zusammenhänge gemessen werden – hier geht es aber nicht um die numerischen Werte mit gleichem Abstand wie beim Pearson-Korrelationskoeffizienten, sondern um die Plätze in der Reihenfolge. Der Rangkorrelationskoeffizient ist also für Skalenfragen besonders geeignet, wenn die Frage lautet: Steigen zwei Merkmale tendenziell gemeinsam in ihrer Ordnung?

Kontingenzkoeffizient

Der Kontingenzkoeffizient ist für Zusammenhänge nominalskalierter kategorialer Daten gedacht, also für Merkmale ohne natürliche Reihenfolge. Typische Beispiele wären der Zusammenhang von Geschlecht und anderen Fragen, z.B. Teilnahme an bestimmten Angeboten. Gezeigt werden kann, ob zwei kategoriale Merkmale miteinander assoziiert sind, also ob bestimmte Ausprägungen häufiger gemeinsam auftreten als zufällig zu erwarten wäre. Dabei kann nur gezeigt werden, ob es einen Zusammenhang zwischen Kategorien gibt – keine positiven oder negativen Zusammenhänge wie bei den beiden anderen Zusammenhangsmaßen.

Videoanleitungen

Deskriptive Auswertungen sind oft innerhalb des Funktionsumfangs von webbasierten Umfragetools, aber auch in extra Programmen möglich. Hier findet Ihr einige Anleitungen:

Für umfangreichere Einführungen, vor allem zu der Frage, welche Datenvisualisierungen am Besten für Eure Aussagen geeignet sind, empfehlen wir Euch auch die passenden Bildungsmaterialien aus unserer CDL Academy.