Nach der (sagen wir dreiviertel)erfolgreichen Lernphase möchte ich in den nächsten beiden Blogposts jetzt in die theoretische Welt der Daten und Statistiken eintauchen. Basis dafür ist das Buch “Show Me the Numbers”, das mir graziöserweise vom besten Majorleiter des Instituts (bitte Roman lass mich durch) zur Verfügung gestellt wurde. In diesem Blogpost soll es um die ersten drei Kapitel des Buches geben, in dem ein gewisses Basiswissen über Statistik vermittelt wird. Als jemand der seit Jahren mit Mathematiknachhilfe (und dort ganz zufälligerweise vor allem in Statistik) sein Geld verdient, waren die Basics für mich natürlich eher auffrischend gedacht. Gerade im zweiten Teil, der sich darum dreht, wann es überhaupt eigentlich Sinn mach Daten zu visualisieren statt sie einfach banal in einer Tabelle darzustellen, konnte ich aber noch gute Tipps mitnehmen. Hier eine kleine Zusammenfassung des gelernten.
Statistik für Dummies
Grundsätzlich sind Statistiken nichts anderes als quantitative Daten (also Zahlen), die irgendeinen Sinn machen, also irgendwie gedeutet werden können. Zum Beispiel können die Verkaufszahlen eines gewissen Produkts als dessen Erfolg oder Misserfolg gedeutet werden. Erhebt man Daten, egal ob wie ich in meiner Bachelorarbeit durch Umfrage, oder durch Recherche, so erhält man verschiedene Arten von Daten. Daten mit nominalem Bezug sind Wörter (daher der Name), also klassische Antworten wie Ja/Nein, oder das Geschlecht, oft aber auch Dinge wie Länder. Daten mit ordinalem Bezug sind Zahlen und können in einer logischen Abfolge geordnet werden, also zum Beispiel Einkommensdaten oder das Alter. Gruppiert man ordinale Daten erhält man Intervalle, so etwa beim Einkommen gang und gäbe.
Welche Art von Daten man vorliegen hat ist dabei wichtiger als man denkt. Ich zum Beispiel habe bei meiner Bachelorarbeit mit PSPP, einer Gratisversion von SPSS gearbeitet und alle meine statistischen Berechnungen wie Korrelationen und Signifikanzen dort berechnet. Weiss man nicht welchen Bezug die erhobenen Daten haben, kann man auch nicht mit ihnen rechnen.
Die wichtigsten statistischen Maße für den Durchschnitt sind der Mittelwert und der Median, für die Streuung vor allem die Standardabweichung, wobei die Standardabweichung eigentlich kaum ersetzbar ist und gerade mit Mittelwert und Median oft getrickst werden kann. Stichwort: Traue keiner Statistik die du nicht selbst gefälscht hast. Im Grunde gilt: Gibt es starke Ausreisser, nimm den Median, andernfalls den Mittelwert.
Wann nehme ich überhaupt eine Grafik
Während für mich eigentlich fast immer klar war, dass Daten visualisiert werden müssen, um sie (in meinem Fall dem Leser) leichter verständlich zu machen, muss ich sagen, dass mich Stephen Few hier ein bisschen in meiner Denke beeinflusst hat und es tatsächlich total Sinn machen kann Daten nicht zu visualisieren und einfach als Text, oder als Tabelle darzustellen. Hier sind dazu seine Grundsätze.
Habe ich aus all meiner Recherche nur einen einzigen Fakt, eine einzige Zahl oder einen einzigen Vergleichswert, den ich ausdrücken möchte, so mache ich das einfach als Fließtext, denn im Endeffekt wäre alles andere, das noch in einer Tabelle stünde, oder in einer Grafik eingezeichnet wäre Beiwerk.
Wenn die Darstellung dazu genutzt werden soll, um einzelne Werte genau nachzusehen oder zu vergleichen, oder mehrere Maßeinheiten in einer Darstellung vorkommen, so nehme ich eine Tabelle. Denn nur in der kann der Leser Werte genau ablesen und nur in der kann ich in mehreren Spalten verschiedene Maßeinheiten verwenden, ohne, dass es unübersichtlich wird.
Ist die Message die ich verbreiten will durch ein Muster oder einen Trend gegeben, oder möchte ich Beziehungen zwischen den Daten zeigen, dann nehme ich eine Grafik zur Hilfe, denn genau dafür ist sie da.
Fazit
Nicht immer macht eine Grafik Sinn. Statt stur alles in einen Pie-Chart zu klopfen und zu hoffen, dass man das schon checkt, sollte man sich genau diese Fragen am Anfang jeder Darstellung immer stellen um überhaupt herauszufinden was man machen soll. Und das ist auch für mich eine echt coole Erweiterung des Horizonts. Mein Lieblingszitat aus den Kapiteln ist übrigens “there is eloquence in simplicity” und ich glaub den lass ich mir tätowieren.
Quelle: Few, Stephen: Show me the numbers. Designing Tables and Graphs to Enlighten. Second Edition. Burlingame 2012.