Nach dieser Einführung möchte ich in diesem Blogpost richtig ins Detail gehen. Im Grunde soll dieser Blogpost so etwas wie ein Cheatsheet sein, an den ich mich in der Folge für mein Praxisprojekt wenden kann. Mein ganz persönlicher Spickzettel also. Im ersten Blog wurde ja schon geklärt, unter welchen Umständen man nun eigentlich eine Grafik wählt und wann man die ausgearbeiteten Daten besser einfach als Tabelle darstellt. Hier soll nun erörtert werden, wann und für welchen Zweck denn eigentlich welche Visualisierung am besten geeignet ist und zweitens auch worauf man bei der Arbeit dann achten muss. Als Goodie möchte ich mir noch ein paar worst practise cases ansehen um Fehler zu vermeiden.
Wann nehme ich welche Grafik
Um zu klären in welchen Fällen man welche Grafik benutzt muss zuerst einmal geklärt werden welche Grafiken es überhaupt gibt. Few unterscheidet grundsätzlich nur vier Arten sinnvoll Daten darzustellen, nämlich als Punkte, Balken, Linien und Boxen. Von allen weiteren Arten rät er ab (damit auch vom allseits beliebten Kuchendiagramm). Ich werde später noch etwas genauer darauf eingehen was ich von dieser Vorgehensweise halte, vor allem deshalb weil ich durch diverse Visualisierungskurse im Bachelor dahingehend etwas anders erzogen wurde. Im Grunde ist die Auflistung aber sehr praktisch. Zur Erklärung: Few verwendet deshalb nur diese vier Arten der Visualisierung, da sie eines gemeinsam haben: die zugrunde liegenden Daten lassen sich jeweils entweder als Länge/Höhe oder Position des Graphen ablesen, laut Few die intuitivste und sicherste Variante. Alle weiteren Arten, wie Kuchen- und andere 2D-Diagramme vertrauen dabei auf ihre Fläche, um die Daten darzustellen, eine sehr irreführende und oft täuschende Methode. So kann man im Kuchendiagramm bei ähnlich großen Feldern nur sehr schwer feststellen welches größer ist, während das bei Balkendiagrammen recht einfach machbar ist.
Aus diesen vier Arten ergeben sich nun also sechs verschiedene Diagrammtypen die einem bei jeder Visualisierung zur Auswahl stehen – sechs deshalb, weil Balken und Boxen sowohl horizontal als auch vertikal verwendbar sind.
Um herauszufinden welches dieser sechs Diagramme nun auf welchen Anwendungsfall passt unterscheide Few insgesamt acht verschiedene Datendesigns:
- Zeitbasierte Darstellungen: Dabei wird ein bestimmter Wert über einen Zeitverlauf betrachtet.
- Ordnende Darstellungen: Dabei werden verschiedene Werte ihrer Größe nach geordnet.
- Aufteilungsdarstellungen: Dabei wird gezeigt aus welchen Teilen ein großes Ganzes besteht.
- Abweichungsdarstellungen: Dabei wird gezeigt wie sich Werte von anderen unterscheiden.
- Verteilungsdarstellungen: Dabei wird gezeigt wie sich eine Anzahl von Werten in Kategorien verteilt.
- Korrelationsdarstellungen: Dabei wird gezeigt wie zwei verschiedene Werte korrelieren.
- Geografische Darstellungen: Dabei werden geografische Unterschiede in den Werten gezeigt.
- Nominale Darstellungen: Dabei werden einfache Auflistungen ohne Ordnung gezeigt.
Für jede dieser Darstellungen bieten sich nun manche Grafen besser an als andere, während einige sogar komplett vermieden werden sollten. Hat man also seinen Datensatz parat, muss man zuerst herausfinden was die Aussage ist, die man damit darstellen möchte. Dann kann man sich an untenstehende Tabelle wenden, die jedem dieser acht Darstellungsarten seinen am besten geeignet Grafen zuordnet. Zusätzlich habe ich zu jedem Grafen noch eine Erklärung angefügt, wann und warum sich dieser am besten eignet.
| Nominale Darstellungen: | Im Grunde machen hier nur Balken (vertikal und horizontal) Sinn. Sind die Unterschiede zwischen den einzelnen Kategorien ganz gering und kaum zu erkennen, kann man sich mit Punkten (einem dot plot) behelfen, da dessen Achse nicht bei null beginnen muss und somit Unterschiede besser darstellbar sind. |
| Zeitbasierte Darstellungen: | Will man einzelne Werte herausheben ( zum Beispiel den tollen Umsatz im März) kann man auch hier Balken verwenden, jedoch nur vertikale, da die x-Achse die Zeit sein muss. Will man aber klassisch einen Verlauf oder Trend zeigen, machen nur Linien Sinn und sind fast immer die beste Variante. Einzige Ausnahme: es fehlen für viele Zeitpunkte die Daten, dann stellt man jene die man hat als Punkte dar. Linien würden hier Werte implizieren die man nicht hat. |
| Ordnende Darstellungen: | Funktionieren eigentlich nur über Balken. Wichtig: Bei vertikalen Balken wird von links nach rechts geordnet, bei horizontalen von oben nach unten. |
| Aufteilungsdarstellungen: | Laut Few machen auch hier Balken am meisten Sinn. Um zu signalisieren, dass die Werte jedoch zusammengehören und Teil eines Ganzen sind, lässt er zwischen den Balken keinen Platz. Alternativ kommen hier natürlich klassische Kuchendiagramme ins Spiel. Meiner Meinung nach sind diese vollkommen in Ordnung, solange nicht mehr als drei verschiedene Werte dargestellt werden. |
| Abweichungsdarstellungen: | Auch hier eignen sich Balken, diesmal gruppiert mit einem Soll und einem Ist-Wert. Alternativ funktioniert auch ein Linien-Diagramm, mit einer Einzeichnung für den Soll-Wert. |
| Verteilungsdarstellung: | Funktionieren am schönsten über Punkte auf einer Achse (strip plot), wenn man jeden Wert klar erkennbar machen will. Für eine kumulative Verteilung eignet sie die Linie. Will man mehrere Verteilungen in einem Grafen zeigen so geht das nur über Linien. |
| Geografische Darstellungen: | Funktionieren immer über Karten. In diesen Karten kann ich die Werte entweder über verschieden große Punkte einzeichnen. Oder direkt die Regionen der Karte verwenden. Für Routen eignen sich aber natürlich auch Linien. |
| Korrelationsdarstellungen: | Funktionieren am besten über Punkte in einem Scatter Plot. Nur wenn dem Leser aufgrund von Dummheit ein Scatter Plot nicht zumutbar ist, können auch Balken verwendet werden. |
Tipp: Möchte man innerhalb des Diagramms verschiedene Werte sichtbar machen, zum Beispiel dieser Balken stellt Frauen dar, dieser Männer, so hat man verschiedene Möglichkeiten. Die laut Few drei besten sind: Zusammengehörende Grafen lokal beieinander zu positionieren (gruppieren), zusammengehörende farblich zu markieren (einzufärben), oder im Falle von Punkten und Linien, eigene Formen wählen, zum Beispiel einmal Punkte und einmal Dreiecke bzw einmal eine durchgehende Linie und einmal eine punktierte. Von verschiedenen Füllmustern rät er aufgrund von optischen Illusionen und schwerer Zuordnung ab.
Do´s und Dont´s bei Grafen
Im Grunde kann man nun eigentlich schon fast nichts mehr falsch machen. Hat man erst einmal elaboriert ob man einen Grafen braucht, dann noch festgestellt welchen, gehts eigentlich direkt ans eingemachte. Doch drei kleine aber feine Dinge sind noch zu beachten.
Erstens: Vergiss 3D. In so gut wie allen Fällen ist es visuell leichter verständlich einen dritten Wert einfach über einen weiteren Balken, eine weitere Linie oder am besten sogar ein zweites Diagramm darzustellen, statt dafür die Z-Achse aufzumachen.
Zweitens: Skalen müssen immer genormt sein. Heißt: Gleicher Abstand auf der Skala ist gleich, gleicher Unterschied im Wert. Selbst wenn man Sprünge in der Skala etwa mit einem Z einzeichnet, und somit vielleicht technisch aus dem Schneider ist, der Graph bleibt irreführend.
Drittens: Jede Skala beginnt bei 0, vor allem bei Balkendiagrammen! Bei Linien und Punktdiagrammen kann man in manchen Fällen noch argumentieren, dass bei sehr geringen und kaum sichtbaren Unterschieden ein Start der Skala bei einem höheren Wert als 0 möglich sind. Dies jedoch nur, wenn es auch mit dem einhergehenden Text so kommuniziert wird. Bei Balken ist dies immer verboten.
Was kann schon schiefgehen? Worst practice und Alternativen
- Pie- und Donutcharts: Laut Few nur sinnvoll wenn alle einzelnen Segmente auch mit ihren Werten beschriftet werden. Und wenn ich in einem Graphen aller Werte erst wieder beschriften muss, wofür dann überhaupt der Graph… Meiner Meinung nach visuell schön, aber – und da stimme ich zu – faktisch nur gut, wenn nicht zu viele Werte dargestellt werden. Kommt zusätzlich nur für Aufteilungsfunktionen in Frage. Alternative: Balken.
- Radar-Charts: Obwohl gerade im Sport oft genutzt, laut Few einfach zu umständlich. I get the point, muss aber sagen, dass das für mich kein Grund ist. Radar-Charts sind technisch einwandfrei und sorgen für Abwechslung. Sollte man aber natürlich mit Bedacht auf die Leserschaft einsetzen.
- Stacked Graphs: Selbes Problem wie beim Kuchendiagramm, die Daten werden durch Flächen repräsentiert und sind eigentlich schon ab dem zweiten Wert nicht mehr nachvollziehbar. Alternative sind hier mehrere Linien in einem Diagramm.
- und viele mehr
Fazit
Eigentlich steht meinem Praxisprojekt jetzt nichts mehr im Weg (außer vielleicht der verbleibenden Zeit bis zur Deadline). Das Buch ist wirklich unglaublich umfassend und hat alle meine noch offenen Fragen super erklärt. Ich glaube dieser Cheatsheet wird es auch aus diesem Blog raus und auf meinen Schreibtisch schaffen!
Übrigens: Dass ich das Wort Graph während der letzten zwei Blogposts einfach beinhart jedes mal anders geschrieben habe und nicht einfach einheitlich, wie es sich gehört, ist reine künstlerische Freiheit! Ich bin ja jetzt Designer, also darf ich das!










