Ungerührt von diesen, in unserer Wissenschaft ja keineswegs unüblichen, empirischen Verwirrungen werden in der Praxis munter Tabellen wie Graphiken verwendet. Will empirische Forschung fundierte Empfehlungen für die Praxis bereitstellen, so ist das Problem zu beantworten, worauf es denn ankommt, daß einmal Tabelle, das andere mal die Graphik vorteilhafter ist und gelegentlich auch keine klaren Unterschiede zu erwarten sind. Die Fragestellungen an die Daten scheinen hier eine wichtige Rolle zu spielen, aber dieser Hinweis führt nur weiter, wenn die Interaktionen zwischen Fragestellungen und Präsentationsformen deutlich expliziert und nach Möglichkeit auch belegt werden. Als graphische Alternativen zur Tabelle werden hier meist das Säulendiagramm und das Liniendiagramm herangezogen. Beide Graphikformate gehören nicht nur zu den bekanntesten, sondern auch zu den besten Präsentationsgraphiken und kommen sowohl in der Praxis wie im Wissenschaftsbetrieb öfter zum Einsatz. Von den möglichen Funktionen einer Präsentation steht hier als entscheidendes Erfolgskriterium im Mittelpunkt, wie genau und wie schnell der Leser Daten bzw. die Beziehungen zwischen den Daten aus der sichtbaren Präsentation entnehmen kann.
Ablesen von einzelnen Daten (Pointreading)
Die einzige mir bekannte Untersuchung, welche sowohl explizite Genauigkeitsdaten
und Reaktionsgeschwindigkeiten in Form von Zahlen mitteilte, ist die von
Wilson & Addo (1994a). Tabelle und Säulendiagramm umfaßten
12 Größenwerte auf der X-Achse. Aufgabe der Vp war es, einen
bestimmten Größenwert anzugeben, z.B.: "What is the quantity
in period 3 ?" Eine Wertangabe wurde als korrekt eingestuft, wenn der Betrag
der Abweichung vom tatsächlichen Wert <=5% betrug (- sonst wäre
wohl das Säulendiagramm völlig chancenlos gewesen). Die auf Seite
348 angegebenen Daten werden hier zum besseren Verständnis in Sekunden
transformiert dargestellt sowie fehlende Werte notfalls aufgrund vorhandener
Angaben geschätzt.
|
|
|
Tabelle
Mittelwert und (Streuung)
|
|
|
Säulendiagramm
Mittelwert und (Streuung)
|
|
|
t-Test und Signifikanz
|
|
min t (35) = 4.73, p<.01 |
Effektstärkeschätzung d
|
|
|
Meyer, Shinar & Leiser (1997) teilen zwar keine Genauigkeitsdaten
mit, konnten aber in Experimenten die schnellere Extraktion eines Wertes
aus der Tabelle klar bestätigen. Die Präsentationen des ersten
Experimentes umfaßten 5 Rubriken auf der X-Achse und 3 Datenreihen
in der Anordnung Superposition. Aufgabe der Vp war es, den Größenwert
einer bestimmten Rubrik für eine bestimmte Datenreihe abzulesen (reading
the exact value of a data point, z.B. "How many roses were sold on Day
3?"). "For reading of exact values, reaction times for tables were significantly
faster than for bar graphs..." (S.275). Einer entsprechenden Ergebnisgraphik
auf S. 276 ist zu entnehmen, daß der Vorteil für die Tabelle
etwa 1.25 Sekunden beträgt. Das entspricht in etwa einem Zeitvorteil
der Tabelle ca. 33 % bezogen auf das Säulendiagramm.
In Experiment 2 wurden Rubrikenanzahl und Anzahl der Datenreihen variiert.
Die Autoren berichten über die Gesamtergebnisse und resümieren:
"The reading of exact values showed the clearest advantage of tables over
the two graphs... p<.0001)", S. 281. Der entsprechenden graphischen
Abbildung auf S. 282 entnehme ich, daß die Probanden für das
Ablesen aus der Tabelle ca. 60% der Zeit benötigten, die für
das Ablesen aus einem Säulendiagramm erforderlich war.
Lohse (1993a und 1993b) konnte ebenfalls klar nachweisen, daß Pointreading in einer Tabelle schneller gelingt als in einem superpositionierten bar chart und line graph. Lohse versteht unter dem Label "Point Read" allerdings nicht das exakte Ablesen eines Größenwertes, sondern eine Entscheidung darüber, ob ein vorgegebener Größenwert einen bestimmten Zahlenwert überschreitet, mindestens erreicht oder unterschreitet. Beispiele: " Did tin exceed $8.00 per pound in 1981?"; "In July, is the normal temperature in Bismark less than 75?". Aus den Ergebnisgraphiken (Lohse 1993a, S.219) schätze ich ab, daß beim so erfaßten Datenlesen sehr wenige Fehler gemacht wurden, und Tabelle und Säulendiagramm vergleichbare Genauigkeiten erzielten. Dieses Ergebnis kann nur so erklärt werden, daß die Abweichungen von den erfragten Zielmarken ziemlich hoch ausfielen, was die graphischen Präsentationen begünstigt. In beiden Untersuchungen konnten die Fragen in der Tabelle jedoch signifikant schneller beantwortet werden als in einem Säulen- und Liniendiagramm. Ich schätze den Geschwindigkeitsvorteil der Tabelle gegenüber dem Säulendiagramm auf 1.25 Sekunden ein, wodurch die Fragen tabellarisch in ca. 77% der, für das Säulendiagramm benötigten, Zeit entschieden werden konnten.
Smith
(1998) [Version vom 1.7.1998] verglich unter anderem Tabelle und mehrere
Graphiken anhand einiger Fragestellungen, die theoretisch klar Vorteile
für die Tabelle erwarten ließen. Zu dieser Gruppe (Group I)
von Aufgaben gehörten Fragestellungen, welche das Ablesen eines bestimmten
Datenwertes für eine bestimmte Rubrik erforderten oder aber Fragestellungen,
die exakte Daten vorgaben, zu denen dann Rubriken oder Datenreihen gefunden
werden mußten, die diesem Wert am nächsten kamen.
Die Aufgaben konnten mit Hilfe der Tabelle deutlich (p<.001) schneller
gelöst werden als mit allen untersuchten Graphiktypen (Säulendiagramm,
Liniendiagramm, Scatterplot), während die Graphikvarianten keinerlei
Zeitunterschiede aufwiesen.
Die Überlegenheit der Tabelle zeigt sich vornehmlich dann, wenn exakte Daten abgelesen und gegebenenfalls Rechnungen mit diesen Daten vorgenommen werden müssen.
Soll hingegen die Summe oder der Mittelwert aus mehreren Daten geschätzt werden, dann kann dies, wie in einer Studie von Jacobs 1990 nachgewiesen, Vorteile für die Graphik erbringen. Hier war der Durchschnitt aus 12 Daten in Form einer Zahlenschätzung verlangt worden und das Säulendiagramm erzielte etwas günstigere Genauigkeitswerte und deutlich schnellere Reaktionszeiten als die Tabelle. Die günstigste Präsentation hängt folglich davon ab, ob man sich mit Datenschätzungen in einem eher globen Sinne begnügen will oder exakte Werte verlangen soll, was von praktischen Erwägungen abhängt. Tuttle & Kershaw (1998) untersuchten Qualitätsbewertungen anhand von 5 Kriterien, die zum einen auf der Basis einer globalen Einschätzung (holistische Entscheidungsstrategie), zum andern erst nach der Aufforderung, alle Kriteriumswerte aufzuschreiben und zu addieren (analytische Strategie), vorgenommen werden sollten. Die Kriterien waren dabei gleich zu gewichten, womit der Summe bzw. dem Durchschnitt der Kriterien die entscheidende Bewertungsgrundlage galt. Die 5 Kriteriumswerte wurden entweder in einem Säulendiagramm oder in einer Tabelle dargestellt. Die Daten bestätigen weitgehend die erwartete Wechselwirkung zwischen Präsentationsform und der durch die Instruktion nahegelegten Bewertungsstrategie. Unter Anwendung der holistischen Entscheidungsstrategie ergaben sich Vorteile für das Säulendiagramm und bei der analytischen Strategie Vorteile für die Tabelle.
Die Präsentation der Daten in einer Tabelle darf aber nicht mit der Darstellung von Telephonnummern in einem Telephonbuch verwechselt werden. Übermäßige Genauigkeit ist in vielen Fällen schon von der Zuverlässigkeit der Daten her nicht gerechtfertigt und Ehrenberg (1977a) plädiert dafür, in Tabellen Zahlen radikal auf 2 signifikante Ziffern zu reduzieren, um Zahlenvergleiche zu vereinfachen. Die so in Kauf genommenen, meistens relativ irrelevanten, Rundungsfehler könnten in manchen Fällen nicht mehr sehr weit von den Fehlern in einem gut konzipierten Säulendiagramm entfernt sein. Aus diesem Grund wäre es auch in den meisten Fällen unnötig, etwa an den Säulen zusätzlich noch Zahlen anzubringen, nur um die Genauigkeit zu verbessern. Bringt man dennoch in einer Graphik zusätzlich Zahlen für jedes Datum an, dann hat man, Ehrenberg (1977a) zufolge, aus der Graphik eine schlechte Tabelle erzeugt.
Selbst wenn an der Genauigkeit gewisse Abstriche tolerierbar sind, man kann die Daten aus der Tabelle deutlich schneller lesen. Der Zeitvorteil der Tabelle gegenüber dem Säulendiagramm hängt sicher von verschiedenen Bedingungen ab, läßt sich aber, bisherigen empirischen Ergebnissen zufolge, ganz grob auf mindestens ein Drittel beziffern. In dieser Zahl ist die semantische Analyse (z.B. "Wo liegt die Rubrik, deren Wert abgelesen werden soll") enthalten. Das reine Ablesen einer Zahl kann sicher noch deutlich schneller vollzogen werden als das reine Abschätzen einer Säulengröße, was sich etwa klar zeigen müßte, wenn man die Leser auffordern würde, alle Werte in einer Präsentation möglichst schnell aufzusagen. Deshalb besteht überhaupt kein Zweifel daran, daß Tabellen zum Ablesen von einzelnen Daten konkurrenzlos die Präsentation der ersten Wahl darstellen.
Nur wenn Relationen zwischen Daten von Relevanz sind, sollte die Erstellung von Graphiken in Erwägung gezogen werden. Dann aber auch nur, wenn keine übermäßige Genauigkeit verlangt wird, denn auch für alle möglichen Beziehungen zwischen den Daten gilt: Wenn Genauigkeit sehr hohe Priorität hat, müssen Relationen durch Zahlen errechnet werden. Aus diesem Grunde werden statistische Berechnungen ja auch aus Zahlentabellen errechnet und nicht auf der Basis graphischer Objekte geschätzt. Andererseits präsentiert man dem Leser natürlich meist auch keine Tabelle, damit der nun zu rechnen anfängt.
Der Vorteil für die Graphik (Säulendiagramm) gegenüber der Tabelle nimmt mit wachsender Anzahl der zu vergleichenden Datenwerte zu. Diese Hypothese konnte in einem Selbstversuch ganz überzeugend bestätigt werden (siehe dazu: Jacobs (1998, Identifikation des größten Wertes in Tabelle und Säulendiagramm.). Ich persönlich finde den höchsten Säulenwert in einem 32 Säulen umfassenden Säulendiagramm eher als die höchste Zahl unter 4 Zahlen (Nachweis!). Jacobs (1999) konnte die Ergebnisse seines Selbstversuchs durch ein nachfolgendes Gruppenexperiment klar stützen. Bereits ab 4 zu vergleichenden Datenwerten identifizierten alle 23 Vpn den maximalen Wert schneller in einem Säulendiagramm als in einer Tabelle.
Erstellung einer Rangordnung:
Das Umordnen aller Datenwerte in eine Rangordnung kann als umfassender
größer/kleiner-Vergleich aufgefaßt werden. Diese Aufgabe
gelingt im Säulendiagramms deutlich besser als in der Tabelle und
die Unterschiede zugunsten des Säulendiagramms steigen mit wachsender
Anzahl der Datenelemente. (siehe dazu: Identifying
of Relations between values ).
Gesamteinschätzung
Bei wenigen zu vergleichenden Datenwerten kann eine Tabelle mit einem
Säulendiagramm durchaus konkurrieren, wenn es darum geht, den höchsten
oder niedrigsten Wert zu identifizieren. Die hier zu erwartenden Zeitunterschiede
sind nicht allzu bedeutsam. Die maximale Säule müßte man
zwar schneller erkennen können als die größte Zahl, der
Orientierungsvorteil der Tabelle für die Zuordnung der semantischen
Bedeutung der Daten gleicht diesen Vorteil aber insbesondere bei Präsentationen
mit mehreren Datenreihen wieder aus. Größer/kleiner Vergleiche
begünstigen das Säulendiagramm gegenüber der Tabelle umso
klarer, je mehr Vergleiche dieser Art zur Beantwortung der Fragestellung
notwendig sind. Dieser Vorteil läßt sich meiner Meinung nach
auf alle graphischen Präsentationen generalisieren, welche im Sinne
Clevelands (1985) einen Vergleich "on the position along a common scale"
sowie klare Anhaltspunkte für die Zuordnung des Datenwertes zur Rubrik
auf der x-Achse erlauben (z.B. auf ein Liniendiagramm, dessen Datenwerte
Punkte oder sonstige gut sichtbare Symbole beinhaltet).
Wie Jacobs 1990 (siehe Comparison of Data Groups) nachweisen konnte, steigt der Vorteil der Graphik gegenüber der Tabelle mit wachsender Anzahl der zu einer Gruppe gehörenden Elemente deutlich an. Aufgabe der Vpn war es, jeweils 2 Gruppen aus mehreren Datenelementen im Hinblick auf die Relation größer/kleiner abzuschätzen. Die Vpn wurden aufgefordert, Schätzungen vorzunehmen und nicht etwa in der Tabelle die Werte zu errechnen. Bei vergleichbarer Genauigkeit war diese Aufgabe im Säulendiagramm schneller zu lösen und der Vorteil des Säulendiagramms wuchs mit zunehmender Anzahl der für die Summenbildung notwendigen Elemente. Es scheint so zu sein, daß der Zeitbedarf für die Gruppierung der Säulen zu einer Säulengruppe weitgehend unabhängig von der Anzahl der Säulen ist, während in einer Tabelle jeder zusätzliche Datenwert quasi sequentiell hinzu addiert bzw. geschätzt werden muß. Auch hier ist wiederum eine klare ordinale Interaktion zwischen Präsentationsform und Anzahl der Datenelemente zu Gunsten der graphischen Präsentation festgestellt worden, die auf eine eher parallele Informationsverarbeitung bei Graphiken schließen läßt.
Um eine Gruppe bilden zu können, müssen die Datenelemente
so angeordnet bzw. gestaltet werden, damit z.B. nach den Gesetzen der Gestalttheorie
Gruppierungen erleichtert bzw. gefördert werden, so daß die
entsprechenden Gruppenelemente spontan wahrgenommen werden können.
Hier spielen vornehmlich die Merkmale "räumliche Nähe" und "farbliche
Differenzierung" eine wesentliche Rolle.
Beispiel 1 : Veranschaulichung zum Vergleich von Relation in Datengruppen.
Obige Befunde beziehen sich immer auf die Größenvergleiche
der Summe oder des Durchschnitt von Datenelementen. Hier versprechen aber
auch andere Relationen als die Addition Vorteile für die Graphik,
z.B. die Variabilität. In Beispiel 1 sollen Diagramm 1 in seiner Gesamtheit
mit 10 Datenwerten mit Diagramm 2, welches ebenfalls 10 Datenelemente enthält,
verglichen werden. Aus der Gegenüberstellung geht z.B. unmittelbar
hervor, daß in Diagramm 1 sowohl die Summe als auch die Variabilität
des Niederschlags höher ausfällt als in Diagramm 2. Derartiges
aus der Tabelle zu erkennen, dauert seine Zeit. Ausserdem lassen sich relativ
schnell spontan bestimmte Teile aus den Graphiken gruppieren, wodurch globalere
Vergleiche ermöglicht werden, etwa: "Die ersten 4 Daten aus Diagramm
1 sind alle größer als die ersten 4 Daten in Diagramm 2.
Lohse (1993a, S. 218) fand heraus, daß Trends in einer Tabelle (bei vergleichbarer Genauigkeit) signifikant schneller erkannt wurden als in einem Säulen -und Liniendiagramm. Die Präsentationen beinhalteten umfangreiche Daten (6 Datenreihen mit je 12 Datenwerten) und die Graphiken waren in Superposition angeordnet. Typische Fragen (persönliche Mitteilung von Lohse in einer Email vom 18.9.1998) zu Trends lauteten: "From March to May, did Compaq's stock price increase?" oder "From 1985 to 1986, did the transportation index increase?" In Lohse (1993b) beziehen sich die Beispielfragen zum Trend auf einfache Fragen nach einem Anstieg oder Abfall in einem bestimmten Kurvenbereich (z.B. "From 1976 to 1980, did tantalum prices increase?"). Auch in dieser Untersuchung konnte Lohse schnellere Zeiten für die Tabelle gegenüber Liniendiagramm und Säulendiagramm bestätigen. In beiden Studien verbesserten farbliche Darstellungen der Graphen signifikant die Zeiten für die Graphen - die aber auch so immer noch nicht die Schnelligkeit der Tabelle erreichen konnten, allerdings aber auch nicht mehr weit davon entfernt waren - was auf jeden Fall dafür spricht, nach Möglichkeit die Datenreihen bei Graphen farblich zu differenzieren.
Meyer, Shinar & Leiser (1997) stellten ebenfalls Vorteile für die Tabelle beim Erkennen von Trends fest. Als graphische Präsentationen fungierten superpositionierte Säulen -und Liniendiagramme. Die Aufgabe zur Identifikation eines Trends war relativ einfach. Es mußte lediglich entschieden werden, ob die Daten einer Datenreihe einen eher ansteigenden oder abfallenden Trend aufwiesen. "For reading of trends, there was a significant difference between the table and the two graphic displays....(S. 275)" zugunsten der Tabelle. Dieses Ergebnis konnte allerdings im zweiten Experiment nicht klar repliziert werden, da der Unterschied zwischen Tabelle und den Graphikpräsentationen (S. 281) eine für übliches Signifikanzniveau erforderliche Wahrscheinlichkeit von 5% jedenfalls nicht unterschritt.
Jacobs (1990) hat demgegenüber ganz überzeugende Befunde für
den Vorteil der graphischen Präsentationen gegenüber der Tabelle
beim Erkennen von Trends vorgelegt. (siehe: Identifying
of the Gradient’s Sequence of Signs of a Trend). Hierbei mußten
die Vpn das Vorzeichen bzw. die Vorzeichenentwicklung der Steigung einer
12 Daten umfassenden Datenreihe einschätzen. Sowohl von der Genauigkeit,
wie von der Schnelligkeit erzielten Säulendiagramm und Liniendiagramm
praktisch recht bedeutsam bessere Ergebnisse als die Tabelle.
Das ist auch theoretisch zu erwarten, weil die Tabelle eine sequentielle
Suche aller Zahlen erfordert, in der Graphik hingegen wenigstens zum Teil
eine parallele bzw. globale Erfassung der Trendinformationen vorgenommen
werden.
Je komplexer die Vergleiche werden, um so bedeutsamer muessten sich eigentlich die Vorteile für die Graphik nachweisen lassen: Belege dafür liefert etwa die Untersuchung von Coll, Thyagarajan und Chopra (1991) Probanden mußten aus einem Liniendiagramm bzw. aus einer Tabelle, welche X-Werte den Y-Werten gegenüberstellte, die mathematische Gleichung für die Beziehung zwischen den Daten erkennen. Aus 5 möglichen Gleichungen war die zutreffende Gleichung auszuwählen, die im gegeben Fall I= (V/5)2 lautete. Die Zeitunterschiede zugunsten des Liniendiagramms (mit speziellen Gitterlinien zur Ordinate) sind hochsignifikant (p<.0001) und praktisch recht bedeutsam. Zwar werden keine Effektstärken mitgeteilt, die Daten erlauben auch keine Schätzung derselben. Aber der Vorteil für die Graphik betrug immerhin 21 Sekunden und die Aufgabe wurde mit dem Liniendiagramm in ca 70% der Zeit beantwortet, die für die Tabelle notwendig war. Bei einer weiteren, noch schwierigeren Problemlöseaufgabe war das Liniendiagramm ebenfalls der Tabelle klar überlegen.
Meyer; Gopher und Levy (1997) vermuten zu Recht, daß der Vorteil
einer Graphik sich vornehmlich dann zeigt, wenn den Daten eine Struktur
zugrunde liegt und die Aufgabe eine Nutzung dieser Struktur erfordert.
Die Autoren konstruierten folglich Aufgaben, bei denen man erkennen mußte,
ob gewisse Parametereinstellungen an zwei Funktionen gleich blieben oder
sich geändert hatten. Aus einem Liniendiagramm, welches die Funktionen
graphisch darstellte, war deutlich genauer zu erkennen, welcher Zustand
jeweils vorlag als aus den 2 Zahlenreihen einer Tabelle. Mit Hilfe eines
superpositionierten Liniendiagramms wurden 86% der Aufgaben, bei der Tabelle
nur 67% richtig gelöst, was einem hochsignifikanten Unterschied (p<
.001) entspricht.
In einem Experiment von Shamo, Meyer & Gopher (1996) sahen die
Vpn nacheinander mehrere Segmente von Datenreihen und mußten abschließend
entscheiden, wie sich der Trend weiterentwickeln würde. Nur unter
der Bedingung der Vorgabe strukturierter Datenreihen (Sinuskurven), nicht
jedoch bei recht unstrukturierten Daten, schätzen die Vpn den zu erwartenden
Trend im Liniendiagramm signifikant genauer ein als mit Hilfe einer Tabelle.
Auch frühere Experimente belegen, daß sich Vorhersagen der
weiteren Entwicklung mit Graphiken besser realisieren lassen als mit einer
Tabelle. "....forecasts are significantly faster and more accurate when
based on graphed information than when based on numeric information (Jarvenpaa,
1989; Carey and White, 1991)" (zitiert nach Smith (ohne Datum) )
Smith
(1998) [Version vom 1.7.1998] verglich unter anderem Tabelle und Liniendiagramm
anhand mehrerer Fragestellungen, die theoretisch klar Vorteile für
das Liniendiagramm erwarten ließen, weil sie in irgendeiner Weise
die Analyse eines Trends erfordern. Zu dieser Gruppe (Group IV) von Aufgaben
gehören etwa die Fragestellungen:
Auch hier wird man mit sehr hoher Sicherheit eine Interaktion zwischen Präsentationsform und Anzahl der Datenelemente zu Gunsten der graphischen Präsentationen finden, was ein ganz einfaches Beispiel eindrucksvoll aufzeigen soll: Soll eine Vp aus einer Präsentation erkennen, ob ein u-förmiger Verlauf vorliegt, so wird der Unterschied zwischen Tabelle und Liniendiagramm bei 100 Daten ganz deutlich höher sein als bei 5 Daten. Bei der Graphik kommt es darauf an, in einem globalen Sinne die Struktur zu erkennen, in der Tabelle muß die Struktur mühsam Schritt für Schritt mental aufgebaut werden. So habe ich auch keinen Zweifel daran, daß etwa alle in der Experimentalserie "zur Wahrnehmung von Kurvenverläufen und Kurvenvergleichen" geprüften Fragestellungen ganz eindeutige Vorteile für die graphischen Präsentationen gegenüber der Tabelle erbringen würden. Bei manchen der dort gestellten Fragen ist die Tabelle hoffnungslos überfordert und keiner würde sich die Mühe machen, derartige Fragen überhaupt mit Hilfe der Tabelle anzugehen. Hier sind Graphiken daher zum Verständnis geradezu erforderlich.
Die höchste Form graphischer Vermittlung von Daten ist das graphische Bild nach Bertin (1974). Dort sieht man auf einen Blick die Gesamtkonstellation der Präsentation als eine Wahrnehmungseinheit. Derartige Strukturen sind meist ideale Gebilde, die in der Mathematik häufig, in der Empirie (zumindest im Bereich der Sozialwissenschaften) hingegen selten vorkommen. Es ist erstaunlich, wie schnell man auch Abweichungen von idealen Verläufen erkennt.
Beispiel 2: Abweichung von einer
einfachen mathematischen Funktion
Studenten benötigten im Durchschnitt 1 Sekunde, um entscheiden
zu können, daß an Verläufen, wie einer in Beispiel 2 gezeigt
wird, irgendwo irgendeine Abweichung von einem idealen Verlauf vorliegt.
Es ist äußert unwahrscheinlich in einer Sekunde überhaupt
10 Zahlen richtig wahrnehmen zu können.
Da empirische Ergebnisse meistens Abweichungen von idealen Strukturen
aufweisen, mag gelegentlich erhebliche Zeit vergehen, aus dem Gemenge der
Daten irgendein Muster oder Ähnlichkeiten zu sinnvollen Strukturen
aufzubauen, ein Grund dafür, warum manche Forscher ideale Kurven durch
ihre Daten legen. Die empirischen Ergebnisse zeigen ganz eindrucksvoll,
daß Liniendiagramme Tabellen dann klar überlegen sind, wenn
das Reizmaterial aus idealen Funktionen besteht und die Fragestellung das
Erkennen dieser Funktion verlangt. Je mehr man sich aber an einzelnen Abweichungen
aufhalten muß, weil die Daten klare Strukturen vermissen lassen,
desto sequentieller verläuft die Suche und dann schwindet auch der
Wert einer Graphik gegenüber der Tabelle, es sei denn, man nimmt die
Sache etwas humorvoller auf und argumentiert: "Aus der Graphik sehe ich
das Chaos direkt und muss es nicht mühsam aus der Tabelle ergründen."
Coll (1992) verwandte in ihren Experimenten als Präsentationen
Tabelle und Säulendiagramm. Die Präsentationen umfassten 2 bzw.
3 Datenreihen mit jeweils 5 bzw. 6 Rubriken auf der x-Achse. 2 verschiedene
Fragetypen wurden unterschieden:
Specific value Questions:
Die Abbildung 2, hier anders als bei Coll (1992) dargestellt, faßt das Hauptergebnis der Untersuchung zusammen. Die klare disordinale Interaktion besagt, daß specific value questions ganz eindeutig genauer mit Hilfe der Tabelle beantwortet werden können und daß ein Säulendiagramm genauere Antworten auf relational info questions ermöglicht als die Tabelle. Dieses Muster war auch in einer weiteren Untersuchung (Coll, Coll & Thakur 1994) bei mehreren Datenreihen festgestellt worden. Leider werden in beiden Untersuchungen keine differenzierten Ergebnisse zur benötigten Zeit mitgeteilt, sondern lediglich berichtet, daß im Durchschnitt aller Aufgaben die Tabelle günstiger abschnitt.
Smith
(1998) überprüfte eine theoretische Klassifikation von Tan
and Benbasat (1990), die Aussagen darüber zulassen soll, welche Fragestellungen
mit welcher Präsentation besonders gut beantwortet werden können.
Uns sollen hier nur die erwarteten Unterschiede zwischen Tabelle und Liniendiagramm
interessieren. Die Tabelle weist demnach Vorteile auf, wenn Aufgabenstellungen
anstehen, welche die Identifikation der Rubriken auf der x-Achse und die
Analyse der Werte auf der Ordinate (y-Achse) erfordern. Typische high-X-anchoring,
high-Y-anchoring- tasks beziehen sich z.B. auf das Ablesen eines Datenwertes.
Abbildung 3
Das Liniendiagramm
eignet sich eher für Fragen, welche sich direkt auf Eigenschaften
oder Vergleiche zwischen Datenreihen beziehen, etwa, aus mehreren Datenreihen
eine bestimmte Datenreihe aussuchen, die bestimmte Eigenschaften aufweist.
Solche Aufgabenstellungen erfordern keine detaillierte Analyse der Rubriken
auf der X-Achse (low X-anchoring task) und keine genaue Inspektion der
Werte auf der y-Achse (low Y-anchoring task). Sie zeichnen sich theoretisch
vielmehr durch ein hohes entity-anchoring aus, weil nur Charakteristika
der Datenreihen und Vergleiche zwischen diesen Datenreihen erforderlich
sind. Derartige Vergleiche sind möglich, ohne die Rubriken bzw. die
Ordinatenwerte im einzelnen zu kennen, etwa: Welche von den 3 Datenreihen
zeigt den höchsten Anstieg zwischen 2 Rubriken?
Ungeachtet der theoretischen Klassifikation beziehen sich die Fragestellungen
der Group I vorwiegend auf Pointreading, die Fragestellungen der Group
IV überwiegend auf Trendinformationen. Wie die Abbildung 3 zeigt,
schneidet die Tabelle beim Pointreading besser ab als das Liniendiagramm
während das Erkennen von Trendinformationen im Liniendiagramm besser
gelingt als mit Hilfe der Tabelle. (Die Angaben zu den Sekunden beziehen
sich höchstwahrscheinlich auf die Summe aus jeweils mehreren Fragestellungen.)
Wenige Daten und simple Vergleiche
Unbedeutende Unterschiede zwischen Tabelle und Graphik sind meistens
bei relativ wenigen Daten und zugleich recht simplen Vergleichen anzunehmen.
Diese Annahme leitet sich aus der mehrfach nachgewiesenen Interaktion zwischen
Präsentationsform und Anzahl der Daten ab. Man braucht nicht unbedingt
eine Graphik einzusetzen, um abzuschätzen, welcher von 3 Werten der
größere oder welcher von 4 Werten der kleinste ist. Das gilt
insbesondere für Präsentationen mit bisher unbekanntem Inhalt,
wo zunächst die Bedeutung der Variablen erkannt werden muß.
Der Hang zur Visualisierung treibt einige dazu, 2 Daten in einer umfangreichen
graphischen Abbildung vorzustellen, wo meist schon die verbale Mitteilung
den gleichen Zweck erfüllen würde.
In einem Kreisdiagramm können überhaupt nur wenige Daten
dargestellt werden. Dennoch hat sich diese Form in der Praxis durchgesetzt.
Hier wird das Verhältnis eines Teils zum Ganzen abgeschätzt.
Dieses Verhältnis könnte man aus einer Tabelle exakt ablesen.
Aus der obigen Abbildung 1 geht auch hervor,
daß die Tabelle einem Kreisdiagramm beim einfachen Vergleich "Welcher
von zwei Werten ist der größere" ebenbürtig ist und sich
ein Kreisdiagramm eigentlich nur lohnen würde, wenn globalere - oder
sonst anspruchsvollere Vergleiche angestrengt werden würden. Auch
die Fragestellung eines qualitativ relativ anspruchslosen Trends in Sinne
von "Geht's aufwärts oder abwärts?" läßt sich aus
der Tabelle mit wenigen Daten ähnlich gut wie in einer Graphik beantworten.
Gewisse grobe Vergleiche mit überschaubaren Daten sind in beiden Präsentationsformen
vergleichbar gut realisierbar. Hier spielt möglicherweise die Erfahrung
des Lesers eine entscheidende Rolle.
Eine häufig zitierte Passage von Tufte (1983, S.56) "Tables usually outperform graphics in reporting on small data sets of 20 numbers or less" ist jedoch in dieser Allgemeinheit sicher falsch, weil es nicht nur auf die Anzahl der Daten, sondern auch auf den Vergleich mit den Daten ankommt. Schon die Schätzung von Verhältnissen zwischen 2 Daten bringt Vorteile für die Graphik (siehe Verhältnis zwischen 2 Daten). Die wenigsten psychologischen Variablen erfüllen allerdings die Voraussetzungen für diesen Vergleich. Wenige Daten können recht komplexe Beziehungen aufweisen. Ein Blick auf Abbildung 3 zeigt unmittelbar eine Interaktion und hier lohnt es sich, eine Graphik einzusetzen, obgleich nur 4 Daten zugrundeliegen, weil die Daten als graphisches Bild verstanden werden können und das spezielle Interaktionsmuster direkt sichtbar ist.
Aufwendige und umständliche Vergleiche
"Graphs usually fail if they do not have a simple story-line to tell."
(Ehrenberg (1977b, S.87). Gelingt es nicht, die geforderten Relationen
in der Graphik relativ unmittelbar zu erkennen, und muß man eine
Reihe umfangreicher Operationen mit den graphischen Elementen anstellen,
also den Vergleich quasi mental aufwendig konstruieren, dann werden ähnliche
Anforderungen wie an das Rechnen mit Zahlen gestellt. Statt einer einfachen
Wahrnehmungaufgabe wird dann eine anspruchsvolle Abwägeaufgabe verlangt.
Beispiel: "Ist der Anstieg aller 4 Datenreihen von Zeitpunkt 2 bis
6 im Durchschnitt steiler als die Summe des durchschnittlichen Abfalls
von Zeitpunkt 9 bis 11 und 13 bis 15 ? Je nach Datenlage kann es sehr schwierig
sein die geforderten Einzeloperationen zuverlässig durchzuführen,
weil sich die Fehler kumulativ erhöhen. Ob der Vergleich überhaupt
graphisch solide durchführbar ist, hängt dann von den Daten ab.
Derartige Vergleiche sind in Tabelle wie in der Graphik sehr schwer durchzuführen,
beanspruchen immense Zeit und werden nur von wenigen Leser überhaupt
realisiert. Im Zweifelsfalle ist die Tabelle vorzuziehen. Ein guter Autor
würde hier aber das Ergebnis des Vergleichs sowieso verbal mitteilen,
wenn es sich um eine wichtige Relation handeln würde.
Beispiele für Fragestellungen an Graphik und Tabelle zum Ausprobieren
Liegen die Hauptziele der Präsentation in möglichst schnellem
Erkennen wesentlicher Beziehungen zwischen den Daten und nicht in der genauen
Extraktion von Einzelwerten oder der Erfassung mathematisch exakter Beziehungen,
dann erweist sich die Graphik der Tabelle vornehmlich unter folgenden Voraussetzungen
als überlegen:
Natürlich verbleiben eine Reihe weiterer Relationen, die man unmöglich alle in der Tabelle vereinfachen kann, die in der Graphik aber schnell zu realisieren sind (z.B. größte Differenz zwischen zwei Datenreihen, der stärkste Anstieg in einer bestimmten Datenreihe, der größte Abfall in einer Gesamtpräsentation mit mehreren Datenreihen usw.). Sehr anspruchsvolle Relationen wie bzw. Muster sind auch bei bestmöglicher Anordnung nur sehr schwer in Tabellen erkennbar bzw. überhaupt nur für den sehr geübten Spezialisten aus einer Tabelle zu entnehmen. Auch für Graphiken gilt, daß die Anordnung der Daten ganz erheblich bestimmt, was der Leser als Beziehung wahrnimmt. So gelingt es den wenigsten -mich eingeschlossen-, spontan wahrzunehmen, wie etwa Abbildung 3 aussehen würde, wenn man die Präsentationsformen Tabelle und Liniendiagramm auf der Abszisse dargestellt hätte (Shah & Carpenter (1995)). Das graphische Bild einer derartigen Anordnung sieht jedenfalls ganz anders aus und der Leser hätte höchstwahrscheinlich auch mehr Schwierigkeiten, zu verstehen, was ich mit Abbildung 3 sagen wollte. Die sinnvolle Anordnung der möglichen Bestandteile im Liniendiagramm ist zentraler Bestandteil der Dissertation von Rinck (1989).
Manche aufwendigen Operationen entfallen, wenn man die "richtigen Daten" in der Präsentation darstellt. Sind beispielsweise die Unterschiede zwischen 2 Zeitreihen im Zeitverlauf von zentraler Relevanz, dann sollte man direkt die Differenzen der Zeitreihen im Verlauf darstellen und nicht unbedingt beide Zeitverläufe, wo dann der Leser die Differenzentwicklung quasi selbst herstellen muß und in einer Graphik dann auch optischen Täuschungen ausgeliefert ist (z.B.: Cleveland 1985, S.276).
Gute Tabellen wie gute Graphiken sind das Ergebnis einer Interpretationsleistung des Autors. Er muß die Daten so darstellen, daß die ihm wichtig erscheinenden Beziehungen von den Rezipienten korrekt und möglichst einfach erkannt werden können. Die Beziehungen in Graphiken sind zwar häufig einfacher zu erkennen, aber auch leichter zu manipulieren (siehe dazu z.B. Ansätze zur Messung von Graphmanipulation von Smith [23.12.1998] ). Deshalb gilt ganz allgemein: Lieber keine Graphik als eine schlechte Graphik, die zu Mißverständnissen Anlaß gibt! Aber selbst wenn der Graphdesigner strikte Fairness der Präsentation anstrebt und realisiert, sind Graphiken immer noch leichter mißzuverstehen als Zahlen. Insofern sind Tabellen im Normalfall objektiver als Graphiken, wenn man mal davon absieht, daß etwa durch obskure Indizierung bzw. Verrechnung auch Zahlen ganz schön manipulierbar sind. Ausserdem sind Tabellen voraussetzungsloser und möglicherweise weniger Schema behaftet als Graphiken. Manch einer mag vorschnell dem falschen "mentalen Modell" eines Liniendiagramms erliegen, wenn er die Linien ungeprüft als Verläufe deutet - oder zumindest Intervallskalenniveau auf der X-Achse voraussetzt-, weil keineswegs immer Verläufe zugrundeliegen und die Abszissenvariable nicht einmal Ordinalskalenniveau aufweisen muß, wie einige Darstellungen der Interaktionen in diesem Artikel beweisen. Einer Untersuchung von Hastie und Simkin (1987, S.454) zufolge, aktivierten die meisten Probanden, konfrontiert mit einem Säulendiagramm, spontan Vergleiche zwischen den Größenwerten. Nicht auszudenken, welche Fehldeutungen dann naheliegen könnten, etwa: "Aha, Die Hochbegabten sind ungefähr doppelt so intelligent wie die Schwachsinnigen, aber 3 Schwachsinnige zusammen überflügeln klar die Intelligenz eines Hochbegabten." Es ist trivial anzumerken, daß beim Einsatz einer Präsentation die Eigenschaften des Lesers wie fachspezifisches Vorwissen oder Erfahrung im Umgang mit Daten und Graphiken sowie notwendige Maßnahmen im Bereich der Instruktion wie etwa textbegleitende Unterstützung der Graphik mitberücksichtigt werden müssen.
Die Lösung sollte nicht sein: "Wenn's etwas anstrengend wird, dann muß es immer eine Graphik sein". Es ist schon aus Nützlichkeitserwägungen schwer zu begründen, wegen minimaler Zeitvorteile stets aufwendige Präsentationen darzustellen. Das wäre nur gerechtfertigt, wenn wenig Zeit für die Präsentation zur Verfügung stünde und die semantische Bedeutung der Darstellung unproblematisch erscheint. Graphiken sollten deshalb vornehmlich dann zu Anwendung kommen, wenn begründeter Verdacht besteht, der Leser bringe in einer Tabelle nicht mehr die Fähigkeit oder die Geduld auf, die wichtigen Beziehungen zuverlässig nachzuvollziehen. Es werden auch in der wissenschaftlichen Literatur gelegentlich Graphiken eingesetzt, von denen ich zu behaupten wage, eine Tabelle oder "gar keine Präsentation" wäre besser gewesen (siehe Beispiele zum Thema: Es muß nicht immer eine Graphik sein). Tufte (1983 S.168) bringt es auf prägnante Art recht kompromisslos zur Sprache: "The simple things belong in tables or in the text; graphics can give a sense of large and complex data sets that cannot be managed in any other way."
Sich aus den Daten einer Tabelle eine Graphik vorstellen bzw. eine graphische Skizze anfertigen, die Daten tabellarisch und graphisch (multimodal) betrachten, graphische Relationen mit statistischen Kennwerten vergleichen usw. sind Tätigkeiten, die dem geübten Experten ein besseres Verständnis der Daten vermitteln und ihn vor gezielter oder unbeabsichtigter Manipulation weitgehend schützen. Wer wirklich an Daten interessiert ist, will daher meistens beides sehen: Tabelle und Graphik.
Ein Blick in die Zukunft läßt erwarten, daß im Zuge der neuen Medien interaktive Graphiken vielleicht einmal standardmäßig zum Repertoire eines Hypertextes gehören werden. Dies entbindet den Autor jedoch nicht davon, dem Leser eine aussagekräftige Präsentation anzubieten. Ansonsten verlagert sich das Problem "Tabelle oder Graphik - Was ist besser ?" lediglich ein wenig und für den Leser erschwerend heißt es dann: "Was ist besser zum Anklicken - Eine dieser vielen möglichen Graphiken oder doch lieber eine Präsentation aus der Menge der möglichen Tabellen?"
Bertin, J. (1974). Graphische Semiologie ((übersetzt von G. Jensch, D. Schade, W. Scharfe).Berlin: Walter de Gruyter.
Carey, J. M., and White, E. M., 1991, "The effects of graphical versus numerical response on the accuracy of graph–based forecasts," Journal of Management, 17 (1), 77–96. zitiert nach Smith (ohne Datum)
Carswell, C. M. (1992). Choosing specifiers: An Evaluation of he basic tasks model of graphical perception. Human Factors, 34, 535-554.
Carswell, C.M., Frankenberger, S. & Bernhard, D. (1991). Graphing in depth: perpectives on the use of three-demensional graph to represent lower-dimensional data. Behaviour & Information Technology, Vol 10, No 6, 459-474.
Carpenter, P.A & Shah, P. (1998). A model of the perceptual and conceptual Processes in Graph Comprehension. Journal of Experimental Psychology: Applied Volume 4, Number 2
Carter, L.F. (1947). An experiment on the design of tables and graphs used for presenting numerical data. Journal of Applied Psychology, 31, 640-650
Cleveland, W. S. (1985). The Elements of Graphing Data. Monterey, California: Wadsworth advanced Books and Software.
Coll, J. H. (1992). An experimenal study of the efficacy of tables versus bar graphs with respect to type of task. Information Management 23, pp. 45-51
Coll, J.H. & Coll, R. (1993) Tables and Graphs: A Classification scheme for Display Presentation Variables and a framework for research in this area. Information Processing & Management Vol. 29, No 6. pp. 745-750
Coll, R. A., Coll, J. H., Thankur G. (1994). Graphs and Tables A Four-Factor Experiment. Volume 37, Communications of the ACM. No 4, April 1994. 77-86
Coll, R., Thyagaranjan, A. & Chopra, S. (1991). An Experimental Study Comparing the Effectiveness of Computer Graphics Data vers Computer Tabular Data. IEEE Transactions on Systems, Man and Cybernetics, Vol. 21, Nr. 4, pp. 897-900
Engberg, J.M & Wallace, F.L.(ohne Datum) Information Extraction from Different Data Representation Forms on a CRT: Charts and Tables , URL: http://curly.cis.unf.edu/research/janice.txt [gesichtet am 15.9.1998]
Ehrenberg, A.S.C. (1977a). Rudiments of numeracy. Journal of the Royal Statistical Society, Series A, 140, pp. 277-297.
Ehrenberg, A.S.C. (1977b). Graphs or Tables? The Statistician. 27, 67-96.
Feliciana S.D., Powers, R. D. & Kearl, B. E. (1963). The presentation of statistical information. AV Communication Review, 11, 32-39.
Jacobs, B. (1989). Schnelligkeit und Genauigkeit beim Abschätzen von Größenwerten aus einem Säulendiagramm. Saarbrücken: Arbeitsberichte des Medienzentrums der Universität des Saarlandes, Nr. 2.
Jacobs, B. (1990). Ein Vergleich der Auswirkungen graphischer und tabellarischer Präsentationsformen auf die Schnelligkeit und Genauigkeit beim Erkennen und Interpretieren statistischer Daten. Saarbrücken: Arbeitsberichte des Medienzentrums der Universität des Saarlandes, Nr. 3.
Jacobs, B. (1994). Graphische vs. tabellarische Präsentation von statistischen Daten. Zeitschrift für Pädagogische Psychologie, 8, 73-84. (Kurzfassung von Jacobs 1990)
Jacobs, B. (1995a). Experimentelle Analysen zur Wahrnehmung von Kurvenverläufen und Kurvenvergleichen in Säulendiagramm und Liniendiagramm unter Superposition und Juxtaposition. Saarbrücken. Arbeitsberichte des Medienzentrums der Universität des Saarlandes, Nr. 15. (Umfangreiche Darstellung von Graphikexperiment 2 ;pdf-Datei (414 KB)
Jacobs, B. (1995b). Globale Vergleiche, lokale Vergleiche und Größenschätzungen in Liniendiagramm und Säulendiagramm unter Superposition und Juxtaposition. Saarbrücken. Arbeitsberichte des Medienzentrums der Universität des Saarlandes, Nr. 16.(Umfangreiche Darstellung von Graphikexperiment 3; pdf-Datei (260 KB) )
Jacobs, B. (1998). Identifikation des größten Wertes in Tabelle und Säulendiagramm. URL: http://www.phil.uni-sb.de/~jakobs/wwwartikel/tabgraph/maxwert.htm [31.8.1998]
Jacobs, B. (1999). Identifikation des größten Wertes in Tabelle und Säulendiagramm (Gruppenversuch). URL: http://www.phil.uni-sb.de/~jakobs/wwwartikel/tabgraph/maxwertalle.htm [4.1.1999]
Jarvenpaa, S. L., 1989, "Effect of task demand and graphical format on information processing strategies," Management Science, 35(3), 285–303. zitiert nach Smith (ohne Datum).
Lohse, G. L. (1993a). Eye Movement-Based Analyses of Graphs and Tables: The next Generation. Proceedings of the Fourteenth International Conference on Information Systems. Orlando, FL. 213-224.
Lohse, G. L. (1993b). A cognitive model of understanding graphical perception. Human-Computer Interaction, Vol 8. pp. 353-388.
Meyer, J., Shinar, D. & Leiser, D. (1997). Multiple factors that determine performance with tables und graphs. Human Factors, 1997,39(2), 268-286
Meyer, J., Gopher, D. & Levy, J. (1997) Discrimination between functions in tables and graphs. Proceedings of the Human Factors and Ergonomics Society 41st Annual Meeting. 1348-1351.
Milroy, R. & Poulton E.C. (1978). Labelling Graphs for Improved Reading Speed. Ergonomics, 21, 55-61.
Rinck, M. (1989). Die Strukturierung von Wissen durch statistische Graphen. Marburg: Dissertation.
Shamo, M.K., Meyer, J. & Gopher, D. Predicting Values and Trends from Tables and Graphs. Proceedings of the Human Factors and Ergonomics Society 40th Annual Meeting, 1151-1154.
Schutz, H. G. (1961). An evaluation of formats for graphic trend displays- Experiment II. Human Factors, 3, 99-107.
Shah, P. & Carpenter, P.A.(1995). Conceptual limitations in comprehending line graphs. Journal of Experimental Psychology: General. Vol. 124, No. 1, 43-61
Simkin, D. & Hastie, R. (1987). An Information-Processing Analysis of Graph Perception. Journal of the American Statistical Association, Vol. 82, No. 398, 454 - 465. Smith, S. (ohne Datum). The frequency of distorted graphs in investment-related information, and their effect on judgement. URL: http://www.dis.unimelb.edu.au/staff/stephen/summaryofPhD.html [gesichtet am 3.11.1998]
Smith, S. (1998). The interaction between graph type and question type on response speed and confidence. URL: http://www.dis.unimelb.edu.au/staff/stephen/Graph_paper_submitted_to_ACJ.html [gesichtet am 23.8.1998]
Smith, S. Definition and Measurement of graphical distortion. URL: http://www.dis.unimelb.edu.au/staff/stephen/Definition_of_distortion.doc [gesichtet am 23.12.1998]
Tuttle, B.M. & Kershaw, R. (1998), "Information presentation and judgment from a cognitive fit perspective." Journal of Information Systems, 12, 1, Spring, 1-17.
Tan, J. K. H. and Benbasat, I. (1990): Processing of Graphical Information: A Decomposition Taxonomy to Match Data Extraction Tasks and Graphical Representations, Information Systems Research. 416-439. (zitiert nach Smith (1998))
Tufte, E.R. (1983). The visual display of quantitative information. Graphics Press Cleshire
Wainer, H. (1997). Improving tabular displays, With NAEP tables as examples and inspirations. Journal of Educational and Behavioral Statistics, 22, pp. 1-30.
Washburne, J. N. (1927). An experimental study of various graphs,tabular and textual methods of presenting quantitative material. Journal of Educational Psychology, 18, 361-376 und 465-476.
Wilson, E.V., & Addo, T.B.A. (1994a). The joint effects of interactions between data display and task variables on task performance. In J.I. DeGross, S.L. Huff, & M.C. Munro (Eds.), Proceedings of the 15th International Conference on Information Systems (pp. 241-353). Vancouver, B.C.
Wilson, E.V., & Addo, T.B.A. (1994b). An investigation of the relative presentation efficiency of computer-displayed graphs. Information Management 26, 105-115