Wie stark lassen wir uns in unserer Meinung von empirischen Befunden bzw. Argumenten mit empirischer Basis beeinflussen? Und wie ist es möglich, dass verschiedene Menschen dieselben empirischen Daten so unterschiedlich interpretieren?
Kurz zur Motivation des heutigen Beitrags: ich lese gerade Täter: Wie aus ganz normalen Menschen Massenmörder werden von Harald Welzer, ein sehr interessantes und zum Denken anregendes Buch darüber, wie die Gräuel des Nationalsozialismus möglich waren. Vor nicht allzu langer Zeit habe ich ein ähnlich motiviertes Buch von Erich Fromm gelesen, Anatomie der menschlichen Destruktivität. Die Autoren haben etwas unterschiedliche Perspektiven und ich werde sie jetzt nicht generell vergleichen. Allerdings beziehen sich beide auf das berühmte Milgram-Gehorsamkeitsexperiment, mit jeweils unterschiedlichen Interpretationen. Und genau diese Dissonanz bildet den Ausgangspunkt für den heutigen Beitrag.

Zunächst zu Milgram: in seinem sehr einflussreichen und verstörenden Experiment, durchgeführt erstmals 1961, untersuchte er, wozu Menschen fähig sind, wenn sie von einer Autorität dazu aufgefordert werden. Die Probanden wurden scheinbar zufällig in zwei Gruppen eingeteilt, die „Schüler“ und die „Lehrer“ (wobei lediglich die Letzteren nicht über die tatsächlichen Rahmenbedingungen unterrichtet waren). Jeder Lehrer wurde aufgefordert, dem Schüler, der in einem Nebenraum saß und nicht gesehen, allerdings gehört werden konnte, mathematische Aufgaben zu stellen. Bei jeder falschen Antwort sollte der Lehrer dem Schüler Elektrostöße verabreichen, mit einer steigenden Spannung (bis zu einem Maximum von 400 V – zum Vergleich, die Spannung in kontinentaleuropäischen Steckdosen beträgt 230 V). Mit dem Lehrer im selben Raum saß der Versuchsleiter, der ihn bei Bedarf mit einer autoritären Stimme aufforderte, mit dem Versuch fortzufahren, auch wenn der Schüler anfing zu jammern, dann zu flehen, dass der Versuch abgebrochen wird, bis er letztendlich verstummte. Auch erklärte der Wissenschaftler sachlich, dass die Zuendeführung des Experiments unverzichtbar und wissenschaftlich notwendig sei. Was die Lehrer nicht wussten, war, dass die Schüler in Wirklichkeit keine Elektrostöße bekamen und ihre schmerzhaften Reaktionen fingiert waren (um sicherzustellen, dass sie glauben, der Effekt wäre echt, wurden sie am Anfang mittels derselben Apparatur selbst mit einem leichten Stromschlag traktiert). Das bedrückende am Milgram-Versuch: nur ein Drittel der Probanden brach den Versuch ab. Die anderen zwei Drittel kämpften sichtlich mit sich selbst, entschieden sich aber letztlich zum Gehorsam gegenüber der Autorität des Wissenschaftlers.
Nun beziehen sich sowohl Welzer als auch Fromm auf das Milgram-Experiment. Beide sehen ein, dass es als Laborexperiment nicht 1-zu-1 auf reale Situationen übertragbar ist. Doch während Welzer davon ausgeht, dass es dennoch einiges über die menschliche Tendenz aussagt, sich in realen Situationenn bestimmten Rahmenbedingungen zu fügen, auch wenn es bedeutet, Handlungen auszuführen, die man von sich aus nicht ausführen würde, argumentiert Fromm, dass das Verhalten der Probanden sehr wenig darüber aussagt, wie sie sich in einer analogen Situation in der realen Welt verhalten würden. Auch fokussiert er sich eher auf die inneren Kämpfe, die bei den Versuchspersonen beobachtet wurden (sie wurden während des Versuchs gefilmt) und die für ihn ein Zeichen dafür sind, dass Menschen in ihrem Inneren doch gut sind. Persönlich finde ich Fromms Argumentation hier ziemlich schwach und von seiner Grundhypothese gewissermaßen erzwungen. Dennoch ist dies ein sehr gutes Beispiel für ein Problem, mit dem wir oft zu tun haben, wenn es um die Interpretation von empirischen Daten geht, insbesondere im sozialwissenschaftlichen Kontext: dass diese Daten sehr viel Interpretationsspielraum lassen und daher verschiedene Personen je nach ihren „prä-analytischen Visionen“ aus denselben Daten unterschiedliche Schlüsse ziehen.
Das Kernproblem, um das es sich hier handelt, wird in der Wissenschaftstheorie die Duhem-Quine-These genannt: eine empirisch getestete Hypothese ist in Wirklichkeit kein einzelner zu testender Tatbestand, sondern setzt eine Reihe von anderen Hypothesen voraus, die de facto mit getestet werden. Wenn wir bspw. ein Experiment durchführen, in dem wir den Einfluss der Luftreibung auf die Flugkurve eines geworfenen Objekts untersuchen, setzen wir unter anderem voraus, dass die bestehende und als Fakt akzeptierte Hypothese über die Wirkung der Schwerkraft korrekt ist. Bereits in komplexeren naturwissenschaftlichen Experimenten kann dieser Sachverhalt problematisch sein, was ein Grund ist, warum Physik-Schüler mit Fehlerprotokollen gequält werden. In Sozialwissenschaften ist diese Problematik noch wesentlich gravierender. Man hat in der Regel die Wahl zwischen quasi-experimentellen Feldstudien bzw. einfach Beobachtungen der realen Welt, in denen die Möglichkeit der Kontrolle von Störfaktoren sehr begrenzt ist; und als Alternative, gerade in der (Sozial-)Psychologie, Laborexperimenten wie dem von Milgram, die so sehr kontrolliert sind, dass die Übertragbarkeit ihrer Ergebnisse auf die reale Welt zumindest fragwürdig ist. Und auch die kontrollierten Laborexperimente liefern meistens mehrere Ergebnisse (s. Milgram und die Interpretation durch Fromm).
Hinzu kommt ein Problem, das in ethnologischen Studien besonders ausgeprägt ist, dem aber in Laborexperimenten à la Milgram ebenfalls eine große Bedeutung zukommt. Dieses Problem weist eine gewisse Ähnlichkeit zu einer der Interpretation der Heisenberg’schen Unschärferelation in der Physik, laut der bereits die Messung bestimmter Größen im Quantenbereich die Ergebnisse verzerrt.1 Die Anwesenheit und Partizipation des beobachtenden Ethnologen oder des Versuchsleiters im Labor hat ebenfalls einen schwer zu bestimmbaren Einfluss auf das Verhalten der Beobachteten/Probanden.
All dies lässt sehr viel Raum für Interpretation von Ergebnissen sozialwissenschaftlicher Forschung. Welche nicht-kontrollierten Störfaktoren sind wie relevant? Wie ist die relative Relevanz der Teilergebnisse? Wie sieht es mit der Übertragbarkeit der Ergebnisse auf andere soziale Situationen aus?
Dafür, wie die Interpretation ausfällt, sind mehrere Faktoren relevant. Ein wichtiger wurde bereits erwähnt: die sog. „prä-analytische Vision“, d. h. die Summe von Überzeugungen, die der Betrachter in seinem Leben gebildet hat, bevor er sich eine gegebene Sammlung von empirischen Daten ansieht. Wir gehen an so etwas nie völlig unvoreingenommen heran, unser Gehirn bemüht sich immer, neue Daten in vorhandene Muster und Strukturen einzusortieren. Wir streben nach einer subjektiven Konsistenz des eigenen Weltbildes und minimieren kognitive Dissonanzen. In diesem Sinne sind wir auch, trotz der Fortschritte der abstrakten Wissenschaftstheorie des 20. Jahrhunderts, keine Falsifikationisten – seit Karl Raimund Popper gilt eine Theorie als wissenschaftlich, wenn sie widerlegbar ist; eine endgültige Bestätigung ist logisch unmöglich. Der Mensch ist dennoch instinktiv ein Verifikationist – wir suchen nicht nach potentiellen Widerlegungen unserer Ansichten, sondern nach Bestätigungen. Damit verbunden ist unsere generelle Tendenz, den eigenen Standpunkt (auch vor uns selbst) zu verteidigen und von ihm erst abzurücken, wenn er nicht mehr zu retten ist (in der Wissenschaftstheorie wird dies in dem Ansatz der Forschungsprogramme von Imre Lakatos aufgenommen).
Kurzum: die Verbindung der Funktionsweise menschlicher Psyche mit der Tatsache, dass die „Unschärfe“ sozialwissenschaftlicher Untersuchungen von ihrer Natur aus sehr viel Interpretationsraum zulässt, führt dazu, dass wir gerade in den von den Sozialwissenschaften untersuchten Kontexten dazu tendieren, auf unserer Meinung zu beharren, selbst wenn wir mit Erkenntnissen konfrontiert werden, die aus Sicht unseres Gegenübers diese Meinung widerlegen. Welche Relevanz wir dem Milgram-Experiment beimessen, hängt sehr stark davon ab, was wir vorher über Menschen dachten.
Zuletzt die „traditionelle“ Frage, auf die solche Überlegungen hinauslaufen: heißt all dies, dass eine objektive Wahrheit nicht existiert und wir zu einem Relativismus der einen oder anderen Art verdammt sind? Nein, das heißt es nicht. Eine „Wahrheit“ existiert vermutlich, auch wenn wir uns ihr nur nähern können und sie nie endgültig erkennen. Und es gibt durchaus eindeutig falsche Überzeugungen, die der Konfrontation mit empirischen Daten unabhängig vom Interpretationsspielraum nicht standhalten. Doch es gibt eben auch einen sehr breiten Graubereich, in dem Einigung zwischen Personen mit verschiedenen prä-analytischen Visionen mühsam bis unmöglich ist. Dessen sollte man sich aus zweierlei Gründen bewusst sein. Erstens, um nicht zu verzagen, wenn das Gegenüber die eigenen Argumente partout nicht so akzeptiert, wie wir sie meinen. Zweitens, um sich immer vor Augen zu halten, dass unsere Interpretation nicht zwangsläufig die richtige ist.
Fußnoten
1. Mir ist bewusst, dass die Übertragung von naturwissenschaftlichen Konzepten in die Human- und Sozialwissenschaften problematisch sein kann, wie eindrucksvoll von Alan Sokal und Jean Bricmont in deren Buch Fashionable Nonsense gezeigt. Daher beeile ich mich zu betonen, dass die Heisenberg’sche Unschärferelation hier nur als Metapher und lose Analogie dient.
Man kann das ganze auch noch etwas weiter denken. Interpretation empirischer Ergebnisse ist der eigentliche Kern vieler fachlicher Tätigkeiten oder auch wissenschaftlicher Arbeit. Dies gilt z.B. für die Psychotherapie oder auch rekonstruierende qualitative Verfahren aus der Sozialwissenschaft, die ja von dem Verstehen oder nachvollziehen also der Interpretation subjektiv gemeinten Sinns leben.
LikeLike