Home |
Übersinnliches und die Tücken der
Statistik |
Stuttgart - Auf den ersten Blick gelten die Attacken nur einer Aufsehen erregenden Serie von parapsychologischen Experimenten. Die hat der angesehene Psychologe Daryl Bem von der US-amerikanischen Cornell-Universität vor einigen Monaten veröffentlicht. Sie sollen nichts weniger belegen, als dass Menschen "die Zukunft fühlen" können, wie schon der Titel verhieß (die StZ berichtete). Diese kühne Behauptung gibt eine gute Zielscheibe ab - vor allem in den Augen von Wissenschaftlern, die Übersinnlichem skeptisch gegenüberstehen. Doch Daryl Bem hatte seine Studien nach allen Regeln der Wissenschaft gemacht. Wer sie angreifen will, muss die Regeln selbst angreifen. Genau das tun Kritiker wie Eric-Jan Wagenmakers von der Universität Amsterdam: "Warum Psychologen die Art ändern müssen, in der sie ihre Daten analysieren", ist seine Attacke vollmundig überschrieben. Das ist sogar noch bescheiden ausgedrückt. Die inkriminierten Methoden werden nämlich auch in anderen Sozialwissenschaften eingesetzt - und vor allem in der Medizin. Sie entscheiden mit darüber, ob ein Medikament als wirksam eingestuft und zugelassen wird. Sollte da etwas grundsätzlich faul sein, verschreiben Ärzte also womöglich unwirksame Präparate. Die Nullhypothese führt zu einer Trefferquote von 50 Prozent In einem typischen Experiment von Daryl Bem sitzt der Proband an einem Computer und sieht zwei Bilder: ein alltägliches Foto und dessen Spiegelbild. Durch einen Tastendruck tut der Proband kund, welches ihm besser gefällt. Nun erst legt ein Zufallsgenerator fest, was als richtige Antwort gilt. Es gilt also vorherzusehen, welches der beiden ursprünglichen Bilder der Zufallsgenerator auswählen wird. Das Ergebnis für dieses Beispiel: 150 Probanden mit je 36 Versuchen gelang in 51,7 Prozent der Fälle die richtige Antwort. Liegt das noch im Zufallsbereich, oder haben die Probanden parapsychologische Fähigkeiten gezeigt? Um diese Frage zu beantworten, greifen Psychologen üblicherweise auf den Signifikanztest zurück - und diesen Test kritisiert Eric-Jan Wagenmakers nun. Der Signifikanztest geht davon aus, dass die Probanden nur geraten haben. Das ist die sogenannte Nullhypothese. Sie führt theoretisch natürlich zu einer Trefferrate von 50 Prozent - wenn der Versuch unendlich oft wiederholt wird. Bei einer überschaubaren Zahl von Versuchen kann das Ergebnis von den 50 Prozent leicht abweichen; man kann ja Glück oder Pech haben. Die Resultate sind nicht mehr durch Zufall zu erklären In der Infografik wird das Prinzip am Beispiel von 20 Münzwürfen dargestellt. Lässt sich ein Ergebnis von fünfmal "Zahl oben", also einer Trefferquote von 25 Prozent, noch durch Zufall erklären, oder ist die Münze nicht fair? Das wird mit einem Signifikanztest ermittelt. Im Beispiel der Grafik fällt er ebenso aus wie für Bems Experiment: die Resultate sind nicht mehr durch Zufall zu erklären. Im Fall von Bems Experiment ist wegen der hohen Zahl der Versuchsdurchgänge die Irrtumswahrscheinlichkeit sogar recht gering: Sie liegt bei 0,9 Prozent. Mit dem Wert liegt man in der Psychologie ganz gut. Normalerweise gilt schon eine Irrtumswahrscheinlichkeit von fünf Prozent als akzeptabel. Ist Psi damit bewiesen? Oder ist etwas faul mit der Logik des Signifikanztests? Kritiker gibt es schon, seit Signifikanztests die Psychologie vor etwa 70 Jahren erobert haben. Die Dissidenten haben hauptsächlich zweierlei auszusetzen: Erstens lässt sich mit dieser Methode nie beweisen, dass an Psi wirklich nichts dran ist, denn die Nullhypothese kann zwar widerlegt, aber nie bewiesen werden. Zweitens verrät der Test nicht, wie wahrscheinlich Psi nun tatsächlich ist. Denn es wäre ein Fehlschluss zu glauben, dass die Probanden von Daryl Bem die Zukunft zu 99,1 Prozent vorausfühlen können, wenn die Irrtumswahrscheinlichkeit der Nullhypothese bei 0,9 Prozent liegt. Die Probanden können die Zukunft fühlen Die Kritiker von Bem, wie oft auch die von Signifikanztests generell, stützen sich lieber auf den britischen Pfarrer und Mathematiker Thomas Bayes, der in der ersten Hälfte des 18. Jahrhunderts lebte. Bayes-Statistiker versuchen nicht einfach, die Nullhypothese zu widerlegen. Sie vergleichen zwei Hypothesen, etwa die Nullhypothese und eine Alternativhypothese. Wenn die Nullhypothese lautet, dass die Versuchspersonen raten, dann könnte die Alternative heißen: die Probanden können die Zukunft fühlen. Für das Experiment mit den Bildern berechnen Eric-Jan Wagenmakers und seine Mitstreiter einen Wert, den sie als "geringe oder nicht existente" Bestätigung der Alternativhypothese charakterisieren. Doch diese Kritik wird nicht allgemein geteilt, denn auch die Bayes-Berechnung hat ein Problem: Man kann die Alternativhypothese so oder so formulieren. Daryl Bem argumentiert, dass seine Kritiker eine Variante der Alternativhypothese gewählt hätten, bei der die Effekte von Psi riesig sein müssten, um anerkannt zu werden. Das zeigt Bem mit Hilfe zweier anderer Bayes-Statistiker. Sie kommen zum Schluss, dass mit einer " realistischer formulierten Alternativhypothese" Psi auch nach Bayes "extrem gut" belegt ist. Rouder und Morey errechnen den sogenannten Bayes-Faktor Wissenschaftliche Schlussfolgerungen, die je nach den Annahmen der Wissenschaftler so oder so ausfallen, schätzt das Laienpublikum wenig. Ganz vermeiden lässt sich das Problem aber nicht. Vielleicht kann die Analyse der Bem-Experimente weiterhelfen, die Jeffrey Rouder von der Uni von Missouri und Richard Morey von der Uni Groningen veröffentlicht haben. Die Forscher haben einen weiteren statistischen Wert ermittelt, bei dem jeder seinen Vorurteilen freien Lauf lassen kann. Rouder und Morey errechnen den sogenannten Bayes-Faktor: Er sagt nichts darüber aus, wie wahrscheinlich Psi nach den neuen Studien ist, sondern verrät vielmehr, um welchen Faktor man seine bisherige Einschätzung von Psi im Licht der neuen Erkenntnisse korrigieren sollte. Für einige der Experimente liegt der Bayes-Faktor bei 40. Das bedeutet: wenn ein Skeptiker die Chancen für Psi vorab auf eins zu eine Million veranschlagt hat, sollte er sie nun auf eins zu 25.000 verbessern. Und wer Psi von vornherein für recht wahrscheinlich hält, darf die verbliebenen Zweifel ebenfalls um den Faktor 40 verringern - egal, wie klein sie dann werden. Die gute Nachricht ist, dass die verschiedenen statistischen Analysen nicht immer so weit auseinanderliegen wie im Fall der parapsychologischen Experimente. Wenn die zulässige Irrtumswahrscheinlichkeit nicht bei fünf, sondern bei einem Prozent liegt, kommen Statistiker trotz der unterschiedlichen Ansätze meist zu ähnlichen Ergebnissen. Das hat das Team von Wagenmakers gerade anhand von 855 Studienergebnissen vorgerechnet. Kleinere Irrtumswahrscheinlichkeiten erfordern aber meist größere Stichproben. Bem müsste also weiterforschen.
|