Wie kommuniziert man Risiken?
Auch die zuverlässigsten Tests erzeugen einen gewissen Anteil von falsch-positiven und falsch-negativen Ergebnissen. Trotzdem entsteht häufig die Illusion von Gewißheit, da in der Arzt-Patienten-Beziehung sowie in medizinischen Lehrbüchern und den Medien Unsicherheiten oftmals nicht verständlich kommuniziert werden. Im Folgenden werden drei Formen der Risikokommunikation beschrieben, die regelmässig Missverständnisse erzeugen, sowie alternative Methoden aufgezeigt.
Wenn Sie im Wetterbericht hören, dass es morgen mit einer Wahrscheinlichkeit von 30% regnet, dann hat man Ihnen eine Einzelfall-Wahrscheinlichkeit mitgeteilt. Die Wahrscheinlichkeit bezieht sich auf einen singulären Fall: den morgigen Tag, an dem es entweder regnet oder nicht. Wir glauben zu wissen, was diese Aussage bedeutet. Tatsächlich aber verstehen die Zuhörer mindestens drei verschiedene Dinge: Die einen meinen, dass es morgen in 30% der Zeit regnet, die anderen, dass es morgen in 30% der Gegend regnet, und schließlich wiederum andere, dass es an 30% der Tage wie morgen regnet. Nur Letzteres ist die Interpretation, welche die Meteorologen unterstellen. Diese Missverständnisse sind durch die Form der Kommunikation vorprogrammiert: Eine Einzelfall-Wahrscheinlichkeit gibt per Definition keine Referenzklasse an, auf die sich die Wahrscheinlichkeit bezieht. Das menschliche Gehirn des Zuhörers tendiert dagegen dazu, automatisch an konkrete Fälle zu denken, und eine bestimmte Referenzklasse anzunehmen, wie eine Klasse von Zeitpunkten, Orten oder Tagen. Sehen wir uns nun einen Fall aus der klinischen Praxis an, der illustriert, wie dort auf die gleiche Weise Missverständnisse entstehen, ohne dass sie im Allgemeinen bemerkt werden (Gigerenzer, 2001).
Einzelfallwahrscheinlichkeiten
Ein Psychiater an der Universität von Michigan, USA, verschrieb depressiven Patienten regelmäßig das Arzneimittel Prozac. Dieses Medikament hat Nebenwirkungen im sexuellen Verhalten, wie Impotenz oder mangelnde Libido. Der Psychiater informierte die betreffenden Patienten regelmäßig darüber, dass "mit einer Wahrscheinlichkeit von 30 bis 50 Prozent" eine Nebenwirkung auftreten wird. Als sie das hörten, waren viele Patienten doch beunruhigt, stellten aber keine weiteren Fragen, was den Psychiater schon immer verwundert hatte. Nachdem er über unsere Forschung am Max-Planck-Institut für Bildungsforschung gelesen hatte, begann er, auf andere Weise über die Risiken zu informieren. Nun sagte er den Patienten, dass "bei drei bis fünf von zehn Personen", die Prozac einnehmen, Nebenwirkungen auftreten. Mathematisch gesehen entsprechen diese Zahlen genau den Prozentsätzen, die er zuvor mitgeteilt hatte, psychologisch aber wirkten sie ganz anders. Die Patienten, denen er die Häufigkeiten der unerwünschten Nebenwirkungen anstatt der Prozentsätze genannt hatte, waren deutlich weniger beunruhigt. Erst da wurde dem Psychiater klar, dass er nie nachgefragt hatte, wie seine Patienten eine "Wahrscheinlichkeit von 30 bis 50 Prozent" verstanden hatten. Wie er schließlich herausfand, hatten viele gedacht, in 30 bis 50 Prozent ihrer sexuellen Aktivitäten würden sich Störungen einstellen. Jahrelang hatte der Psychiater nicht bemerkt, dass das, was er eigentlich sagen wollte, nicht das war, was seine Patienten verstanden.
Bedingte Wahrscheinlichkeiten
Eine bedingte Wahrscheinlichkeit gibt die Wahrscheinlichkeit eines Ergebnisses A an, gegeben ein Ereignis B. Risiken und Unsicherheiten werden in der medizinischen Literatur wie auch in Informationsbroschüren häufig in der Form von bedingten Wahrscheinlichkeiten (oder Prozenten) dargestellt. Die Forschung zum statistischen Denken zeigt klar, dass die meisten Laien und manche Experten aus bedingten Wahrscheinlichkeiten – wie etwa die Sensivität und die Falsch-positiv-Rate – falsche Schlüsse ziehen (Gigerenzer & Hoffrage, 1995). Betrachten Sie einmal das Brustkrebs-Screening durch Mammographie: Die Wahrscheinlichkeit, dass eine 50-jährige Frau Brustkrebs hat, beträgt nach einschlägigen Untersuchungen (Kerlikowske et al., 1996) etwa 0,8%; die Wahrscheinlichkeit, dass das Mammogramm positiv ist, wenn sie Brustkrebs hat, beträgt etwa 90% (Sensitivität); und die Wahrscheinlichkeit, dass das Mammogramm positiv ist, wenn sie keinen Brustkrebs hat, ist etwa 7% (Falsch-positiv-Rate). Welche Wahrscheinlichkeit ergibt sich daraus dafür, dass eine Frau mit einem positiven Mammogramm wirklich Brustkrebs hat (positiver Vorhersagewert)? Viele Menschen sind durch diese bedingten Wahrscheinlichkeiten verwirrt und können keine Antwort auf diese Frage finden. Wir können die Antwort jedoch leicht sehen, wenn wir eine andere Form der Kommunikation wählen, an die das menschliche Gehirn während seiner langen Evolution angepasst ist: natürliche Häufigkeiten. Ich stelle nun die obigen Wahrscheinlichkeiten in natürlichen Häufigkeiten dar: Von jeweils 1000 Frauen haben acht Brustkrebs. Von diesen acht Frauen mit Brustkrebs werden sieben ein positives Mammogramm haben. Von den übrigen 992 Frauen, die keinen Brustkrebs haben, werden rund 70 dennoch ein positives Mammogramm haben. Betrachten wir nun jene Frauen, deren Mammogramm beim Screening positiv ausfiel. Wie viele von ihnen haben wirklich Brustkrebs? Die hier mitgeteilten Informationen sind (abgesehen vom Ab- und Aufrunden) genau die gleichen wie zuvor. Nun aber ist die Antwort viel leichter zu erkennen. Nur sieben von den insgesamt 77 Frauen mit positivem Mammogramm haben Brustkrebs; das entspricht eins von elf oder neun Prozent. Bedingte Wahrscheinlichkeiten machen es Ärzten schwer, die richtigen Schlussfolgerungen zu ziehen. Diesen Sachverhalt veranschaulicht eine Untersuchung, an der 48 deutsche Ärzte mit einer mittleren Berufserfahrung von 14 Jahren teilnahmen (Gigerenzer, 1996; Hoffrage & Gigerenzer, 1998). 18 davon arbeiteten in Universitätskliniken, 16 in privaten oder öffentlichen Krankenhäusern und 14 hatten ihre eigene Praxis. Der einen Hälfte der Ärzte gaben wir die relevante Information über Mammographie-Screening in bedingten Wahrscheinlichkeiten und fragten sie, was die Wahrscheinlichkeit ist, dass eine Frau Brustkrebs wirklich hat, wenn sie positiv testet. Die anderen erhielten die Informationen in Form von relativen Häufigkeiten. Wurden den Ärzten Wahrscheinlichkeiten genannt, gab es eine erschreckend geringe Übereinstimmung. Die Schätzungen schwankten zwischen 1 Prozent und 90 Prozent (!). Ein Drittel der Ärzte (acht von 24) schätzten die Wahrscheinlichkeit, dass eine Frau mit positivem Mammogramm tatsächlich Brustkrebs hat, mit 90 Prozent ein. Ein weiteres Drittel schätzte die Wahrscheinlichkeit auf 50 bis 80 Prozent. Der Rest (also ebenfalls ein Drittel) nannte eine Wahrscheinlichkeit von 10 Prozent oder weniger. Jede Patientin wäre mit Recht äußerst beunruhigt, wenn sie von dieser Diskrepanz erfahren würde. Nur zwei der 24 Ärzte kamen auf den richtigen Wert, den man mit der Regel von Bayes berechnen kann. Zwei weitere lagen mit ihren Schätzungen in der Nähe dieses Wertes, aber nur zufällig, denn ihre Begründung war falsch. Beispielsweise verwechselte ein Teilnehmer die Falsch-positiv-Rate mit dem positiven Vorhersagewert. Wie erging es den Ärzten mit natürlichen Häufigkeiten? Hier liegt keine derart beunruhigende Streuung der Ergebnisse vor. Die Mehrzahl der Ärzte in dieser Gruppe lag mit ihrer Antwort richtig oder annähernd richtig. Nur fünf der 24 Ärzte gaben unrealistische Schätzungen von über 50 Prozent. Somit ließ sich allein durch die Form der Information bei vielen Ärzten, wenn auch nicht bei allen, Zahlenblindheit in Einsicht verwandeln. In einer Reihe von Untersuchungen haben wir den Vorteil natürlicher Häufigkeiten bei Medizinstudenten wie Ärzten und bei Jurastudenten wie Richtern nachgewiesen (Gigerenzer, 2002; Hoffrage et al., 2000). Die Verwendung von natürlichen Häufigkeiten an Stelle bedingter Wahrscheinlichkeiten ist eine einfache, schnelle und wirksame Methode, diagnostische Einsichten zu fördern.
Relative Risiken
Der Nutzen einer Behandlung wird oft in Form der relativen Risikoreduktion dargestellt. Beispielsweise wird mitgeteilt, dass Mammographie das Risiko, an Brustkrebs zu sterben, um 25% reduziert, oder dass prophylaktische Mastektomie das Risiko um 90% reduziert. Studien haben gezeigt, dass Patienten relative Risiken systematisch missverstehen. Viele nehmen fälschlicherweise an, eine 25-prozentige Reduktion würde bedeuten, dass bei 100 Personen, die an der Behandlung teilnehmen, das Leben von 25 gerettet wird. Wie kann man die Information über den Nutzen so kommunizieren, dass eine Frau ihn leicht verstehen kann? Umseitiger Kasten zeigt die tatsächliche Mortalitätsreduktion durch Mammographie-Screening, ermittelt aus vier schwedischen randomisierten Studien mit rund 280.000 Frauen. Sie zeigt auch drei Formen, diesen Nutzen zu präsentieren. Alle drei Darstellungen sind korrekt, suggerieren aber unterschiedlich hohen Nutzen und können bei unbefangenen Lesern verschiedene Emotionen und Bereitschaft zur Teilnahme am Screening auslösen. Die absolute Risikoreduktion ist der Anteil der Frauen, die ohne Screening starben, abzüglich des Anteils derer, die mit Screening starben. Diese absolute Verminderung beträgt 4 minus 3, also 1 von 1000. Die relative Risikoreduktion ist die absolute Risikoreduktion, dividiert durch den Anteil der Frauen, die ohne Screening starben. Diese relative Risikoreduktion beträgt 1/4, also 25 Prozent. Die Anzahl der notwendigen Behandlungen, um einen Todesfall zu vermeiden ("number needed to treat"), beträgt 1000, denn einer von 1000 Todesfällen wird durch ein Screening verhindert. Wenn die relative Risikoreduktion angegeben wird, sind Missverständnisse die Regel. Relative Werte enthalten keine Informationen über den absoluten Nutzen eines Verfahrens: Beispielsweise bedeutet eine 25-prozentige Verminderung, dass viele Menschenleben gerettet werden, wenn die Krankheit selten ist. Eine transparente Information über den Nutzen einer Behandlung kann durch die Angabe absoluter Risiken oder der Anzahl notwendiger Behandlungen gewährleistet werden. Diese Formen entsprechen der Natur des menschlichen Gehirns, das dazu tendiert, in konkreten Personen zu denken, nicht in relativen Werten. Dennoch werden auch heute noch der Öffentlichkeit fast ausschließlich relative Risiken mitgeteilt und damit eine Überschätzung des Nutzens von Behandlungen bewusst in Kauf genommen. In meiner Forschungsgruppe ist eben eine Analyse von 27 Mammographie-Broschüren deutscher Organisationen fertiggestellt worden: Es gab eine einzige Broschüre, in der die Anzahl notwendiger Behandlungen angegeben war, und zwei, welche die absolute Risikoreduktion mitteilten (Kurzenhäuser, 2002). Relative Werte entsprechen größeren Zahlen als absolute Werte und wirken dadurch eindrucksvoller. Dies ist einer der Gründe, warum sie bevorzugt werden. In einem Informationsblatt über hormonhaltige Wechseljahr-Medikamente, das in deutschen gynäkologischen Praxen auslag, wurde beispielsweise der potentielle Vorteil der Hormone (eine Reduktion des Auftretens von Darmkrebs) in Form von relativen Risiken angegeben, der potentielle Nachteil (Erhöhung des Auftretens von Brustkrebs) aber in der Form absoluter Risiken. Dies lässt Vorteile größer und Nachteile kleiner erscheinen. Das bewusste Erzeugen von systematischen Missverständnissen ist wohl die Ausnahme. Aber man kann an diesem Fall sehen, wie wesentlich die klare Kommunikation von Risiken für die Glaubwürdigkeit des Arztes und das Vertrauen unserer Gesellschaft in das medizinische System ist.
Literatur:
- Gigerenzer, G. (1996). The psychology of good judgement; Frequency formats and simple algorithms. Medical Decision Making, 16, 273-280
- Gigerenzer, G. (2001). Der unmündige Patient. Kursbuch, 145, 132-144
- Gigerenzer, G. (2002). Das Einmaleins der Skepsis: Über den richtigen Umgang mit Zahlen und Risiken. Berlin: Berlin Verlag
- Gigerenzer, G. & Hoffrage, U. (1995). How to improve Bayesian reasoning without instruction: Frequency formats. Psychological Review, 102, 684-704
- Gigerenzer, G.,Hoffrage, U. & Ebert, A. (1998). AIDS counseling for low-risk clients. AIDS CARE, 10, 197-211
- Hoffrage, U. & Gigerenzer, G. (1998). Using natural frequencies to improve diagnostic inferences. Academic Medicine, 73, 538-540
- Hoffrage, U., Lindsey, S., Hertwig, R., & Gigerenzer, G. (2000). Communicating statistical information. Science, 290, 2261-2262
- Kerlikowske, K., Grady, D., Barclay, J., Sickles, E.A., Ernster, V. (1996), "Effect of age, breast density, and family history on the sensitivity of first screening mammography", Journal of the American Medical Association 276, S. 33-38
- Koehler, J. J., Chia, A., & Lindsey, S. (1995). The random match probability (RMP) in DNA evidence: Irrelevant or prejudical? Jurimetrics Journal, 35, 201-219
- Kurzenhäuser, S. (2002). Brustkrebs-Screening: Welche Informationen über Risiken und Nutzen vermitteln deutsche Gesundheitsbroschüren? Manuskript. Max-Planck-Institut für Bildungsforschung, Berlin
- Mühlhauser, I. & Höldke, B. (1999). Übersicht: Mammographie-Screening. Darstellung der wissenschaftlichen Evidenz-Grundlage zur Kommunikation mit der Frau. Sonderbeilage Arzneitelegramm, 10/99, 101-108
- Nyström, L., Larsson, L.-G., Wall, S., Rutqvist, L., Andersson, I., Bjurstam, N., Fagerberg, G., Frisell, J. & Tabár, L. (1996). An overview of the Swedish randomised mammography trials: Total mortality pattern and the representativity of the study cohorts. Journal of Medical Screening, 3, 85-87
- Sedlmeier, P. & Gigerenzer, G. (2001). Teaching Bayesian reasoning in less than two hours. Journal of Experimental Psychology: General, 130, 380-400
- Slaytor, E. K. & Ward, J. E. (1998). How risks of breast cancer and benefits of screening are communicated to women: Analysis of 58 pamphlets. British Medical Journal, 317, 263-264
- Slovic, P. & Monahan, J. (1995). Probability, danger and coercion: A study of risk perception and decision making in mental health law. Law and Human Behavior, 19, 49-65
- Slovic, P. & Monahan, J. & MacGregor, D. G. (2000). Violence risk assesssment and risk communication: The effects of using actual cases, providing instruction, and employing probability versus frequency formats. Law and Human Behavior, 24, 271-296
- Stine, G. J. (1999). AIDS update 1999: An annual overview of acquired immune deficiency syndrome. Upper Saddle River, NJ: Prentice-Hall, Inc.
Gerd Gigerenzer ist Professor für Psychologie an der Freien Universität Berlin und Direktor am Max-Planck-Institut für Bildungsforschung in Berlin. Er leitet den Forschungsbereich "Adaptives Verhalten und Kognition".
Nutzen des Mammographie-Screenings:
Kein Mammographie-Screening: 4 Todesfälle bei je 1000 Frauen Mammographie-Screening: 3 Todesfälle bei je 1000 Frauen
Drei Formen der Präsentation des Nutzens:
- Relative Risikoreduktion: Das Mammographie-Screening verringert das Risiko, an Brustkrebs zu sterben, um 25 Prozent.
- Absolute Risikoreduktion: Das Mammographie-Screening verringert die Anzahl der Frauen, die an Brustkrebs sterben, um 1 pro 1000, also um 0,1 Prozent.
- Anzahl der notwendigen Behandlungen: Die Anzahl der Frauen, die zehn Jahre lang am Screening teilnehmen müssen, damit ein Todesfall verhindert wird, beträgt 1000.
Die Reduktion der Mortalität durch Brustkrebs bei Frauen (über vierzig), welche zehn Jahre lang am Mammographie-Screening teilnahmen. Die Ergebnisse stammen aus vier schwedischen randomisierten Studien mit 280.000 Frauen (die Werte sind gerundet; nach Nyström et al., 1996; Mühlhauser & Hödke, 1999).