Eher schlau als klug - psychologische Hemmnisse vorausschauenden Handelns   
 

     H.-Peter Musahl (Universität Duisburg)     

 
 


Zusammenfassung
Psychologie untersucht menschliches Verhalten in Mensch-Maschine-Systemen
Instandhaltung - auch eine sicherheitspsychologische Aufgabenstellung
Exkurs: Was ist ein System?
Kognitive Ergonomie - Wahrnehmung und Denken folgen Regeln
Heurismen als "Denkzeuge"
Lernen als zentrale menschliche Fähigkeit - und als "Fallstrick"
Fehlerfreundlichkeit als Chance
Literatur


Zusammenfassung.- Vorausschauende Maßnahmen, wie sie bei Wartung und Instandhaltung in Mensch-Maschine-Systemen zum Ausdruck kommen, sind mit den natürlichen Prinzipien menschlichen Denkens und Handelns nur schwer vereinbar: Betrachtet man wahrnehmungs- und denkpsychologische Befunde, dann erweisen sich Menschen offenbar eher als "Schnellmerker", die gelegentlichen Trugschlüssen zum Opfer fallen, denn als umsichtig und klug abwägende Problemanalytiker. Der vorliegende Beitrag verweist zudem auf die Bedeutung des lernpsychologischen Prinzips der negativen Verstärkung, nach dem die Orientierung am subjektiven "Erfolg" des Ausbleibens negativer Konsequenzen insbesondere für die Instandhaltung kontraproduktive Urteilsprozesse begünstigt: So lange keine Störung vorliegt, scheint intuitiv jeglicher Eingriff unnötig - "Instandsetzung" ja, aber warum "Instandhaltung"? Vor diesem Hintergrund kommt der Fehlerfreundlichkeit komplexer Mensch-Maschine- Systeme eine besondere Bedeutung für ihre Sicherheit zu.




Psychologie untersucht menschliches Verhalten in Mensch-Maschine-Systemen

Menschen handeln eher "schlau" als "klug" - der kurzfristige Erfolg und das schlaue Umgehen des möglichen Nachteils oder drohenden Schadens sind unmittelbar lernwirksam. Kluges, umsichtiges und vorausplanendes Handeln, wie Instandhaltung dies typischerweise fordert, hatte vermutlich keinen besonderen evolutionären Überlebensvorteil in der Geschichte unserer Art.
Diese Grundannahmen über das Denken und Handeln von Menschen sind genuiner Forschungsgegenstand der Psychologie, die mit naturwissenschaftlichen Methoden die Frage zu beantworten sucht, warum sich Menschen so verhalten, wie sie es tatsächlich tun. Prinzipien der "kognitiven Ergonomie", die intuitiv Entscheidungsfähigkeit sichern, sind bestimmende Bedingungen für Handlungen der Systemkomponente "Mensch" in komplexen Mensch-Maschine-Systemen. Und es gilt auf lernpsychologische Hemmnisse für vorausschauende Maßnahmen wie Wartung und Instandhaltung hinzuweisen: Die Warnung vor dem künftigen Umweltschaden oder den Spätfolgen gesundheitswidrigen Verhaltens beeindrucken den Handelnden zumeist ebenso wenig wie ihn das Motto: "non scholae sed vitae discimus" zum fleißigen Schüler machte.



Instandhaltung - auch eine sicherheitspsychologische Aufgabenstellung
Instandhaltung umfasst gemäß DIN 31051 die Maßnahmen (a) der Wartung im Sinne der Bewachung des Soll-Zustands der technischen Mittel eines Systems durch Pflege, Reinigen, Schmieren und Nachstellen, (b) der Inspektion mit dem Ziel der Feststellung und Beurteilung dieses Zustands durch Messen und Prüfen sowie schließlich (c) im Falle der Überschreitung der zulässigen Toleranzgrenzen des Systems oder seiner Komponenten, der Instandsetzung, also der Wiederherstellung des Soll-Zustands durch Austausch oder Reparatur.
Zur planmäßigen Organisation der Instandhaltung als Bestandteil des Qualitätsmanagement-Systems im Sinne der Normenreihe ISO 9000 (DIN EN ISO 9001; DIN EN ISO 9002) werden die folgenden Strategien verwendet (Bruchhausen, 1996, S. 289): Die störungsabhängige Instandsetzung erfolgt meist nach Ausfall oder aufgrund des Erreichens der Schadensgrenze. Sie ist unfallträchtig, weil sie spontanes und schnelles Arbeiten verlangt und vom Instandhalter fachspezifische Fähigkeiten des Wahrnehmens und Beurteilens des aktuellen Systemzustands fordert. Diese fachliche Kompetenz ist weit weniger erforderlich bei der zeitabhängigen Instandhaltung,
bei der eine Instandsetzung oder ein Teileaustausch unabhängig vom tatsächlichen Komponentenzustand nach definierter Nutzungszeit erfolgt (Beispiele: Zündkerzen von Verbrennungsmotoren, Leuchtkörper in Hallen). Eine Variante dieser prophylaktisch orientierten Instandhaltungsstrategie ist die zustandsabhängige Instandhaltung: Dabei wird der Abnutzungsvorrat von Anlagenteilen durch Inspektion festgestellt, um notwendige Maßnahmen treffen zu können, falls ein Ende des Abnutzungsvorrats innerhalb des kommenden Arbeitsabschnitts zu erwarten ist.
Aufgabenstellung und Strategien der Instandhaltung umfassen demnach das Wahrnehmen und Erkennen von Störungen in komplexen Mensch-Maschine-Systemen, deren Analyse, Vermeiden und Bewältigung - all dies sind Aspekte moderner sicherheitspsychologischer Forschung. Detektion - im Sinne des Wahrnehmens und Erkennens - und Analyse von Störungen sind unmittelbare Funktion kognitiver Prozesse, die ihrerseits mit Lernvorgängen verknüpft sind.
Bevor wir uns aber mit der Frage nach typischen Formen und Regelwerken menschlichen Denkens, der "kognitiven Ergonomie", auseinander setzen, soll zunächst in einem Exkurs der Begriff "System" definiert werden. Denn die geläufige Forderung nach "systemischem" oder auch "ganzheitlichem" Denken übersieht vermutlich die Grenzen intuitiver menschlicher Denkprozesse. Genau das muss aber beachtet werden, wenn wir die Entstehung von Schäden aufgrund unzureichender Instandhaltung besser verstehen und in Zukunft vermeiden wollen.




Exkurs: Was ist ein System?
Ludwig von Bertalanffy, der Begründer der Allgemeinen Systemtheorie, definiert Systeme als "sets of elements standing in interrelation" (Bertalanffy, 1973, p. 37). Bei einem System handelt es sich demnach um ein organisiertes Ganzes aus einer definierbaren Menge von Elementen oder Variablen, dessen "organisierte Komplexität" aus den Wechselwirkungen seiner Komponenten entsteht.
Ein "System" liegt also nicht dann vor, wenn viele Komponenten gegeben sind, sondern wenn aus ihrem spezifischen Zusammenwirken etwas Neues entsteht: Erst aus dem Zusammenspiel von Instrumenten, Musikern, den Noten als Arbeitsleistung eines Komponisten und einem koordinierenden Dirigenten entsteht - Musik. Diese Wechselwirkungen ("Interaktionen") sind nicht-triviale, mathematisch nonlineare (multiplikative) Effekte wechselseitiger Einflüsse der Einzelkomponenten des Systems, sie sind daher nur aus dem Zusammenwirken der Einzelkomponenten erklärbar; Wechselwirkungen sind die stets multikausale Quelle der "organisierten Komplexität" des Systems. Rückmeldungsschleifen sind demgegenüber keine typischen Kennzeichen eines dynamischen Systems (Bertalanffy, 1973, p. 170ff), da sie in ihrer Richtung stets eindeutig definiert sind und wechselseitige Einflussnahmen ja gerade ausschließen.
Für die Modellierung des aktuellen Zustands eines dynamischen Mensch-Maschine-Systems heißt das: Zu einem bestimmten Zeitpunkt (Situation) wirken die technischen Gegebenheiten (Maschine), die nach dem Regelwerk gültige organisatorische Bestimmtheit (Organisation) sowie individuelle Merkmale und Informationsverarbeitungsprozesse des Bedieners (Person) im Sinne einer Wechselwirkung 3. Ordnung (SxMxOxP) zusammen. Der "Situations"- Faktor modelliert dabei die Einmaligkeit des aktuellen Zusammenwirkens und gestattet es, alle zeitkorrelierten Veränderungen der einzelnen Komponenten zu berücksichtigen: Das könnten Verschleiß oder Wartungszustand der technischen Anlage sein, für die Systemkomponenten "Organisation" und "Person" die durch Lernen entstandenen Veränderungen.
Der aktuelle Systemzustand ist demnach aus der Wechselwirkung aller vier Komponenten zu erklären, nicht aus der zeitlichen Aneinanderreihung ihrer relativen Einflüsse; auch die in Fehlerbäumen zumeist intuitiv angenommene gerichtete Kausalkette ist zum Verständnis komplexer systemischer Effekte unzureichend, meistens sogar "falsch". - Prozesse innerhalb dynamischer Systeme mit geeigneten Methoden zu analysieren ist anspruchsvoller, als es die schlagwortartige Forderung nach systemischem Denken vermuten lässt.




Kognitive Ergonomie - Wahrnehmung und Denken folgen Regeln

Wechselwirkungen in komplexen Systemen zu verstehen, Störungen nicht einer einzelnen Systemkomponente zuzuschreiben - Beispiel: "menschliches Versagen" als Pseudoerklärung - stellt hohe Ansprüche an das Denken und das Vorstellungsvermögen; dies ist einer der Gründe, warum die kognitionspsychologische Forschung eher Zweifel an der menschlichen Fähigkeit zu "systemischem" oder ganzheitlichem Denken anmeldet.
Diese Skepsis gilt auch für den Aspekt der Wahrnehmung, definiert als "perzeptiv-kognitive Informationsintegration": Wahrnehmung ist ein Prozess, in dem wir äußeren Reizen, die nach Maßgabe ihrer physikalischen Eigenschaften sowie interner physiologischer und psychologischer Vorgänge in organismisch relevante Information übersetzt werden, spontan Bedeutung zuweisen. Visuelle Wahrnehmung ist nicht das Lesen fertiger Bilder auf der Netzhaut, sondern die kognitive Bedeutungszuweisung zu internen Reizmustern, die ihrerseits Korrelate äußerer Reize sind. Oder: Wir sehen nicht mit den Augen, sondern weisen Reizgegebenheiten durch Namensgebung entsprechende Bedeutung zu, durchaus im Sinne des Kantschen Hinweises, nach dem ‚Anschauungen ohne Begriffe blind' sind.
Diese Bedeutungszuweisung folgt Regelwerken, die als Heurismen oder Heuristiken bezeichnet werden. Diese Prinzipien der kognitiven Ordnungsstiftung sollen in einem kurzen Überblick zusammengefasst werden (s. hierzu im Überblick: Kahneman, Slovic & Tversky, 1982; Musahl, 1997, S. 50-81).




Heurismen als "Denkzeuge".-
Da im Zuge der Evolution der menschliche Selektionsvorteil vermutlich nicht darin bestand, dass Menschen gelegentlich nach langem Nachdenken zu "richtigen" Urteilen kommen, sondern darin, dass sie sehr schnell eine situativ angemessene Entscheidung für subjektiv erfolgreiches Verhalten treffen konnten, bewähren sich diese Regelwerke insbesondere beim Zwang zu schneller Entscheidung - oder andersherum: Bei genauerem Hinsehen sind sie häufig die Quelle von Trugschlüssen und Irrtümern. Heuristiken helfen uns, Ereignisse zu identifizieren (Repräsentativitäts- und Ähnlichkeitsheuristik), vorhandenes Wissen darüber zusammenzutragen und zu aktivieren (Verfügbarkeitsheuristik), eigene Handlungsmöglichkeiten in der aktuellen Situation zu prüfen und sich auf sie einzustellen (Anpassungs- und Verankerungsheuristik); dabei kommt es zu Fehlschlüssen. Das muss man wissen, wenn man komplexe Systeme kontrollieren und Störungen erkennen, vermeiden oder bewältigen will.
Zwar treten Heurismen häufig in Kombination miteinander auf und sind dann schwer gegeneinander abzugrenzen; aber immer gilt es zunächst, ein Ereignis mit einem Namen zu versehen. Zu dieser Identifikation und Klassifikation bedienen wir uns des "Repräsentativitäts- und Ähnlichkeitsheurismus" - genau dies ist die Schnittstelle zum Wahrnehmungsprozess.
Bei der Identifikation eines Ereignisses orientieren wir uns an Prototypen, wie z.B. Stereotypen, die bestimmte Ereignisklassen repräsentieren, oder wir weisen Ereignissen aufgrund ihrer Ähnlichkeit mit vorhandenen Elementen deren Bedeutung zu. Dieser Heurismus entspricht den gestaltpsychologischen Prinzipien der Geschlossenheit, der Prägnanz, der Gleichartigkeit und des "gemeinsamen Schicksals". Der Einzelfall wird nicht jeweils erneut bewertet, sondern - das ist zumeist auch recht ökonomisch - als Variante bekannter Ereignisse interpretiert. Das kann allerdings auch die Aussage "Das machen wir immer so" und "Alles schon mal da gewesen" zur Folge haben; Verwechslungsfehler, die "Gültigkeits-Illusion" (Verwechslung von Prädiktor und Kriterium) sowie Denk- und Handlungsblockaden sind typische Konsequenzen unzureichender Identifikation aufgrund übergeneralisierender Ähnlichkeitsannahmen.
Ein für den Alltag besonders bedeutsames Prinzip ist der Verfügbarkeits-Heurismus. Er dient zur Informationsspeicherung und Bereitstellung sowie räumlich-zeitlichen Integration und Extrapolation von Informationen. Wie wir ein Ereignis bewerten hängt davon ab, wie viel Informationen darüber uns im Moment gegenwärtig sind oder einfach verfügbar gemacht werden können, weil sie anschaulich sind. Was im gestaltpsychologischen Sinne Figur und Grund ist, ergibt sich aus dem zuerst identifizierten Muster. Die Kehrseite des Prinzips: "Was zuerst kommt, wird bevorzugt" lautet allerdings: "Aus den Augen, aus dem Sinn". Und: Verfügbarkeit ist naturgemäß abhängig von den Regeln, nach denen Informationen uns überhaupt erreichen.
Bei Untersuchungen der Einschätzung lebensbedrohlicher Risiken - das gilt vermutlich auch für intuitive Gefährdungsabschätzungen - werden seltene, dramatische Unfallrisiken in ihrer Häufigkeit deutlich überschätzt, tägliche Todesursachen hingegen unterschätzt: Wer dachte während der Tage des ICE-Unglücks bei Eschede mit seinen 101 Todesopfern an die etwa 150 Verkehrstoten und an die Schwerverletzten im Straßenverkehr während der gleichen Woche (statistisch ca. 7.500). Naive Risikoschätzungen reflektieren mehr journalistische Publikationsregeln ("Hund beisst Mann" ist keine Meldung!) als die tatsächliche Ereignishäufigkeit (s. hierzu besonders Combs & Slovic, 1979).

Expertenurteile sind übrigens ähnlich fehleranfällig wie diejenigen von Laien, kritische Informationen werden möglicherweise weder abgefragt noch vermisst: Fehler werden nicht dort gesucht, wo sie sein können, sondern dort, wo sie im Moment gemäß einem subjektiven "Fehlerbaum" vermutet werden (Fischhoff, Slovic & Lichtenstein, 1978). Checklisten, mit denen Piloten vor dem Start die Vollständigkeit und Funktionsfähigkeit der Aggregate prüfen, sind also nicht "Gedächtnisstützen", sondern Vorsichtsmaßnahmen gegen unsere Denk- "Ergonomie".
Der Anpassungs- und Verankerungsheurismus dient der situationsangemessenen Reizaufnahme und Verarbeitung; seine überragende Leistung zeigt sich in der Urteilsrelativität unserer Wahrnehmung: Sie ist die Voraussetzung von Konstanzleistungen wie Größen-, Form-, Raum- und Farbkonstanz. Kehrseite dieser Heurismen ist die Bezugssystemabhängigkeit von Urteilen (Verankerung) und, als Anpassung an individuelle Erfahrungsbildung, die übersteigerte Urteilssicherheit ("overconfidence" oder "It won't happen to me") und Scheingenauigkeit ("hyperprecision").
Selbstsichere Experten zweifeln nicht an ihren Urteilen; wird das Gegenteil belegt, dann werden die Daten als "falsch" abgewertet (Wenninger, 1988, 161-163) oder der Experte hat es "schon vorher gewußt" - eine als "post-hoc-Prophezeiung" zu bezeichnende Variante dieser Heuristik. Nach der Wahl versuchen uns immer wieder Politiker und Journalisten davon zu überzeugen, dass sie das Ergebnis vorhergesehen hätten; dieser scheinkluge Urteilsfehler wird auch häufig nach Unfällen, Katastrophen oder spektakulären Verbrechen laut. Aber schon der Volksmund weiß darauf angemessen zu antworten: ‚Wenn man vom Rathaus kommt, ist man schlauer'.

Diese heuristischen Prinzipien, Regeln der kognitiven Ordnungsstiftung, dienen der schnellen Auswertung von Informationen, der Orientierung in unserer Umwelt; sie haben sich entwicklungsgeschichtlich bewährt. Mit ihnen machen wir uns einen Reim auf unsere Welt. Die Funktion von Heurismen besteht dabei ausdrücklich nicht darin, uns nachdenklich zu machen, kritisch den nächsten Schritt abzuwägen, sondern darin, Unsicherheit zu beseitigen und schnelle, einfache Antworten zu befördern - heuristische Prinzipien bewirken Entscheidungsfähigkeit durch Problemverkürzung. Der Appell, systemisches Denken müsse man nur "wollen", gleicht daher lautem Singen im dunklen Keller: Systemisches Denken, das Verstehen komplexer Wechselwirkungen, gehört nicht zu den besonders ausgeprägten menschlichen Fähigkeiten! Wir tendieren aufgrund unseres "Betriebssystems" zur vereinfachenden Ursachenzuschreibung, zur Aussage "Alles in Ordnung", solange der Systemausfall nicht eingetreten ist, zum Glauben an unsere Kompetenz als Autofahrer, solange die ohnehin wahrscheinliche Unfallfreiheit gegeben ist. Was wir als "menschliches Versagen" denunzieren, ist also keineswegs Versagen, sondern natürliches Funktionieren aufgrund unserer kognitiven Ergonomie.
Die Befunde experimenteller Lernforschung lassen zudem vermuten, dass ein subjektives Ausbleiben unerwünschter Konsequenzen, der vermeintlich störungsfreie Ablauf trotz regelwidrigen Systemzustands, die künftige Regelmissachtung fördert. Prinzipien des Denkens und des Lernens begünstigen demnach Bedingungen für Katastrophen und Unglücke, die dann scheinbar völlig unvermutet auftreten; diesem Aspekt gilt der folgende Abschnitt.




Lernen als zentrale menschliche Fähigkeit - und als "Fallstrick"
- Wenn eine Person sich unangemessen oder erfolglos verhält, in einer späteren, ähnlichen Situation jedoch erfolgreich und angemessen, dann erklären wir dies mit ihrer Fähigkeit zum "Lernen"; sie orientiert sich an ihrer eigenen oder einer von anderen übernommenen Erfahrung. Diese individuelle Anpassungsleistung von Organismen war entwicklungsgeschichtlich umso bedeutsamer, je weniger das Verhalten - wie beim Menschen - (a) durch eine kurze Lebensdauer in einem engen Biotop eingeschränkt ist und (b) durch vorgegebenes Instinktverhalten festgelegt ist; Organismen mit geringer Lebensdauer in einem eng umgrenzten und relativ konstanten Biotop benötigen keine weit entwickelte Anpassungsfähigkeit.
Man bezeichnet daher Veränderungen in der Wahrscheinlichkeit, mit der Verhaltensweisen in bestimmten Reizsituationen auftreten, als Lernen, sofern diese nicht durch Verletzung eines Organismus oder spontan im Zuge der Reifung zustande kommen, sondern auf frühere Begegnungen mit dieser oder einer ähnlichen Reizsituation zurückgehen" (Hofstätter, 1957, S. 195). Lernen ist ein explikatives Konstrukt, mit dessen Hilfe wir Veränderungen des Verhaltens post hoc erklären.

Drei Formen des Lernens sind zu unterscheiden:
- Beim "Assoziations-Lernen" wird ein ursprünglich neutraler Reiz mit einem anderen Reiz verknüpft ("assoziiert"), der eine bedeutsame Reaktion auslöst. Es handelt sich also um einen Prozess der "Reiz-Substitution". Die "klassische Konditionierung" (Pawlow, 1916, 1923), bei der neutrale Reize mit (biologisch) bedeutsamen Reiz-Reaktions-Beziehungen (Reflexen) verknüpft werden, ist ein typisches Beispiel für diese Lernform.
- Das "Erfolgs-Lernen" beruht auf dem Effektgesetz (Thorndike, 1898): Verhaltensweisen werden in ihrer künftigen Auftretenshäufigkeit durch ihren bisherigen Erfolg bestimmt. Der Lernende interpretiert den einer Reaktion folgenden Reiz als dessen Konsequenz und bewertet ihn nach seinem subjektiven (!) Erfolg. Verhalten und Folge bilden eine "Kontingenz" und die Reaktionswahrscheinlichkeit verändert sich. Diese Lernform ist zentral mit der Theorie der operanten Konditionierung von Skinner (1953, 1978) verbunden.
- "Modell-Lernen" (oder "Imitations-Lernen") führt zum Erwerb neuer Verhaltensmuster aufgrund der Beobachtung anderer: Verhaltensweisen eines "Modells" oder Vorbilds werden übernommen (Bandura, 1976).
Diese drei unterschiedlichen Lernformen sind keine konkurrierenden Theorien, sondern sie erklären jeweils unterschiedliche Prozesse: Assoziationslernen erklärt die durch Erfahrungsbildung erfolgende Verknüpfung bisher neutraler mit bedeutsamen Reizen, die operante Konditionierung erklärt die Veränderung der Häufigkeit von Reaktionen mit deren subjektivem Erfolg und das Modell-Lernen führt zur Übernahme neuer komplexer Verhaltensmuster durch die Imitation erfolgreicher Verhaltensmodelle und sog. Vorbilder. Für unseren Zusammenhang - das Verständnis psychologischer Hemmnisse vorausschauenden Handelns - ist das Erfolgslernen von besonderer Bedeutung; seine Paradigmen nützen dem Verständnis dafür, dass sich Menschen mit dem bei der Instandhaltung geforderten vorausschauenden Handeln so schwer tun.
"Negative Verstärkung" oder: Wenn Sanktionen ausbleiben. - Ausgangspunkt des Erfolgs-Lernens ist die subjektive Bewertung des auf ein willkürlich oder zufällig ausgeführtes Verhalten folgenden Ereignisses als dessen Konsequenz; diese Folge von Verhalten und Konsequenz bildet eine "Kontingenz". Diese subjektive Ereignis-Folge-Erwartung bewirkt eine Verstärkung oder eine Abschwächung der jeweiligen Verhaltenswahrscheinlichkeit.
Verhaltensweisen werden seltener, wenn ihre Folge subjektiv unerfreulich ist: Auf eine Handlung folgt ein als aversiv bewertetes Ereignis (Abschwächung, "Bestrafung") oder ein erwarteter appetitiver Reiz bleibt aus (Löschung, "Extinktion"). Also: Strafe und der Entzug von Vergünstigung wirken in die gleiche Richtung.
Verhaltensweisen werden hingegen häufiger, wenn ihre Folge subjektiv erfreulich ist: Der Reaktion folgt ein appetitiver Reiz (positive Verstärkung, "Belohnung") oder - und das ist in unserem Zusammenhang besonders wichtig (s. hierzu Musahl, 1999) - die ohnehin unerwünschte aversive Konsequenz tritt nicht ein (negative Verstärkung, Vermeidung oder Ausbleiben einer Sanktion); dabei scheint es für den Lernerfolg gleichgültig, ob der aversive Reiz einfach nur ausbleibt oder durch eigenes Tun vermieden wird.

Die Wirkung der Kontingenzen ist von ihrer Stärke, Häufigkeit und zeitlichen Verteilung abhängig. Je variabler eine bestimmte Konsequenz eintritt, desto nachhaltiger ist der Lerneffekt; aperiodische Verstärkungsprogramme sind nur sehr schwer zu löschen. Und das heisst für die negative Verstärkung: Verharmloste Regelverstöße, unerkannte Beinahe-Unfälle, übersehene Mängel, latente Krankheitsursachen oder Umweltschädigungen behalten aufgrund aperiodischer, seltener oder verzögert auftretender Kontrollen, Unfälle oder Schäden ihren Verstärkungs-Charakter; denn der unmittelbare Misserfolg bleibt aus, der angekündigte oder erwartete Schaden tritt nicht ein. Negative Verstärkung - man tut das Verbotene oder unterlässt das Gebotene, aber die erwartete Sanktion bleibt aus - ist daher für unseren Zusammenhang von überragender Bedeutung.
Der subjektive Gewinn bei der "negativen" Verstärkung besteht also nicht darin, dass der Handelnde einen Vorteil bekommt - dies wird häufig fälschlich mit Verweis auf die "Bequemlichkeit" oder Schnelligkeit sicherheitswidrigen Verhaltens behauptet - sondern dass der erwartete Nachteil nicht eintritt; genau dies bezeichnet der Begriff "negativ"! Wenn der Handelnde darüber hinaus tatsächlich etwas erhält - das bezeichnet der Begriff "positiv" - dann folgt der negativen zusätzlich eine positive Verstärkung. Beide Prozesse sind theoretisch und experimentell deutlich voneinander zu unterscheiden. - Diese doppelte Verstärkung, bei der einer negativen noch eine positive Verstärkung folgt, ist in sozialen Systemen immer dann bedeutsam, wenn die Bewältigung von Gefahr oder die Nichteinhaltung von Regeln den sozialen Status mitbestimmen - das "l'état c'est moi!" des Louis XIV. oder die römische Sentenz "Quod licet Iovi, non licet bovi" ("Was Jupiter darf, ist dem Ochsen noch lange nicht erlaubt") beschreiben genau diese Tatsache: Dem Regelverstoß folgt (a) keine Sanktion und (b) der Handelnde gewinnt an sozialem Ansehen - ein typischer Vorgang im Sozialisationsprozess vom Jugendlichen zum Erwachsenen.
Der Effekt der negativen Verstärkung subjektiv konsequenzenloser Regelverstöße konnte wiederholt nachgewiesen werden: In einem Simulationsexperiment sollte zur Vermeidung von Störungen eine Sicherheitsregel beachtet werden; Sanktionsstärke und -häufigkeit für den Fall des Regelverstoßes wurden in je drei Stufen systematisch variiert. Negative Verstärkung erwies sich als sehr wirksam: Die Regelbefolgung nimmt mit der Häufigkeit negativer Verstärkungen ab. Die Wahrscheinlichkeit, gegen die Regel zu verstoßen, wird umso größer, je häufiger dies bisher straflos möglich war. Ab einer relativen Häufigkeit von etwa 80% "erfolgreicher" Regelverstöße wird die Regel überhaupt nicht mehr eingehalten; sie ist subjektiv "ungültig", der Regelverstoß ist die neue Norm (Musahl & Müller-Gethmann, 1994, S. 162-165). Ein kritisches Extensionsexperiment replizierte den Befund nachdrücklich (Müller-Gethmann & Musahl, 1996).

Die Ergebnisse beider Experimente führten zu einer weiteren Hypothese: Die subjektiv erfolgreiche Vermeidung oder Bewältigung von Gefahr, Bedrohung, Verletzung, Schmerz hat vermutlich aus biologischen Gründen einen besonderen Rang. Sie war für das Überleben der Art Mensch wichtiger als der Zugang zu Nahrung hic et nunc. Daher ist zu erwarten, dass der Lerneffekt bei negativer Verstärkung (Vermeidung von Gefahr) größer ist als bei positiver Verstärkung (Gewinn einer Belohnung) - der resultierende Lerngradient müsste steiler sein. Dies wurde in dem folgenden Experiment geprüft, bei dem es sich um eine lernpsychologisch erweiterte Variante einer klassischen gedächtnispsychologischen Arbeit von Miller, Bruner & Postman (1954) handelt (Horstmann, 1998):


Abbildung 1: Mittlerer Prozentsatz richtig reproduzierter Buchstabensequenzen in den 5 Lerndurchgängen in Abhängigkeit von ihrem Approximationsgrad und den beiden Verstärkungsbedingungen: Neben den Haupteffekten der Lerndurchgänge und des Approximationsgrads resultiert eine signifikante Wechselwirkung zwischen den Lerndurchgängen und der Verstärkungsart; der Lernerfolg bei negativer Verstärkung (fett) übertrifft zunehmend denjenigen bei positiver Verstärkung.

Methode: Auf einem Rechnermonitor wurden kurzzeitig (100 msek) insgesamt 75 Buchstabenfolgen variabler Länge (Sequenzlängen von 6, 8 und 10 Buchstaben) und unterschiedlicher Ähnlichkeit mit der Muttersprache (sog. Approximationsgrad) dargeboten. Die jeweilige Sequenz sollte unmittelbar anschließend mit Hilfe der Rechnertastatur reproduziert werden. 15 Buchstabenfolgen waren in 5 Lerndurchgänge zu bearbeiten. Ausgewertet wurde (a) die Anzahl reproduzierter Buchstaben und (b) deren Position innerhalb der Sequenz.
Versuchsteilnehmer waren 80 Psychologie-Studenten, die in ihrem Grundstudium sog. Versuchspersonenstunden ableisten mussten, um an einem experimentellen Pflichtpraktikum teilnehmen zu können. Sie wurden zur Untersuchung der Wirkung unterschiedlicher Verstärkungen auf den Lernverlauf nach dem Zufall zwei Bedingungen zugewiesen: Wurde jeweils mehr als 50% der dargebotenen Buchstabenfolge reproduziert, dann (a) erhielten sie einen definierten Zeitgewinn ("positive Verstärkung") oder (b) vermieden sie einen definierten Zeitabzug von einem Guthaben von 3 Versuchspersonenstunden ("negative Verstärkung"). - Damit lag dem Experiment ein 4-faktorieller Mischversuchsplan (RRWW 2x2x3x5) mit 2 Zufallsfaktoren ("positive" versus "negative Verstärkung"; "niedriger [2]" versus "hoher [8] Approximationsgrad") und 2 Faktoren mit wiederholten Messungen (Sequenzlängen mit 6, 8 und 10 Buchstaben; Lerndurchgänge 1 bis 5) zu Grunde.
Den Hauptbefund zeigt Abbildung 1; er unterstützt die Hypothese der stärkeren Lernwirksamkeit negativer Verstärkungen: Der mittlere Prozentsatz richtig reproduzierter Buchstabensequenzen in den 5 Lerndurchgängen nimmt in Abhängigkeit von den beiden Verstärkungsbedingungen und dem Approximationsgrad zu. Neben den varianzanalytisch signifikanten Haupteffekten der Lerndurchgänge (F4; 5940 = 89,9; p=.00) - es wird also tatsächlich gelernt - und des Approximationsgrads (F1; 76 = 4,5; p=.037) - der Lernerfolg ist bei dem höheren Approximationsgrad erwartungsgemäß größer als bei niedrigem - resultiert eine signifikante Wechselwirkung zwischen den Lerndurchgängen und der Verstärkungsart (F4; 5940 = 6,0; p=.00): Der Lernerfolg bei negativer Verstärkung übertrifft denjenigen bei positiver Verstärkung mit den Lerndurchgängen zunehmend. Dies differenziert den generellen Haupteffekt der Verstärkungsbedingung über die beiden Approximationsgrade hinweg (F1; 5940 = 20,1; p=.00).

Abbildung 2: Erfolgreiche Lernprozesse erhöhen nicht nur das mittlere Leistungsniveau, sie verringern - homogene Lerngruppen vorausgesetzt - auch die Streuung der Einzelleistungen. Auch dabei verschwindet offenbar die anfängliche Überlegenheit der positiven Verstärkung (dünner Datentrend); die mittlere Höhe der Standardabweichung nimmt bei negativer Verstärkung (fett) über die Lerndurchgänge kontinuierlich ab und ist schließlich geringer als die Datenstreuung bei positiver Verstärkung.

Kennzeichnend für erfolgreiche Lernprozesse ist nicht nur die kontinuierliche Zunahme des mittleren Leistungsniveaus, sie verringern - homogene Lerngruppen vorausgesetzt - auch die Streuung der Einzelleistungen, weil insgesamt weniger Fehler gemacht werden und sich der Abstand zwischen den besten und den schlechten Lernern verkleinert.

Eine Analyse der Streuungsmaße unter den beiden Verstärkungsbedingungen bestätigte deren unterschiedliche Wirkung (s. Abb. 2): Die anfänglich geringeren Streuungsunterschiede bei positiver Verstärkung (geringere Standardabweichung) verschwinden nach dem dritten Lerndurchgang, die mittlere Streuung nimmt bei negativer Verstärkung über die Lerndurchgänge kontinuierlich ab und ist schließlich geringer als diejenige bei positiver Verstärkung.
Unbeschadet der Notwendigkeit einer kritischen Replikation dieses Experiments stützen seine bei den vier unabhängigen Stichproben konsistenten Befunde klar die Hypothese der größeren Lernwirksamkeit der negativen gegenüber der zumeist empfohlenen positiven Verstärkung. Was pädagogisch und möglicherweise ideologisch zurückgewiesen wird - der Hinweis auf Sanktionen, vielleicht auch die Drohung damit - scheint lernpsychologisch, vermutlich aus evolutionsbiologischen Gründen vorteilhaft. Für den vorliegenden Sachverhalt der Instandhaltung ist der Befund zugleich fatal - das "Glück-gehabt!" nach ausbleibendem Schaden begünstigt künftige Vernachlässigung der Sorgfalt - und sicherheitspsychologisch wichtig: Wir verstehen das Entstehen von Sorglosigkeit bei der Instandhaltung besser und können, da es sich um einen Lernprozess handelt, in diesen gezielt eingreifen. Hierzu bedarf es der Aufdeckung der lernpsychologisch relevanten Agenten - das sind die konsequenzenlos auftretenden Fehler.




Fehlerfreundlichkeit als Chance
- Moderne, anspruchsvolle Mensch-Maschine-Systeme gestatten üblicherweise in einem bestimmten Umfang fehlerhafte Handlungen (sog. Fehlhandlungen, also falsche Handlungen) und Handlungsfehler (falsche Einzeltätigkeit innerhalb einer im übrigen zutreffend gewählten Handlung) sowie den Ausfall oder die Fehlfunktion technischer Komponenten aufgrund ihrer Fehlertoleranz: Technische oder organisationale Systemkomponenten puffern Sollwertabweichungen jenseits der Toleranzgrenzen ab oder korrigieren sie mit Hilfe redundanter Komponenten. Das ABS-System gestattet einen Bremsvorgang bei nasser Straße, ohne dass es zum Ausbrechen des Fahrzeugs kommt, auch dann noch, wenn der Fahrer besser hätte sehr viel langsamer fahren sollen. Und das Bremssystem selbst bleibt innerhalb bestimmter Grenzen funktionsfähig, auch wenn eine Bremsleitung defekt ist, da es sich um ein Zweikreisbremssystem handelt.
Allerdings: Wenn diese Systeme Fehler tolerieren, indem sie deren Wirkung kompensieren, ohne dass diese Tatsache dem Operator zurückgemeldet wird, dann wird er sich künftig nicht anders verhalten. Es gibt auch keinen Grund, an der perfekten Funktion des Systems zu zweifeln. Fehlertolerante Systeme bergen daher die Gefahr der Begünstigung der "Kontroll-Illusion" aufgrund der subjektiven Fehlerfreiheit des Systems in sich. Dieser unzutreffende Glaube, man habe das System unter Kontrolle, war und ist eine wichtige psychologische Ursache zahlreicher Störungen, Unfälle und Katastrophen. Dies ist also nicht "menschliches Versagen", sondern die technische und organisationale Begünstigung eines irreführenden Lernprozesses, in dem der Mensch als Lernender - leider - sehr gut funktioniert.
Fehlerfreundlichkeit ist ein wichtiger Schritt zur Aufdeckung von Fehlern und damit zur Vermeidung dieses fatalen Lernvorgangs. Arbeitssysteme und technische Systeme bezeichnet man dann als "fehlerfreundlich", wenn sie das Aufdecken von Fehlern fördern, sie "freundlich begrüßen", weil aus der Entstehungsgeschichte des Fehlers auf den zu Grunde liegenden technischen Vorgang oder Denkprozess geschlossen werden kann. Bereits Ernst Mach (1905) wies darauf hin: "Wissen und Irrtum fließen aus derselben Quelle, nur der Erfolg unterscheidet das eine vom anderen." Es gilt also, den subjektiven Begründungszusammenhang von fehlerhaften Handlungen und Zuständen aufzudecken, um auf diese Weise "aus Fehlern zu lernen". Ausgehend von der modernen Sicht des Fehlers, nach der es sich dabei zum Zeitpunkt des Handelns um einen subjektiv zutreffenden Akt handelt (Wehner, 1994), wird dessen subjektive Logik erkannt und kann durch den Handelnden oder das System korrigiert werden, so dass er künftig nicht mehr auftritt. Fehlerfreundlichkeit, das sei eingeräumt, ist allerdings eine ziemliche Herausforderung in einer Gesellschaft, in der frühzeitig gelernt wird, dass Fehlervertuschung und Mogeln sich gelegentlich lohnen.
Die Überwindung dieser gelernten Haltungen und das Konzept der Fehlerfreundlichkeit fordert Arbeitsroutinen, die sich im Bereich des Arbeitsschutzes mit der Aufdeckung von insbesondere bisher unerkannten Beinahe-Unfällen außerordentlich bewährt haben. Auch die Verfolgung hoher Qualitätsstandards fordert im Grunde nichts anderes, als den Prozess kontinuierlicher Verbesserung mittels beständiger kritischer Würdigung der eigenen Arbeit, dem Erkennen und Vermeiden von Fehlern und dem Bemühen um innovative Lösungen voranzutreiben.

Wartung und Instandhaltung verlangen Formen des Denkens und Handelns, die natürlichen Verhaltenstendenzen widersprechen. Notwendig ist daher (1) zunächst die respektvolle Kenntnisnahme unserer psychologischen Konstruktionsprinzipien, (2) das explizite Bemühen um "Fehlerfreundlichkeit" als Voraussetzung zur vorausplanenden Störungsvermeidung und (3) die systematische Entwicklung von Handlungsroutinen, welche die psychologischen Prinzipien nicht beklagen und denunzieren - im Sinne des Etiketts "menschliches Versagen" oder der "human error probability" - sondern sie konstruktiv nutzen, die Handelnden im Kantschen Sinne über Denkfehler und Lernprozesse "aufklären" und sie befähigen, Trugschlüsse und Fehlbeurteilungen zu vermeiden sowie dadurch Störungsmöglichkeiten und Fehlerquellen frühzeitig zu erkennen und vorausschauend zu bewältigen.




Literatur

 
Bandura, A. (Hrsg.) (1976). Lernen am Modell. Stuttgart: Klett.

Bruchhausen, A. (1996). Instandhaltung. In G. Wenninger & C. Graf Hoyos (Hrsg.), Arbeits-, Gesundheits- und Umweltschutz: Handwörterbuch verhaltenswissenschaftlicher Grundbegriffe (S. 288-295). Heidelberg: Asanger.

Combs, B. & Slovic, P. (1979). Causes of death: Biased newspaper coverage and biased judgments. Journalism Quarterly, 56, 837-843, 849.

Fischhoff, B., Slovic, P. & Lichtenstein, S. (1978). Fault trees: Sensitivity of estimated failure probabilities to problem presentation. Journal of Experimental Psychology: Human Perception and Performance, 4, 330-344.

Hofstätter, P.R. (1957). Psychologie. Frankfurt am Main: Fischer.

Horstmann, M. (1998). Experimentelle Untersuchung zu "Lohn" und "Strafe" - Lerngradienten nach positiver und nach negativer Verstärkung. Duisburg: Unveröff. schriftliche Hausarbeit im Rahmen der 1. Staatsprüfung für das Lehramt für die Sekundarstufe I/II.

Kahneman,D., Slovic, P. & Tversky, A. (1982). Judgment under uncertainty: Heuristics and biases. Cambridge: Cambridge University Press.
     
Mach, E. (1905). Erkenntnis und Irrtum. Barth: Leipzig.

Miller, G.A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63, 81-97.

Miller, G.A., Bruner, J.D. & Postman, L. (1954). Familiarity of letter sequences and tachistoscopic identification. Journal of General Psychology, 50, 129-139.

Müller-Gethmann, H. & Musahl, H.-P. (1996). Lernparadigmen oder Sicherheitsmotive? In B. Ludborzs, H. Nold & B. Rüttinger (Hrsg.), Psychologie der Arbeitssicherheit. 8. Workshop 1995 (757-771). Heidelberg: Asanger.

Musahl, H.-P. (1997). Gefahrenkognition: Theoretische Annäherungen, empirische Befunde und Anwendungsbezüge zur subjektiven Gefahrenkenntnis. Heidelberg: Asanger.

Musahl, H.-P. (1999). Lernen. In C. Graf Hoyos & D. Frey (Hrsg.), Arbeits- und Organisationspsychologie: Ein Lehrbuch (328-343). Weinheim: Psychologie Verlags Union.

Musahl, H.-P. & Müller-Gethmann, H. (1994). Beinahe-Unfälle: Ein für die Theoriebildung und für die sicherheitspsychologische Anwendung "notwendiges" Konstrukt. In F. Burkardt & C. Winklmeier (Hrsg.), Psychologie der Arbeitssicherheit. 7. Workshop 1993 (431-446). Heidelberg: Asanger.

Pawlow, I.P. (1916). Der Zielreflex. Sämtliche Werke Bd.3 (222-227). Berlin: Akademie Verlag 1953.

Pawlow, I.P. (1923). Zwanzigjährige Erfahrungen mit dem objektiven Studium der höheren Nerventätigkeit (des Verhaltens) der Tiere. Sämtliche Werke Bd.3 (1-136). Berlin: Akademie Verlag 1953.

Skinner, B.F. (1953). Science and Human Behavior. New York: Macmillan.

Skinner, B.F. (1978). Was ist Behaviorismus? Reinbek bei Hamburg: Rowohlt.

Thorndike, E.L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph 2, 1-109.

Wehner, T. (1994). Arbeitssicherheit und Fehlerfreundlichkeit - ein Gegensatz? Konzeption und empirische Befunde zur psychologischen Fehlerforschung. In N.

Beckenbach & W. van Treek (Hrsg.), Umbrüche gesellschaftlicher Arbeit. Soziale Welt. Sonderband 9, 409-428.

Wenninger, G. (1988). Arbeitsschutz. In D. Frey, C. Graf Hoyos & D. Stahlberg (Hrsg.), Angewandte Psychologie: Ein Lehrbuch (147-168). München: Psychologie Verlags Union.