Links

Informationelle Selbstbestimmung und DNA-Analysen
von Kai Stumper
Sprache: Deutsch
Gebundene Ausgabe - 289 Seiten
Erscheinungsdatum: 1996
Suchen nach:
In Partnerschaft mit Amazon.de


SKINNERs operante Konditionierung

(Script 1994)

SKINNERs radikaler Behaviorismus gehört wie WATSONs Theorie zu den mechanistischen Modellen vom Menschen. Der Mensch reagiert auf externe Umweltdeterminanten und ihre Reize, auf einen Stimulus folgt eine Response. Im Gegensatz zu WATSON und seiner klassischen Konditionierung ist nach SKINNER der verhaltensauslösende Reiz meistens nicht zu erkennen, sondern das Verhalten tritt meistens auf in der Erwartung bestimmter Reize oder Konsequenzen des Handelns. Solches Verhalten (z.B. schreiben, laufen etc.) nennt SKINNER Operanten oder operante Reaktionsmuster. Wenn die Handlungskonsequenzen (die dann auch Reize sind) die Wahrscheinlichkeit des Auftretens des Operanten bzw. des operanten Verhaltens erhöhen, haben sie verstärkende Wirkung. Die Handlungskonsequenzen oder verstärkenden Reize werden dann Verstärker genannt. Grob lassen sich drei verschiedene Arten von Verstärkern unterscheiden:
- Materielle Verstärker (z.B. Schokolade als Belohnung für ein Verhalten)
- Soziale Verstärker (z.B. Lob oder Zuspruch als Belohnung für den Operanten)
- Handlungsverstärker (z.B. Erlaubnis ,zum Spielen zu gehen)
Werden auf diese Weise ein bestimmtes Verhalten und ein dieses Verhalten verstärkendes Ereignis aneinander gekoppelt, spricht SKINNER von einer operanten Konditionierung.

EXKURS: Das S-O-R-K-C Schema von KANFER/PHILIPPS

Dieses Modell ist ein verhaltensanalytisches Modell, in dessen Mittelpunkt mit R die Reaktion einer Person steht. Das Modell ist in der Reihenfolge als zeitliche Abfolge zu verstehen. Als Antezedenzbedingungen für R stehen mit S (Stimulus) die Reizsituation (objektive, von der Person unabhängige Umgebungsbedingungen) und mit O (Organismus) der psychologische Zustand des Organismus. Als Verhaltensauswirkungen steht K (Konsequenzen, als auftretende Ereignisse nach der Reaktion) für die Konsequenzen, die entweder reaktionsbekräftigende oder entkräftende Wirkung haben kann und C (Contingenzen) für die Häufigkeit und zeitliche Verteilung des Verstärkers.
In diesem Schema bedeutet die operante Konditionierung die Verknüpfung zwischen der R-Variablen und K-Variablen. Diese Verknüpfung muß sich nicht nur auf ein spezielles Verhalten auswirken, sondern kann eine ganze Kategorie von Operanten betreffen . Man spricht in diesem Zusammenhang von Reaktionsgeneralisierung , auch Reaktions-Induktion oder Transfer. (Beispiel: Für eine ein in Mathe bekommt ein Junge Lob, das verstärkt seine schulischen Anstrengungen auch in anderen Fächern oder sogar auch beim Sport). Der Reaktionsgeneralisierung entgegengesetzt ist die Reaktionsdiskrimination: Ein besonderes Element einer Verhaltenskette wird hervorgehoben, eine sogenannte differentielle Verstärkung einer Teilreaktion. (Beispiel: Im Tennistraining wird die Ausbildung der Rückhand systematisch verstärkt).
Es werden vier verschiedene Arten von Verstärkern unterschieden, die sich nach Reizqualität und Darbietungsart unterscheiden. Zum einen kann ein Reiz zugeführt werden (positiv) oder entzogen werden (negativ), zum anderen kann ein Reiz angenehm (Belohnung) oder aversiv (Bestrafung) sein. So ergeben sich:
- Positive Belohnung Bsp. : Schokolade für eine Leistung
- Positive Bestrafung Bsp.: Züchtigung für ein Verhalten
- Negative Belohnung Bsp.: Aufhebung des Hausarrestes für ein Verhalten
- Negative Bestrafung Bsp.: Liebesentzug
Diesen Verstärkern kann ein Reiz vorgeschaltet werden, der anzeigt, welche Art von Verstärker folgen wird. Seine Funktion ist es, zu signalisieren, welche Art von Reaktion auf ein bestimmtes Verhalten folgen wird. Beispiel: Sich verfinsternder Gesichtsausdruck meines Gesprächspartners, während ich mich auf ein bestimmtes Thema zu bewegen. Dies ist ein diskriminativer Reiz, der Operant ist in diesem Fall meine Präsentation des Themas, der Verstärker wäre die (wahrscheinlich unwillige) Reaktion meines Gesprächspartners. So kann eine Reaktion auch durch diskriminative Reize kontrolliert werden, weil der Reiz bei z.B. dazu folgen körnte, daß ich das Thema abbreche. Man spricht dabei von Reizkontrolle. Es wird dabei auch angenommen, daß diskriminative Reize für sich allein keine belohnende oder bestrafende Wirkung haben. Dies waren die wesentlichsten Überlegungen in der R-K-Verknüpfung.
Die C-Variable bezieht sich nun auf die Häufigkeit bzw. Zeitdauer von Verstärkern (Verstärkerpläne):
- Kontinuierliche Verstärkung: Alle Reaktionen werden unmittelbar verstärkt, die Verstärkung ist intensiv. So läßt das Verhalten (Reaktionen) aber auch nach, wenn die Verstärkung ausbleibt (Beispiel Zigarettenautomat)
- Intervallverstärkung: Bei diesem Kontingenzmuster erfolgt die Verstärkung nicht kontinuierlich, sondern nach bestimmten Zeitintervallen. Zwei Möglichkeiten:
- Verstärkung mit fixiertem Intervall: Der Reiz tritt nach einer a priori festgelegten Zeiteinheit ein, z.B. Gehalt. Problem ist, das die Reaktion (hier:Arbeit) erst in zeitlicher Nähe des Reizes wieder intensiviert wird.
- Verstärkung nach variablen Intervall: Die Zeitintervalle sind nicht konstant, womit die o.g. Probleme nicht auftreten. Damit ist auch der Extinktionsgehalt dieses Kontingenzmusters geringer.
- Quotenverstärkung: Hier erfolgt eine Verstärkung erst, wenn eine bestimmte Anzahl verstärkungsrelevanter Reaktionen geäußert wurde. Zwei Möglichkeiten:
- Fixierte Quote: Die Zahl der Reaktionen ist von vornherein festgelegt
- Variable Quote: Die Anzahl der Reaktionen ist für die reaktionsrelevante Person nicht kalkulierbar (Beispiel: Spielautomat). Infolgedessen ist die variable Quotenverstärkung sehr extinktionsresistent.
Alle Kontingenzmuster, die nicht kontinuierlich verstärken, werden als intermittierende Verstärkungen bezeichnet. Verstärkerpläne haben empirisch nachweisbar höhere Extinktionsresistenz.
Auf Basis der Verstärker und Verstärkerpläne können nicht nur die Eintrittswahrscheinlichkeiten bestimmter Reaktionen erhöht werden, sondern auch neue Verhaltensweisen geformt werden (Verhaltensformung). Ähnlich wie bei WATSONs Gewohnheitsbildung werden hier Teilreaktionen zu komplexen Reaktionsketten verknüpft. SKINNER kennzeichnet den Prozeß als sukzessive Approximation, durch die komplexe Reaktionsmuster wie etwa 'gehen' durch Lernen aufgebaut werden und dann als Gesamtes zum Operant werden.
Das Problem ist, wie diese komplexen Reaktionsmuster, wenn sie längere Zeit ohne Verstärkung bleiben, aufrechterhalten werden. Die Person wäre ohne ein weiteres Konzept abhängig von externen Kontingenzmustern. SKINNER führt deswegen das Prinzip oder den Prozeß der Selbstkontrolle ein: Die Person sucht Situationen , in der sie Verstärkungen für die Reaktion erhält oder sie gibt sich selbst Verstärkungen, wenn sie die fragliche Reaktion geäußert hat
Klassische und operante Konditionierung erhält besondere Bedeutung in der Entwicklung der Persönlichkeit, in Erziehung und Sozialisation. Im wesentlichen wird sie dadurch durch externe Reize vor allem der Erziehungspersonen determiniert, die mit fördernden und hindernden Reizen (bzw. akzelerierten und dezelerierten Reizen, oder nach SKINNER mit positiven und negativen Verstärkern) in der Verhaltenskontrolle arbeiten.

KRITIK: Zuerst einmal die positiven Aspekte des radikalen Behaviorismus: Da wären zum einen die starke Orientierung am naturwissenschaftlichen Ideal der Forschung, so das eine enge Korrespondenz zwischen den beobachteten Ereignissen und wissenschaftlichen Begriffen besteht. Ein anderer positiver Aspekt ist ein ideographisches Vorgehen im Gegensatz zum üblichen nomothetischen Vorgehen in der Psychologie, d.h. daß die Verhaltensgesetze zwar universelle Gültigkeit haben, sich aber immer vor dem Kontext der speziellen beobachteten Situation auszurichten haben. Somit ist auch ein milieubezogene Erklärung des Verhaltens immanent.
Es gibt aber auch drei zentrale Kritikpunkte am Behaviorismus:
Der behavioristische Ansatz im Sinne SKINNERS und WATSONs ist an sich gar keine Theorie, z.B. suchen die Behavioristen gar nicht erst nach den Ursachen, warum eine Belohnung belohnend , eine Bestrafung bestrafend ist oder es unklar bleibt, warum z.B. überhaupt eine Extinktion stattfinden kann.
Der Behaviorismus stellt praktisch nur auf externale Determinanten ab, der Mensch als solcher ist für ihn eine "Black Box" oder ein unbeschriebenes Blatt. Er berücksichtigt keinerlei genetische oder angeborene Komponenten des Verhaltens. Dazu kommt, das Ergebnisse tierexperimenteller Ergebnisse auf Menschen übertragen werden, ohne zu berücksichtigen, das es ganz menschlich spezifische Verhaltensweisen wie etwa Trauer, Freude, Verzweiflung und Aufopferung gibt.
Daraus ergibt sich auch, das der radikale Behaviorismus kognitive Prozesse im Menschen vollkommen ignoriert. Das Individuum gestaltet nicht nach seiner subjektiven Lage, sondern aufgrund objektiver Gegebenheiten, es ist letztlich vollkommen determiniert, ohne freien und subjektiven Willen. Dagegen steht aber, das menschliche Wahrnehmung eben doch sehr selektiv ist und wir durchaus auswählen, wovon wir uns verstärken lassen oder nicht.

Kurze Zusammenfassung: Skinners Lerntheorie

Da der Mensch nur wenige angeborene Verhaltensmechanismen besitzt, muß der größte Teil des Verhaltens gelernt werden und zwar durch Erfahrung Grundbegriffe sind Reiz und Verhalten Die Verhaltensweisen sind in zwei Klassen einzuteilen:
- Reflexe (zwangsläufiges Verhalten
- Operanten (Spontan-und Willkürverhalten wie z.B. sprechen, gehen etc.)
- Manche nach einem Verhalten auftretende Reize steigern die Häufigkeit des Verhaltens. Man nennt sie Verstärker (Sx)
- Andere drücken die Häufigkeit des Auftretens des Verhaltens. Man nennt sie aversive oder Strafreize (S-)
- Es gibt auch Reize, die keinen Einfluß auf das Verhalten haben. Man nennt sie neutrale Reize (So)
- Eine weitere Reizkategorie sind die diskriminativen Reize (Sj). Sie sind durch Lernprozesse situationsgebunden
und lösen Operanten bestimmter Form aus.

Lernen und Extinktion
Beim Operantenlernen ist die Häufigkeit eines Verhaltens und eines Reizes ein wichtiger Aspekt
Eine Taube in einer Box wird für das Picken auf einen Hebel jeweils mit Futter belohnt. Das Futter ist ein Reiz, der das Verhalten verstärkt. Wird dieser Verstärker wieder abgekoppelt, sinkt die Häufigkeit des Verhaltens, es kommt zur Extinktion oder Löschung des Verhaltens. Wäre Licht als "Belohnung" angeboten worden, hätte ein Lernprozeß nicht
stattgefunden. Licht ist für die Taube ein neutraler Reiz. Der Kern der Theorie ist eigentlich das Lustprinzip: Das
Verhalten, das Lustgewinn steigert, steigt in der Häufigkeit. Die zeitliche Distanz zwischen Operant und Verstärker beeinflußt wesentlich die Lerngeschwindigkeit. Je kürzer die Distanz, desto höher ist die Lerngeschwindigkeit. Und: Je höher die Verstärkermenge, desto höher ist das Plateau der Lernkurve.
Die hypothetische Variable der Reaktionsstärke ist eine Korrelation zwischen folgenden Ereignissen:
- je mehr ein Operant verstärkt wurde (gelernt wurde)
- desto mehr steigt die Operantenhäufigkeit
- desto kürzer wird die Latenz (Reaktionszeit) des
Verhaltens
- desto länger dauert die Extinktionszeit


Der getauschte Tod
Eine Novelle von Thomas Siebe
Sprache: Deutsch
E-Book - 63 Seiten - 2 € bei xinxii.com
Erscheinungsdatum: Februar 2008
England 1789 : Ein Freibeuter und ein Betrüger tauschen die Identität. Einer der Männer verbirgt einen Schatz, der andere ein dunkles Geheimnis. Während für den einen am Ende der Galgen steht, findet sich der andere bei seiner Deportation nach Australien inmitten der Schiffskatastrophe der GUARDIAN wieder, kämpft mit Kapitän James Riou ums Überleben, muß einen Schatz verteidigen und seinen Ausbruch planen.

 Der getauschte Tod von Thomas Siebe

Kurznachricht oder E-Mail

Links Homepage