www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Verstarker ist ein Begriff der behavioristischen Lerntheorien und bezeichnet einen appetitiven angenehmen Reiz der kontingent erkennbar regelhaft als Konsequenz eines bestimmten Verhaltens erfolgt und die Auftretenswahrscheinlichkeit oder Ausfuhrungsgeschwindigkeit dieses Verhaltens erhoht Verstarkung Es hat sich eine Unterscheidung nach dem Inhalt der Verstarker eingeburgert nach sozialen Verstarkern Aktivitats oder Handlungsverstarkern materiellen Verstarkern symbolischen Verstarkern verdeckten und informativen Verstarkern 1 Inhaltsverzeichnis 1 Assoziative Ansatze 1 1 S R Lernen 1 2 S O Lernen 1 3 R O Lernen 1 4 Primare und Sekundare Verstarker 2 Verhaltensregulationstheorien 2 1 Consummatory Response Theory 2 2 Premack Prinzip 2 3 Response Deprivation Hypothesis 2 4 Behavioral Bliss Point 2 4 1 Kritik 3 Literatur 4 EinzelnachweiseAssoziative Ansatze BearbeitenAssoziative Theorien gehoren zu den historisch altesten Erklarungen der instrumentellen und operanten Konditionierung Sie gehen auf Edward Lee Thorndike und dessen law of effect zuruck Diese Theoretiker erklaren die beobachteten Lerneffekte mit der Bildung von Assoziationen zwischen Reizen oder zwischen einem Reiz und Verhalten wahrend der Konditionierung Eine instrumentelle Konditionierungssituation umfasst im einfachsten Fall drei Elemente Umgebungs Reize S stimulus eine Reaktion R und eine Konsequenz auf die Reaktion O outcome hier Verstarker Innerhalb der Assoziationisten gibt es unterschiedliche Annahmen daruber zwischen welchen dieser Elemente Assoziationen geknupft werden S R Lernen Bearbeiten Thorndike vermutete eine S R Assoziation Der Organismus verknupft die Umgebungsreize einer bestimmten Situation mit seiner Reaktion Der Verstarker dient dabei lediglich der Entstehung und Verstarkung dieser Assoziation er ist selbst nicht Teil des Gelernten Daraus formulierte Thorndike sein law of effect Folgen einem Verhalten in einer bestimmten Situation befriedigende Konsequenzen fuhrt dies zu einer Starkung der Assoziation zwischen Situation und Reaktion Das fuhrt dazu dass die Auftretenswahrscheinlichkeit der Reaktion in der Situation steigt Dieser Ansatz ist heute weitgehend experimentell widerlegt In sogenannten reinforcer devaluation Experimenten Verstarker Devaluation kann man zeigen dass auch eine Assoziation zwischen Verstarker S und R gebildet wird Angenommen wir fuhren instrumentelle Verstarkung mit Ratten durch Als Verstarker dient dabei Futter die Ratten mussen einen Hebel in einen bestimmten Kafig S drucken um verstarkt zu werden Um nun die Wirkung des Verstarker zu sichern lasst man die Ratten vor dem Experiment eine Zeit lang hungern Die Ratten lernen nun den Hebel zu drucken und werden mit Futter belohnt Nach dieser Lernphase devaluieren wir den Verstarker d h wir machen ihn weniger wertvoll Das geschieht dadurch dass wir der Ratte freien Zugang zu Futter ermoglichen Die Ratte wird sich sattfressen Wenn wir sie jetzt erneut in den Kafig mit dem Hebel setzen identischer Stimulus dann beobachten wir dass die Ratte den Hebel viel seltener druckt andere Reaktion als am Ende der Lernphase S R Lernen kann diesen Effekt nicht erklaren denn hatte die Ratte nur eine Assoziation zwischen den Kafigreizen und dem Hebeldrucken gelernt hatte sie die Reaktion unvermindert stark zeigen mussen Da wir jedoch den Verstarker devaluiert hatten und damit die Reaktionsfrequenz herabsetzen konnten muss auch eine Assoziation mit dem Verstarker bestehen S O Lernen Bearbeiten Ein weiterer Ansatz betont v a die Assoziation zwischen Situationsreizen und Verstarker Dabei werden zwei Prozesse unterschieden Modern Two Process Theory Wird ein Organismus in eine Verstarkungssituation gebracht dann erlernt er durch instrumentelle Konditionierung eine Assoziation zwischen Stimulus und Reaktion wie bereits von Thorndike angenommen Zusatzlich lernt er durch Klassische Konditionierung dass der Stimulus ein zuverlassiger Pradiktor der Konsequenz ist S O Assoziation Diese Reiz Reiz Assoziation motiviert nun die instrumentelle Reaktion Es wird angenommen dass im Organismus aufgrund der S O Assoziation in der Verstarkungssituation ein zentraler emotionaler Zustand ausgelost wird Kundigen die Umgebungsreize S eine appetitive Konsequenz O z B Futter an lost dieser Stimulus eine Art Hoffnung auf Futter im Organismus aus Diese Hoffnung motiviert dann das Zeigen der instrumentellen Reaktion Empirische Belege geben insbesondere sogenannte transfer of control Experimente Wenn die diffusen Umgebungsreize im Organismus einen emotionalen Zustand auslosen und dieser die Reaktion motiviert dann sollte die klassische Konditionierung eines expliziten Reizes diese Motivation noch verstarken und somit zu einer starkeren Reaktion fuhren Dafur wird vor der instrumentellen Lernphase eine klassische Konditionierung vorgenommen in welcher ein expliziter Reiz z B ein Ton mit Futter gepaart wird Bietet man dann diesen Ton wahrend der instrumentellen Lernphase dar wird die Reaktionsfrequenz tatsachlich verstarkt Allerdings stellte man auch fest dass das Konzept eines generellen zentralen emotionalen Zustands nicht bestatigt werden kann Verstarkt man eine Ratte mit Futterpellets und paart in einer nachfolgenden klassischen Konditionierung einen Reiz mit Zuckerwasser dann erhoht die Darbietung des Zuckerwasser Reizes wahrend der instrumentellen Verstarkung mit Pellets die Reaktionsfrequenz nicht Da beide Reize konsumatorische Reize sind hatten sie beide in der Ratte Hoffnung auslosen sollen Das Ergebnis weist jedoch auf eine verstarkerspezifische Assoziation hin R O Lernen Bearbeiten Ein modernerer Ansatz bezieht alle drei Elemente S R O in die Assoziationsbildung ein Da eine S O Assoziation unter der Bedingung dass R gezeigt wird gelernt werden kann wird angenommen dass die Umgebungsreize S als diskriminativer Stimulus wirken und im Organismus die R O Assoziation aktivieren Jedoch muss eine hierarchische S R O Assoziation separat nachgewiesen werden da durch transfer of control Designs keine direkte Notwendigkeit der R belegt werden kann um die zentrale emotionale Komponente zu aktivieren die letztendlich in einer erhohten Antwortrate resultiert Der Beleg der R O Assoziation stutzt sich auf folgendes Experiment Zuerst fuhrt man mit einer Ratte eine instrumentelle Konditionierung in einem Lernkafig durch Die Ratte muss einen horizontalen Hebel bewegen Druckt sie ihn nach links wird sie mit Futterpellets verstarkt druckt sie ihn nach rechts erhalt sie Zuckerwasser Nach ausreichendem Lernen druckt die Ratte den Hebel etwa gleich oft in beide Richtungen Nach dieser Phase fuhrt man eine Devaluation eines der beiden Verstarker durch Das geschieht dadurch dass man der Ratte freien Zugang zu Futterpellets lasst jedoch nicht zum Zuckerwasser Die Ratte frisst sich mit Pellets voll was dazu fuhrt dass Futterpellets als Verstarker an Wirkung verlieren s o Nun bringt man die Ratte erneut in die instrumentelle Situation Man beobachtet nun dass die Ratte den Hebel kaum noch nach links druckt wo sie Pellets bekame sondern fast ausschliesslich nach rechts um den alternativen nicht devaluierten Verstarker Zuckerwasser zu erhalten Dieses Ergebnis kann nicht durch S R Assoziationen erklart werden Wie bereits oben gezeigt hatte dann die Verstarkerdevaluation keinen Einfluss auf die Assoziation zwischen Umgebungsreizen und Reaktion haben durfen und beide Reaktionen somit unverandert auftreten mussen Auch S O Lernen bzw die Two Process Theory kann das Resultat nicht erklaren Diese Theorie schliesst aus dass in derselben Reizsituation verschiedene Assoziationen zwischen bestimmten Reaktionen und bestimmten Konsequenzen gelernt werden konnen Wenn eine S O Assoziation bestimmend ware dann hatte die Devaluation eines der beiden Verstarker zu einer Verminderung beider Reaktionen in der Situation fuhren mussen Stattdessen wurde aber nur eine bestimmte Reaktion die mit einem bestimmten Verstarker verknupft war beeintrachtigt Es muss also spezifische Reaktions Verstarker Assoziationen geben Primare und Sekundare Verstarker Bearbeiten Es kann zwischen primaren und sekundaren Verstarkern unterschieden werden Wahrend primare Verstarker physiologische Bedurfnisse befriedigen z B Hunger stillen sind sekundare Verstarker lediglich die Ankundigung bzw das Versprechen eines primaren Verstarkers s Token System Ein typischer sekundarer Verstarker ist Geld das ursprunglich selbst keine Bedurfnisse befriedigt Sekundare Verstarker sind durch klassische Konditionierung aus primaren Verstarkern entstanden 2 und erlangen ihre Bedeutung durch Kontingenz mit diesen Verstarkern z B Geld fur Nahrung Ein Beispiel ist das sogenannte Magazintraining Ein Versuchstier das mit Futterpellets belohnt wird lernt bereits das Gerausch des in den Futterbehalter fallenden Pellets als Belohnung zu empfinden Verhaltensregulationstheorien BearbeitenGemeinsam ist allen assoziativen Theorien dass sie Verstarker als bestimmte Reize ansehen Ob ein Stimulus als Verstarker dienen kann hangt also von den einzigartigen Eigenschaften des Reizes ab Ein Reiz ist also entweder ein Verstarker oder nicht Eine neuere Sichtweise lost sich vom Fokus auf klassische Reizassoziationen Dieser Ansatz betont vielmehr die Restriktionen auf das Verhalten die durch einen Verstarkerplan bedingt werden Consummatory Response Theory Bearbeiten Die erste Theorie welche sich von der Annahme Verstarker seien besondere Reize entfernte war die Consummatory Response Theory Diese unterstellt dass Verstarker nicht eine besondere Art von Reizen darstellen sondern dass diese eine besondere Reaktion auslosen Man beobachtete dass Verstarker oft konsumatorische Reaktionen z B Aufnehmen der Nahrung Trinken hervorrufen Im Verhaltenssystemansatz spricht man von bestimmten Verhaltenssystemen die durch Reize aktiviert werden z B das Nahrungssystem Verstarker stellen in der Regel Reize dar die am Ende einer solchen Verhaltenskette dargeboten werden und das Verhaltenssystem durch eine ausgeloste konsumatorische Reaktion beenden Damit betont man nicht die Reizeigenschaften an sich sondern die ausgeloste Reaktion die einen Reiz zum Verstarker machen Man beobachtete beispielsweise dass Saccharin als Verstarker in Tierexperimenten dienen kann Saccharin ist ein Sussstoff der jedoch keinerlei biologischen Nahrwert besitzt Trotzdem kann Saccharin als Verstarker dienen da es eine konsumatorische Reaktion auslost Waren es die besonderen Eigenschaften des Reizes die einen Verstarker ausmachen dann durfte Saccharin nicht verstarkend wirken da es keinerlei biologischen Wert besitzt Premack Prinzip Bearbeiten Im Bemuhen eine nicht zirkulare Definition von Verstarker zu finden hatte F D Sheffield 1948 3 darauf aufmerksam gemacht dass die verhaltensmodifizierende Verstarkung oder Bestrafung nicht nur eine Wahrnehmung sondern immer auch ein Verhalten auslost So kann man argumentieren dass nicht Wasser sondern das Trinken des Wassers nicht Spielzeug sondern das Spielen die eigentlichen Verstarker sind In der herkommlichen Terminologie war Verstarker immer als appetitiver oder aversiver Stimulus Wahrnehmung definiert worden David Premack postulierte nun dass ein Verhalten A ein Verstarker fur ein anderes Verhalten B sein kann namlich genau dann wenn A spontan haufiger gezeigt wird als B im Original Given two responses of the different likelihood h and l the opportunity to perform the higher probability response H after the lower probability response L will result in reinforcement of response L Um einen Verstarker zu identifizieren ist es notwendig die Verhaltenshaufigkeit frei von jeglicher Restriktion uber eine gewisse Zeit zu erfassen base line Verhaltensverteilung So erhalt man eine Skala die angibt wie wahrscheinlich das spontane Auftreten der erfassten Verhaltensweisen ist Das weniger wahrscheinliche Verhalten kann man dann mit dem hoherwahrscheinlichen verstarken d h dessen Auftretenswahrscheinlichkeit steigern Premack setzte Kapuzineraffen in einen Experimentier Kafig mit drei moglichen Verhaltensweisen und stellte fest dass sie spontan am haufigsten den Hebel bewegten am zweithaufigsten die Tur offneten und am seltensten den Kolben bewegten baseline Erfassung Skala der Verhaltenswahrscheinlichkeiten In der Testphase konnte eines dieser Verhalten erst ausgefuhrt werden nachdem eines der anderen gezeigt wurde Wie vom Premack Prinzip vorhergesagt ergab sich folgendes Muster Die Affen bewegten haufiger den Kolben wenn sie deshalb anschliessend die Tur offnen oder den Hebel bewegen konnten Sie offneten haufiger die Tur wenn sie deshalb anschliessend den Hebel bewegen konnten Angenommen wir beobachten eine Ratte die freien Zugang zu Wasser hat und nach Lust und Laune in einem Laufrad rennen kann Wir messen dass die Ratte wahrend einer Stunde 50 min im Laufrad rennt und 10 min trinkt Trinken weist also eine geringere Auftretenswahrscheinlichkeit als Laufradrennen auf Wenn diese Ratte nun erst ins Laufrad darf nachdem sie getrunken hat erhoht dies die Zeit die sie mit Trinken verbringt Der umgekehrte Weg funktioniert nicht Wenn sie erst trinken darf nachdem sie im Laufrad war trinkt sie deshalb nicht mehr als vorher Bei einer durstigen Ratte hingegen die lieber trinkt als lauft ist es genau umgekehrt Wir konnen die Wahrscheinlichkeit des Laufradrennens erhohen indem wir es zur Bedingung fur Trinken machen Premack fuhrte ein Experiment mit Kindergartenkindern durch Zuerst wurden die Kinder ohne Einschrankungen beobachtet Einige Kinder spielten in dieser Zeit lieber mit einem Spielautomaten andere assen lieber Bonbons Man teilte sie in zwei Gruppen nach ihren Vorlieben ein Nachfolgend konnte man in der Spielautomatengruppe das Bonbonessen mit dem Spielen verstarken und in der Bonbongruppe das Spielen mit dem Bonbonessen verstarken Man konnte jedoch in keiner der Gruppen mit dem niederwahrscheinlichen Verhalten das hoherwahrscheinliche verstarken Response Deprivation Hypothesis Bearbeiten Die Response Deprivation Verhaltenseinschrankung Hypothese Timberlake amp Allison 1974 stellt eine Verallgemeinerung des Premack Prinzips dar Bei Premack konnte nur das in der base line Bedingung weniger wahrscheinliche Verhalten durch das hoherwahrscheinliche verstarkt werden Man kann jedoch jedes Verhalten zu einem Verstarker machen indem man seine Auftretenshaufigkeit unter die base line Rate senkt Damit lasst sich dann jedes beliebige andere Verhalten verstarken Beispiel In der freien base line Bedingung verbringt eine Ratte in einer Stunde 10 min mit Laufradrennen Im nachsten Schritt macht man das zu verstarkende Verhalten zur Bedingung fur diese Laufmenge das heisst nur wenn die Ratte das gewunschte Verhalten zeigt darf sie zur Belohnung ins Laufrad Die Hypothese lasst umgekehrt auch Schlussfolgerungen daruber zu welche Verhaltensweisen durch Restriktionen unter ihre base line Rate gedruckt werden namlich jene die als Verstarker wirken Beispiel Die Beobachtung dass Trinken in einem Tierexperiment als Verstarker funktioniert lasst den Schluss zu dass die normale Trinkrate der Tiere zuvor verringert worden war Behavioral Bliss Point Bearbeiten Dieser Ansatz geht ebenfalls von der base line Verhaltensverteilung aus und definiert einen Verstarker nach dem auferlegten Verstarkungsplan Beobachtet man einen Organismus in einer Situation ohne Restriktion base line dann wird angenommen dass dieser sein Verhalten zwischen zwei Verhaltensalternativen in einer praferierten Weise verteilt Diese innewohnende Verteilungspraferenz wird als bliss point bezeichnet Nehmen wir als Beispiel einen Studenten der die Wahl zwischen Fernsehen und Lernen hat Beobachten wir ihn bei der freien Wahl so stellen wir z B fest dass er pro 15 min Lernen 60 min Fernsehen schaut Diese praferierte Verhaltensverteilung kennzeichnet den bliss point Diesen kann man am besten darstellen wenn man beide Verhaltensalternativen in ein zweidimensionales Koordinatensystem einzeichnet Die x Achse bezeichnet die verbrachte Zeit fur Verhalten x Fernsehen die y Achse die verbrachte Zeit fur Verhalten y Lernen In unserem Fall zeichneten wir einen Punkt bei 15 min und 60 min ein dort befindet sich der bliss point Welches der beiden Verhalten nun verstarkt wird und welches als Verstarker dient hangt einzig vom Verstarkerplan der nun auf diese Verhaltensverteilung auferlegt wird ab Es wird angenommen dass ein Organismus unter den Restriktionen eines Verstarkerplans stets motiviert ist seinem ursprunglichen bliss point moglichst nahe zu kommen Das Verhalten wird also so auf beide Alternativen verteilt dass die verbrachte Zeit mit beiden moglichst nahe an den bliss point liegt Wenn wir im obigen Beispiel Lernen verstarken wollen und Fernsehen als Verstarker einsetzen wollen mussen wir die Restriktionen so konstruieren dass der Organismus bei 15 min Lernen nicht auf seine angestrebten 60 min Fernsehen kommen kann Beispielsweise konnten wir festlegen dass die verbrachte Zeit fur beide Alternativen gleich sein muss dass also 1 min Fernsehen 1 min Lernen voraussetzt bzw 10 min Fernsehen 10 min Lernen usw Diese Restriktion lasst sich im Koordinatensystem als ein Gerade y x die um 45 ansteigt darstellen Der bliss point befindet sich also rechts unterhalb der Geraden Der Student wird nun sein Verhalten so verteilen dass er diesem Punkt moglichst nahe kommt Nach dem minimum deviation model von Staddon entspricht diese resultierende Verteilung einem Punkt der eine orthogonale Senkrechte auf der Geraden mit dem bliss point verbindet Wollen wir nun Fernsehen mit Lernen verstarken mussen wir die Restriktionen so gestalten dass der Organismus pro 60 min Fernsehen nicht auf seine angestrebten 15 min Lernen kommt Wenn wir uns das Koordinatensystem mit dem bliss point vorstellen dann muss die Gerade die die auferlegten Einschrankungen darstellt so verlaufen dass der bliss point rechts unterhalb dieser liegt Z B konnen wir festlegen dass pro 1 min Lernen 10 min Fernsehen erfolgen mussen bzw pro 6 min Lernen 60 min Fernsehen usw Dieser Verstarkerplan stellt eine Gerade dar y 0 1x zu welcher der bliss point links oberhalb liegt So konnen wir Fernsehen mit Lernen verstarken und dessen Verhaltensrate erhohen Generell lasst sich also vereinfachend sagen dass eine graphische Verstarkerplanfunktion dann Verhalten x mit Verhalten y verstarkt wenn der bliss point links oberhalb des Graphen liegt Verhalten y wird durch Verhalten x verstarkt wenn der bliss point rechts unterhalb der Funktion liegt Verlauft die Gerade genau durch den bliss point dann wird kein Verstarkungseffekt auftreten da die Verhaltensverteilung dann dem bliss point also der base line Verteilung entsprechen wird Kritik Bearbeiten Dieses Modell geht molar vor Das bedeutet der Organismus verteilt sein Verhalten uber einen langen Zeitraum optimal Es interessiert nicht wie diese Verteilung zu einem gegebenen Moment zustande kommt sondern man beobachtet das Verhalten uber eine lange Zeit und schliesst daraus auf das Optimum Aber geht ein Organismus wirklich immer dermassen vor Versucht er tatsachlich auf lange Sicht das Optimum zu erreichen oder entscheidet er vielmehr spontan individuell zu einem Zeitpunkt Des Weiteren bestehen Zweifel ob der Wert einer Verhaltensalternative unter Verstarkerrestriktionen der gleiche ist wie unter base line Bedingungen Vielleicht hat im obigen Beispiel Fernsehen einen geringeren Anreiz wenn dafur vorher lange Zeit gelernt werden muss Zudem ist die Ermittlung der Verhaltensverteilung im Feld also in der Realitat sehr kompliziert Es gibt eine Vielzahl von alternativen Verhalten die alle berucksichtigt werden mussen Z B konnte der Student im obigen Beispiel dem Verstarkerplan einfach entgehen indem er ins Kino geht oder Radio hort statt Fernsehen zu schauen und dafur zu lernen Literatur BearbeitenBickel W K Madden G J 1999 A comparison of measures of relative reinforcing efficacy and behavioral economics cigarettes and money in smokers In Behavioural Pharmacology 10 6 7 627 637 DeGrandpre R J Bickel W K Hughes J R Layng M P Badger G 1993 Unit price as a useful metric in analyzing effects of reinforcer magnitude Journal of Experimental Analysis of Behavior 60 3 641 661 Domjan M 2005 The principles of learning and behavior 5th Ed Wadsworth Publishing Domjan M 2004 The essentials of learning and conditioning 3rd Ed Wadsworth Publishing Madden G J Bickel W K Jacobs E A 2000 Three predictions of the economic concept of unit price in a choice context Journal of Experimental Analysis of Behavior 73 1 45 64 Rescorla R A Solomon R L 1967 Two process learning theory Relationships between Pavlovian conditioning and instrumental learning Psychological Review 74 3 151 182 Timberlake W 1993 Behavior systems and reinforcement an integrative approach Journal of Experimental Analysis of Behavior 60 1 105 28 Urcuioli P J DeMarse T Lionello DeNolf K M 2001 Assessing the contributions of S O and R O associations to differential outcome matching through outcome reversals J of Exp Psychology Animal Behavior Processes 27 3 239 251 Einzelnachweise Bearbeiten Franz J Schermer Lernen und Gedachtnis Kohlhammer Verlag 2013 ISBN 978 3 17 025414 5 google de abgerufen am 20 Mai 2017 Werner Herkner Psychologie Springer Verlag 2013 ISBN 978 3 7091 7644 3 S 162 eingeschrankte Vorschau in der Google Buchsuche Avoidance training and the contiguity principle Sheffield Fred D Journal of Comparative and Physiological Psychology Vol 41 3 Jun 1948 Abgerufen am 29 Oktober 2011 Abgerufen von https de wikipedia org w index php title Verstarker Psychologie amp oldid 232695466