Operante conditionering: gedragsverandering door gevolgen
Operante conditionering omvat een proces waarin het gedrag van een mens verandert als gevolg van de consequenties die dat gedrag heeft. Gedrag is een respons op een stimulus (prikkel) en heeft altijd consequenties die de waarschijnlijkheid beïnvloeden dat het gedrag herhaalt of juist nagelaten zal worden. Het bestraffen van ongewenst - en het belonen van gewenst gedrag zijn de bekendste condities om gedrag te veranderen. Operante conditionering wordt ook wel instrumentale conditionering genoemd.
Geschiedenis van operante conditionering
Thorndike
Edward L. Thorndike (1874-1949) wordt beschouwd als de ontdekker van operante conditionering.Hij onderzocht als eerste deze vorm van conditionering door te observeren hoe hongerige katten de uitgang zochten in puzzelkooien ('puzzelboxen').
Skinner
Burrhus F. Skinner (1904-1990) bouwde voort op Thorndike's werk en ontwikkelde operante conditionering als een wetenschappelijk model voor het bestuderen van willekeurig gedrag. Hiermee bood hij een alternatief voor de klassieke conditionering, die focuste op reflexmatige reacties.
Relational Frame Theory (RFT),
Recente wetenschappelijke studies benadrukken het belang van operante conditionering bij het begrijpen van complex gedrag, zoals taal en cognitie. De Relational Frame Theory (RFT), gebaseerd op operante conditionering, speelt hierin een significante rol. Dit is een psychologische theorie die uitlegt hoe het vermogen van mensen om verbindingen te leggen tussen verschillende concepten leidt tot cognitieve processen, taalontwikkeling en gedrag.
Respondent en operant gedrag
Twee soorten gedrag
Er zijn twee soorten gedrag:
- respondent gedrag; en
- operant gedrag.
Respondent gedrag
Respondent gedrag is gedrag dat voortkomt of een automatische reactie is op een stimulus. Je hebt daar geen enkele controle over. In het artikel over
klassieke conditionering hebben we besproken dat er bij conditionering een relatie is tussen een stimulus (prikkel) en een respons (reactie). Een stimulus is een gebeurtenis of situatie die een respons uitlokt. Als iemand met een fel licht in je ogen schijnt, dan ga je knipperen met je ogen. Dit is een reflex, oftewel een onwillekeurige, onvrijwillige, automatische respons op een stimulus. Je hebt er geen enkel controle over: dit wordt respondent gedrag genoemd.
Operant gedrag
Operant gedrag daarentegen is gedrag waarbij je een gecontroleerde, vrijwillige handeling uitvoert. Je opereert (operant!) in je omgeving, je gedrag werkt in op de omgeving teneinde bepaalde consequenties teweeg te brengen. De psycholoog B.F. Skinner (1904-1990; zie foto) bracht het verschil tussen respondent en operant gedrag als volgt onder woorden:
Het verschil tussen operant en reflexmatig gedrag ligt hierin dat het één willekeurig en het ander onwillekeurig blijkt. Operant gedrag ligt binnen de invloedssfeer van de persoon zelf en wordt al van oudsher toegeschreven aan een wilshandeling. Reflexmatig gedrag ligt buiten die invloedssfeer.¹
Leren door de gevolgen: operante of instrumentele conditionering
Wet van het effect (Thorndike)
Operante of instrumentele conditionering is een vorm van conditionering waarbij het subject gericht gedrag vertoont teneinde een bepaald doel te bereiken. Edward L. Thorndike (1874-1949) onderzocht als eerste deze vorm van conditionering door te observeren hoe hongerige katten de uitgang zochten in puzzelkooien die hij ontwierp. De kooi kon uit de kooi ontsnappen door op een pedaal te drukken bij de uitgang en dan ging de deur open waarna de kat bij het eten terecht kon. Aanvankelijk verrichte de kat allerlei nutteloze handelingen totdat het per toeval op de pedaal duwde waarna de deur opensprong. Deze procedure werd door Thorndike herhaald en de kat slaagde erin steeds sneller de puzzel op te lossen. Nu de kat de oplossing gevonden had, liet hij ook steeds vaker de nutteloze handelingen achterwege. Op basis van zijn experiment formuleerde Thorndike zijn wet van het effect:
Responsen die voldoening gevende gevolgen teweegbrengen zullen herhaald worden en steeds sneller en efficiënter uitgevoerd worden, responsen die onbevredigende responsen teweegbrengen zullen niet herhaald worden.²
Skinnerbox
Ook Skinner voerde experimenten uit. Skinner had een kooi ontworpen - de Skinnerbox genoemd - die uit een hendel, een voedselbak en een metalen rooster bestaat. Het proefdier, een rat, krijgt een etensbrokje toegediend als hij de hendel overhaalt. De rat zal op den duur per toeval de hendel overhalen en hij zal aanvankelijk geen verband leggen tussen deze activiteit en het eten dat hij krijgt opgediend. Bij de tweede, derde of vierde keer associeert de rat het neerhalen van de handel wel met het het verkrijgen van eten. Gedrag dat gevolgd wordt door een effect in de omgeving wordt operante respons genoemd. Bekrachtiging is daarbij een onmisbaar element. Het eten is bij de rat van Skinner de positieve bekrachtiger. Zonder bekrachtiging zal het gedrag allengs uitdoven: extinctie genaamd.
Bekrachtiging en straf
Volgens Skinner verandert gedrag door de omgeving te veranderen die op het specifieke gedrag volgt. Er wordt hierbij onderscheid gemaakt tussen bekrachtiging en straf. Verandering van de omgeving die de kans vergroot dat het gedrag zich zal herhalen is bekrachtiging. Verandering van de omgeving die de kans verkleint dat het gedrag zich zal herhalen is straf.
Bekrachtiging en straf
Er bestaan twee soorten bekrachtiging:
- positieve bekrachtigers; en
- negatieve kekrachtigers.
Positieve bekrachtiger
Een positieve bekrachtiger ]verhoogt de kans op de respons die aan de bekrachtiger voorafgaat doordat deze verkregen kan worden door de respons te vertonen. Positief wil zeggen dat er iets wordt toegevoegd aan de omgeving. De hongerige rat wordt beloond met eten (positieve bekrachtiger) als hij de hendel overhaalt (respons). Dit heet operante beloningsconditionering. Bij mensen kunnen we denken aan geld als beloning, maar ook aan complimenten of meer vrijheden zoals gedetineerden krijgen bij goed gedrag.
Negatieve bekrachtiger
Bij een negatieve bekrachtiger moet gedacht worden aan een poging om pijn of straf te vermijden, waarbij negatief wil zeggen dat er iets wordt weggehaald uit de omgeving. Dit wordt aversieve operante conditionering genoemd. De rat van Skinner kon bij een bepaald experiment een elektrische schok die hij kreeg toegediend via het metalen rooster beëindigen door de hendel neer te halen. In het dagelijkse leven kunnen we denken aan het voorbeeld van de puber die zijn kamer opruimt om gezeur van zijn moeder te voorkomen.
Twee soorten straf
Er worden twee soorten straf onderscheiden:
- positieve straf; en
- negatieve straf.
Het gaat bij straf om een verandering in de omgeving teneinde bepaald gedrag laten afnemen. Positieve straf is het toedienen van een onaangename stimulus, zoals een draai om je oren, een afkeurende blik of harde woorden. Een negatieve straf is het wegnemen van een aangename stimulus, zoals het inhouden van zakgeld of het ontnemen van de vrijheid na het plegen van een misdrijf, het kind onttrekken aan het groepsgebeuren doordat het thuis moet blijven of in de hoek moet staan. Straf heeft de bedoeling om gedrag te doen verdwijnen.
Regels voor straffen
Er zijn een aantal do's en dont's met betrekking tot straffen:
- Het nadeel van straf is dat het wangedrag tijdelijk wordt onderdrukt, de persoon past zich tijdelijk aan maar het gedrag komt onherroepelijk terug.
- De straf boet aan kracht in naarmate de straf vaker gegeven wordt. Er moet telkens zwaarder gestraft worden om hetzelfde effect te bewerkstelligen.
- Straf is niet effectief als er te veel tijd tussen de wandaad en de straf zit, zoals in ons rechtssysteem dikwijls het geval is, behalve bij snelrecht en een daaropvolgende snelle executie van de straf hetgeen uitzonderingen zijn.
- De straf moet consistent worden toegepast; niet de ene keer straffen en de andere keer de wandaad door de vingers zien.
- Verder moet voorkomen worden dat een kind de straf associeert met positieve bekrachtiging. Dit gebeurt als de straf de enige manier is waarop kinderen aandacht krijgen van hun ouders of als ouders direct na de bestraffing iets liefs zeggen tegen het kind uit een soort schuldgevoel. De kans neemt hierdoor toe dat het kind het ongewenste gedrag blijft vertonen om de positieve bekrachtiging te bereiken.
- Negatieve straf is effectiever dan positieve straf.
- Straf moet altijd hand in hand gaan met bekrachtiging van gewenste gedragingen, zodat het kind weet welk gedrag hij wél moet vertonen.
- Tot slot moet een straf niet leiden tot ontsnappings- en vermijdingsgedrag en dat is eenvoudiger gezegd dan gedaan.
Kortom, probeer zo veel mogelijk straf te vermijden. Belangrijkste reden is wel dat gedrag dat bestraft wordt terugkeert en je steeds harder moet straffen om het wangedrag te bestrijden. Het bekrachtigen van gewenst gedrag is veel effectiever en bovendien heilzamer.
Regels voor bekrachtiging
Er zijn een aantal regels voor bekrachtiging:
- Een bekrachtiger moet adequaat zijn, dat wil zeggen toegespitst op de persoon en de situatie.
- De bekrachtiging moet direct na het gewenste gedrag gegeven worden, zodat het verband tussen het gedrag en de bekrachtiger duidelijk is.
- Een onvoorspelbaar bekrachtigingsschema levert meer succes op dan een vaste interval-bekrachtiging. De persoon weet niet wanneer hij bekrachtigd wordt en dat heeft meer effect. Dit geld ook andersom: als een ouder iets verbiedt en het kind dramt door en krijgt uiteindelijk zijn zin, dan is dat een zeer krachtige bekrachtiger; het kind heeft geleerd dat hij zijn zin krijgt als hij zijn protest maar lang genoeg aanhoudt.
- Bekrachtig positief gedrag zodat het niet uitdooft. Positief gedrag bekrachtigen is te verkiezen boven het straffen van ongewenst gedrag.
Discriminatie en generalisatie
Net als bij klassieke conditionering, doen generalisatie en discriminatie zich voor bij operante conditionering. Generalisatie is het toepassen van gedrag dat geleerd is in een bepaalde context in een vergelijkbare context of situatie. De betekenis van dit leerprincipe voor het dagelijks leven is zeer groot, aangezien we slechts zeer sporadisch in eenzelfde situatie terechtkomen. Er zijn altijd wel verschillen tussen de ene situatie en de andere. We moeten er niet aan denken dat we in iedere nieuwe situatie het wiel zouden moeten uitvinden. Nee, we bedenken wat gepast gedrag is door gedrag te generaliseren naar vergelijkbare situaties. Discriminatie daarentegen betekent dat we leren verschillend te reageren op situaties die verschillend zijn, ook al hebben ze zeer veel overeenkomsten.
Tot slot
Conditionering speelt een rol in de wijze waarop mensen leren. Als de consequentie op bepaald gedrag in een bepaalde situatie aangenaam is werkt die als een versterker van het gedrag en vice versa. Doch de principes van conditionering van gedrag is slechts een deel van het verhaal. Er zijn complexere vormen van leren. Bij hogere vormen van leren gaat om het om conceptvorming, inzichtelijk leren, sociaal leren, denken, geheugen, herinnering, oplossen van problemen en intelligentie.
Noten:
- Richard L. Morgan: Hedendaagse psychologie; Lemma, Utrecht, 8e druk 1990, p, 172.
- Marc Brysbaert: Psychologie; Academia, 2006, p.231.
Lees verder