Lo studio sul condizionamento
operante inizia con Thorndike alla fine del XX secolo. Lo studioso osserva
come attraverso prove d’errore gli animali possono giungere a mettere in atto
comportamenti che provocano conseguenze positive. Questo processo viene
chiamato “legge dell’effetto”.
Skinner successivamente riprende in maniera più sistematica
gli studi di Thorndike e arriva a definire il condizionamento operante come
l’aumento della probabilità di emissione di un comportamento se questo è
seguito da un rinforzo.
I rinforzi sono divisibili in due macro categorie: rinforzi
positivi e rinforzi negativi.
Il rinforzo positivo
descrive un comportamento che messo in atto produce uno stimolo appetivo. Ad
esempio se fare un regalo al vostro partner lo rende particolarmente affettuoso
allora sarete incentivati a elargire regali.
Il rinforzo negativo
descrive un comportamento che previene o allontana uno stimo lo avversivo. Ad
esempio se telefonare al vostro partner allontana sentimenti di gelosia nei
suoi confronti sarete incentivati a telefonare ogni volta che proverete quei
sentimenti.
I rinforzi sono più efficaci tanto più sono prossimi al
comportamento. Per questo motivo è difficile, ad esempio, aumentare il
comportamento di studio di un bambino se un voto positivo (rinforzo) viene dato
a distanza di settimane.
Il paradigma del condizionamento operante prevede, simmetricamente ai rinforzi, il concetto di punizione. La punizione è l’opposto del rinforzo ovvero, è il processo attraverso il quale la somministrazione di uno stimolo avversivo o l’eliminazione di uno stimolo appetivo riduce l’emissione del comportamento. Nel primo caso si parla di punizione vera e propria mentre nel secondo di addestramento all’omissione.
La punizione è la
presentazione di uno stimolo avversivo a seguito di un comportamento. Ad
esempio se quando regalate dei dolci al vostro partner lui si lamenta del fatto
che lo volete far ingrassare smetterete di regalargli dolci.
L’addestramento
all’omissione è un comportamento che previene o allantana uno stimolo
appetivo. Ad esempio se il vostro partner diviene meno affettuoso quando uscite
con gli amici allora le volte in cui uscirete con gli amici si ridurranno.
In generale il rinforzo produce un esito “favorevole” o mediante
l’aggiunta di qualcosa che desideriamo (rinforzo positivo) o attraverso
l’eliminazione di qualcosa che non desideriamo (rinforzo negativo). La
punizione produce qualcosa di “sfavorevole” o mediante l’aggiunta di qualcosa
che non vogliamo (punizione) o attraverso l’eliminazione di qualcosa che desideriamo
(addestramento all’omissione).
Modellamento:
quando la risposta che volete rinforzare è insolita diventa difficile aspettare
che il soggetto la metta in atto spontaneamente. In questo caso si ricorre al
modellamento, processo che consiste nel rinforzare tutti i comportamenti che
vanno nella direzione desiderata. Questo incentiva la messa in atto di
comportamenti sempre più prossimi a quello desiderato. Si procede con il
rinforzare gradualmente comportamenti via via più simili a quello finale
aumentando di pari passo la precisione del rinforzo. Ad esempio se vogliamo
insegnare a un piccione a beccare un cerchio per ottenere del cibo, nelle prime
fasi dovremo rinforzare l’animale anche quando becca altra figura presenti
nella sua gabbietta. Gradualmente le figure più lontane dal cerchio non
verranno più rinforzate a favore di quelle più prossime. In questo modo alla
fine potremo rinforzare selettivamente il piccione solo quando becca il cerchio.
Questa tecnica viene utilizzata infatti per insegnare agli animali a mettere in
atto comportamenti complessi.
Rinforzi condizionati:
possiamo suddividere i rinforzi in primari e secondari. I rinforzi primari sono
quelli associati alla soddisfazione di un bisogno fondamentale come ad esempio
il cibo mentre i rinforzi secondari sono quelli associati ai rinforzi primari
ma intrinsecamente neutri. Negli esperimenti sugli animali si è visto come sia
possibile associare alla distribuzione del cibo un suono. In questo modo
l’animale attraverso un condizionamento di tipo classico impara ad associare
due stimoli e il suono finisce con l’ottenere il ruolo di rinforzo anche in
assenza di cibo. Negli umani gli esempi più eclatanti di rinforzi condizionati
(secondari) sono i soldi e le lodi.
Programmi di rinforzo.
Rinforzo parziale: una
volta che il comportamento è stato acquisito può essere rinforzato di tanto in
tanto. Se una risposta viene mantenuta con il rinforzo parziale ci vuole molto
più tempo prima che cada in estinzione. La cadenza con cui un comportamento
viene rinforzato può variare nelle quattro modalità descritte:
Programma a rapporto fisso: si ottiene un rinforzo dopo un numero
fisso di risposte. L’esempio potrebbe essere quello di un impiegato pagato dopo
ogni 10 pratiche svolte. Un effetto saliente di questo tipo di rinforzo è la
pausa della risposta che si verifica immediatamente dopo il rinforzo.
L’impiegato dopo 10 pratiche svolte non comincerà subito la sesta bensì avrà un
periodo di latenza.
Programma a rapporto variabile: si riceve un rinforzo dopo un
numero imprevedibile di risposte. In questo tipo di rinforzo non c’è pausa ed è
ben esemplificato dalle slot machine
che pagano dopo un numero variabile di giocate.
Programma a intervallo fisso: un comportamento viene rinforzato
dopo che è passato un certo tempo dall’ultima risposta rinforzata. Le risposte
date all’interno di quell’intervallo non contano. Un effetto di questo tipo di
rinforzo è l’aumento del numero di risposte all’approssimarsi del rinforzo. Se
un sito internet che seguiamo aggiorna i suoi contenuti quotidianamente, appena
i contenuti sono stati aggiornati non si va nuovamente alla ricerca di nuovi aggiornamenti
ma quando si avvicina lo scadere del giorno si comincia di nuovo a controllare.
Programma a intervallo variabile: il rinforzo accorre dopo un certo
intervallo di tempo che però varia in modo imprevedibile. In questo caso il
soggetto attua il comportamento con frequenza elevata e uniforme senza
inflessioni. È il caso il cui troviamo un telefono occupato e riproviamo
insistentemente fino a quando il telefono non suona libero.
Bibliografia
Atkinson, R.C., & Hilgard, E.R., (2006). Introduzione alla Psicologia. Piccin:
Padova
Meccacci, L., (2001). Manuale di Psicologia
Generale. Giunti: Firenze
Nessun commento:
Posta un commento