Warunkowanie instrumentalne to inny termin na warunkowanie instrumentalne, proces uczenia się po raz pierwszy opisany przez B.F. Skinnera. W warunkowaniu instrumentalnym wzmocnienie lub kara są używane w celu zwiększenia lub zmniejszenia prawdopodobieństwa ponownego wystąpienia zachowania w przyszłości.
Przykłady warunkowania operacyjnego
Na przykład, jeśli uczeń jest nagradzany pochwałami za każdym razem, gdy podnosi rękę w klasie, jest bardziej prawdopodobne, że ponownie podniesie rękę w przyszłości.
Jeśli ona również zostanie zbesztana, gdy mówi poza kolejnością, jest mniej prawdopodobne, że będzie przerywać lekcję. W tych przykładach nauczyciel używa wzmocnienia w celu wzmocnienia zachowania związanego z podnoszeniem rąk i kary w celu osłabienia zachowania mówienia poza kolejnością.
Warunkowanie instrumentalne jest często stosowane również w treningu zwierząt. Na przykład wyszkolenie psa, by uścisk dłoni wiązał się z oferowaniem nagrody za każdym razem, gdy pojawi się pożądane zachowanie.
Historia warunkowania operacyjnego
Psycholog E.L. Thorndike był jednym z pierwszych, którzy zaobserwowali wpływ wzmocnienia w eksperymentach z puzzlami z kotami. Podczas tych eksperymentów Thorndike zaobserwował proces uczenia się, który nazwał uczeniem „prób i błędów”.
Eksperymenty polegały na umieszczeniu głodnego kota w pudle z puzzlami, a żeby się uwolnić, kot musiał wymyślić, jak uciec. Thorndike następnie odnotował, ile czasu zajęło kotom uwolnienie się w każdej próbie eksperymentalnej. Początkowo koty stosowały nieskuteczne metody ucieczki, drapiąc i kopiąc po bokach lub na górze pudełka. Ostatecznie metoda prób i błędów doprowadziłaby koty do pomyślnego popchnięcia lub pociągnięcia drogi ucieczki. Po każdej kolejnej próbie koty coraz mniej angażowały się w nieefektywne zachowania ucieczkowe i szybciej reagowały prawidłowymi akcjami ucieczkowymi.
Thorndike nazwał swoje obserwacje prawem skutku. Siła reakcji wzrasta, gdy natychmiast następuje „satysfakcjonujący” (wzmacniacz). Z drugiej strony, działania, po których następują nieprzyjemne efekty, są bardziej prawdopodobne, że zostaną osłabione.
W eksperymentach Thorndike'a z pudełkiem, ucieczka z pudła była bardziej satysfakcjonująca. Za każdym razem, gdy kotom udało się uciec z pudełka, zachowanie poprzedzające ucieczkę było wzmacniane i wzmacniane.
Praca Thorndike'a miała ogromny wpływ na późniejsze badania B.F. Skinnera nad warunkowaniem instrumentalnym. Skinner stworzył nawet własną wersję pudełek puzzli Thorndike'a, które nazywał komorą operanta, znaną również jako pudełko Skinnera.
Jak działa kondycjonowanie operacyjne
Skinner zidentyfikował dwa kluczowe typy zachowań. Pierwszy typ to zachowania respondentów. Są to po prostu działania, które pojawiają się odruchowo, bez żadnej nauki. Jeśli dotkniesz czegoś gorącego, natychmiast cofniesz rękę w odpowiedzi. Warunkowanie klasyczne koncentruje się na tych zachowaniach respondentów.
W klasycznych eksperymentach Pawłowa z psami ślinienie się w związku z prezentacją jedzenia było zachowaniem respondenta. Jednak tworząc skojarzenie między dźwiękiem brzęczyka a prezentacją jedzenia, Pawłow był w stanie wyszkolić psy, aby rzeczywiście śliniły się po prostu na dźwięk tego brzęczyka.
Skinner zdał sobie sprawę, że chociaż warunkowanie klasyczne może wyjaśnić, w jaki sposób zachowania respondentów mogą prowadzić do uczenia się, nie może wyjaśniać każdego typu uczenia się. Zamiast tego zasugerował, że to konsekwencje dobrowolnych działań prowadzą do największej ilości uczenia się.
Drugim rodzajem zachowań jest to, co Skinner nazwał zachowaniami operacyjnymi. Zdefiniował je jako każde dobrowolne zachowanie, które oddziałuje na środowisko, aby wywołać reakcję. Są to dobrowolne zachowania, które są pod naszą świadomą kontrolą. Są to również działania, których można się nauczyć. Konsekwencje naszych działań odgrywają ważną rolę w procesie uczenia się.
Wzmocnienie i kara
Skinner zidentyfikował dwa kluczowe aspekty procesu warunkowania instrumentalnego. Wzmocnienie służy wzmocnieniu zachowania, a kara zmniejszeniu zachowania. Istnieją również dwa różne rodzaje wzmocnień i dwa różne rodzaje kar.
Pozytywne wzmocnienie polega na przedstawieniu korzystnego wyniku, na przykład podarowaniu dziecku smakołyka po posprzątaniu pokoju.
Negatywne wzmocnienie polega na usunięciu nieprzyjemnego bodźca, jak powiedzenie dziecku, że jeśli zje wszystkie ziemniaki, nie będzie musiało jeść brokułów. Ponieważ dziecko uważa jedzenie brokułów za nieprzyjemne, a jedzenie ziemniaków prowadzi do usunięcia tego niepożądanego zadania, jedzenie ziemniaków jest wtedy wzmacniane negatywnie.
Kara pozytywna oznacza zastosowanie nieprzyjemnego zdarzenia po zachowaniu. Na przykład dawanie klapsów jest powszechnym przykładem pozytywnej kary. Ten rodzaj kary jest często określany jako kara przez zastosowanie. Negatywna konsekwencja jest bezpośrednio stosowana w celu zmniejszenia niepożądanego zachowania.
Kara negatywna polega na odebraniu czegoś przyjemnego po wystąpieniu zachowania. Na przykład, jeśli dziecko nie posprząta swojego pokoju, rodzice mogą mu powiedzieć, że nie może iść do centrum handlowego z przyjaciółmi. Odebranie pożądanej aktywności działa jak negatywny kara na poprzednie zachowanie.