Instrumentalno pogojevanje

Avtor: Leandro Alegsa

20-06-2021 21:16

Operantno pogojevanje je oblika učenja. Pri njem posameznik spremeni svoje vedenje zaradi posledic (rezultatov) vedenja.

Oseba ali žival se nauči, da ima njeno vedenje posledice. Ta posledica je lahko

Okrepitev: pozitiven ali nagrajujoč dogodek. Ta povzroči, da se vedenje pojavlja pogosteje.
Kazen: negativni ali kaznovalni dogodek. To povzroči, da se vedenje pojavlja redkeje.
Izumrtje: ne sledi noben dogodek, zato vedenje nima posledic. Če vedenje nima posledic, se bo pojavljalo redkeje.

Operantno pogojevanje ima štiri različne kontekste. Tu se izraza "pozitiven" in "negativen" ne uporabljata v svojem osnovnem pomenu; pozitiven pomeni, da se nekaj doda, negativen pa, da se nekaj odvzame:

Pozitivna okrepitev (pogosto samo "okrepitev") se pojavi, kadar je določena oblika vedenja nagrajena. S tem se poveča pogostost pojavljanja vedenja. Pri poskusu s Skinnerjevo škatlo je nagrada v obliki hrane, ko podgana pritisne na vzvod.
Negativna okrepitev (včasih "pobeg") se pojavi, ko odstranimo averzivni dražljaj. S tem se poveča pogostost pojavljanja vedenja. V poskusu s Skinnerjevo škatlo je bil prisoten glasen zvok, ki je bil odstranjen, ko je podgana pritisnila na vzvod.
Pozitivno kaznovanje se pojavi, ko se doda spodbuda, zaradi katere se vedenje pojavlja redkeje. Primer spodbude so lahko glasen hrup, električni šok (podgana) ali klofuta (otrok).
Negativno kaznovanje se zgodi, ko se odvzame dražljaj, zaradi česar se vedenje pojavlja redkeje. Primer je odvzem otrokove igrače, ko otrok izvede neželeno vedenje.

Zamisel o operantnem pogojevanju je prvi odkril Edward Thorndike, analiziral pa jo je B. F. Skinner.

Operantno pogojevanje se razlikuje od Pavlovovega klasičnega pogojevanja. Operantno pogojevanje se ukvarja s prostovoljnim spreminjanjem vedenja, klasično pogojevanje pa s treningom refleksa.

Thorndikeov zakon o učinku

Operantno pogojevanje, včasih imenovano instrumentalno učenje, je prvi preučeval Edward L. Thorndike (1874-1949). Opazoval je vedenje mačk, ki so poskušale pobegniti iz doma narejenih škatel s sestavljankami. Ko so bile mačke prvič postavljene v škatle, so potrebovale veliko časa, da so pobegnile. Z izkušnjami so se uspešni odzivi pojavljali pogosteje, kar je mačkam omogočilo pobegniti v krajšem času. Thorndike je v svojem zakonu o učinku teoretiziral, da se vedenje, ki mu sledijo zadovoljive posledice, ponavlja, vedenje, ki povzroča neprijetne posledice, pa je manj verjetno, da se bo ponovilo. Skratka, nekatere posledice so okrepile vedenje, nekatere posledice pa so vedenje oslabile. Thorndike je s tem postopkom izdelal prve znane učne krivulje.

B. F. Skinner (1904-1990) je izdelal podrobnejšo analizo operantnega pogojevanja. Skinner je izumil komoro za operantno pogojevanje, ki mu je omogočila merjenje hitrosti odziva kot ključne odvisne spremenljivke. Uporabljal je zapisovanje pritiskov na vzvod ali pritiskov na tipko.

Načela operantnega pogojevanja:

Diskriminacija, posploševanje in pomen konteksta.

Učenje poteka v kontekstu.
Večina vedenja je pod nadzorom dražljajev: določen odziv se pojavi le, če je prisoten ustrezen dražljaj.
Nadzor dražljajev je učinkovit, tudi če dražljaj za anketiranca nima nobenega pomena.

Izumrtje: operantno vedenje ugasne, ko se okrepitev preneha izvajati.

Okrepitve se pojavijo šele, ko se pravilno odzovemo, morda pa se ne bodo pojavile niti takrat. Vedenje zaradi tega ne oslabi in ne ugasne.
Rezultati so deloma odvisni od pogostosti prejemanja okrepitve.

Časovni razpored krepitve: časovna razporeditev krepitve je ključnega pomena.

Urnik s fiksnimi intervali: ojačevalci so predstavljeni v fiksnih časovnih obdobjih, če se ustrezno odzovemo.
Načrt s spremenljivim intervalom: vedenje se okrepi na podlagi povprečnega časa, ki je pretekel od zadnje okrepitve. Razporedi z razmerjem: temeljijo na razmerju med odzivi in okrepitvami.
Urnik s fiksnim intervalom: okrepitev se izvede po določenem številu odzivov. Poseben primer, ko se okrepitev poda po vsakem odzivu, se imenuje neprekinjena okrepitev.
Spremenljiv intervalni načrt: okrepitev dostave temelji na določenem povprečnem številu odzivov.

Vprašanja in odgovori

V: Kaj je operativno pogojevanje?

O: Operantno pogojevanje je oblika učenja, pri kateri posameznik spremeni svoje vedenje zaradi posledic (rezultatov) vedenja.

V: Kateri so štirje konteksti operantnega pogojevanja?

O: Štirje konteksti operantnega pogojevanja so pozitivna okrepitev, negativna okrepitev, pozitivna kazen in negativna kazen.

V: Kako deluje pozitivna okrepitev?

O: Pozitivna okrepitev se pojavi, kadar je za neko vedenje predvidena nagrada, ki poveča pogostost pojavljanja vedenja.

V: Kako deluje negativna okrepitev?

O: Negativna okrepitev se pojavi, ko se odstrani averzivni dražljaj, kar poveča pogostost pojavljanja vedenja.

V: Kako deluje pozitivna kazen?

O: Pozitivna kazen se pojavi, ko se doda dražljaj, zaradi česar se vedenje pojavlja redkeje.
V: Kako deluje negativno kaznovanje? O: Negativno kaznovanje poteka tako, da se odvzame dražljaj, zaradi česar se vedenje pojavlja manj pogosto.

V: Kdo je prvi odkril operantno pogojevanje?

O: Edward Thorndike je prvi odkril operantno pogojevanje, pozneje pa ga je analiziral B. F. Skinner.

Iskati