Condicionamento instrumental (ou operante), Thorndike e Skinner

Condicionamento instrumental é outro termo para o condicionamento operante, um processo de aprendizagem inicialmente descrito por BF Skinner. No condicionamento instrumental, reforço ou punição são usados para aumentar ou diminuir a probabilidade de um comportamento ocorrer novamente no futuro.

Por exemplo, se um estudante é recompensado com elogios cada vez que ela levanta a mão na classe e responde algo, ele se torna mais propenso a levantar a mão novamente no futuro.

Se ele é repreendido quando fala fora de hora, ele se torna menos propenso a interromper a aula. Nestes exemplos, o professor está usando reforço para fortalecer o comportamento de levantar a mão e punição para enfraquecer o comportamento de falar fora de hora.

Condicionamento instrumental é frequentemente usado em treinamento de animais também. Por exemplo, treinar um tigre para levantar a pata envolve oferecer uma recompensa cada vez que o comportamento desejado ocorre. NÃO FAÇA ISSO EM CASA.

tigres-adestrados-condicionamento-operante

Uma Breve História do condicionamento instrumental

O psicólogo EL Thorndike foi um dos primeiros a observar o impacto do reforço em experimentos da caixa problema com gatos. Durante essas experiências, Thorndike observou um processo de aprendizagem que ele se referiu como aprendizado por “tentativa e erro”.

Os experimentos envolviam a colocação de um gato faminto em uma caixa problema e, a fim de se libertar, o gato tinha que descobrir como escapar. Thorndike, em seguida, observou quanto tempo os gatos levaram para libertar-se em cada ensaio experimental.

Inicialmente, os gatos usavam métodos de fuga ineficazes, como arranhar e cavar nas laterais ou na parte superior da caixa. Eventualmente, tentativa e erro levariam os gatos a empurrar ou puxar a alavanca com sucesso. Após cada tentativa sucessiva, os gatos se envolviam cada vez menos nos comportamentos de fuga ineficazes e mais rapidamente respondiam com as ações de escape corretas.

Thorndike se refere às suas observações como a Lei do Efeito. A força de uma resposta aumenta quando ela é imediatamente seguida por “satisfação” (reforço). Por outro lado, as ações que são seguidas por efeitos desagradáveis são mais propensas a ser enfraquecidas.

Nos experimentos da caixa problema de Thorndike, escapar da caixa era a satisfação. Toda vez que os gatos escaparam com êxito da caixa, o comportamento que precedeu imediatamente a fuga foi reforçado e fortalecido.

O trabalho de Thorndike teve um enorme efeito sobre a pesquisa de BF Skinner sobre o condicionamento operante. Skinner até criou sua própria versão de caixas problema de Thorndike, às quais ele se referiu como uma câmara operante, também conhecida como uma caixa de Skinner.

Como funciona o condicionamento instrumental?

Skinner identificou dois principais tipos de comportamentos. Os primeiros foram os comportamentos respondentes. Estes são simplesmente ações que ocorrem reflexivamente sem qualquer aprendizagem. Se você tocar em algo quente, você vai tirar imediatamente sua mão de volta em resposta. Condicionamento clássico incide sobre estes comportamentos respondentes.

Nos clássicos experimentos de Pavlov com cães, salivar à apresentação de alimentos foi o comportamento respondente. Ao formar uma associação entre o som de um sino e a apresentação de alimentos, no entanto, Pavlov foi capaz de treinar cães para realmente salivar simplesmente ao ouvir o som daquele sino.

Skinner percebeu que enquanto o condicionamento clássico poderia explicar como comportamentos respondentes poderiam levar à aprendizagem, não poderiam ser responsáveis por todo tipo de aprendizagem. Em vez disso, ele sugeriu que eram as consequências de ações voluntárias que levariam à maior quantidade de aprendizagem.

O segundo tipo de comportamentos é o que Skinner se referiu como comportamentos operante. Ele definiu como todo e qualquer comportamento voluntário que age sobre o meio ambiente para criar uma resposta. Estes são os comportamentos voluntários que estão sob são o controle consciente. Estes também são ações que podem ser aprendidas. As consequências de nossas ações têm um papel importante no processo de aprendizagem.

Skinner identificou dois aspectos fundamentais do processo de condicionamento operante. Reforço serve para aumentar o comportamento, enquanto a punição serve para diminuir o comportamento.

Há também dois tipos diferentes de reforço e dois tipos diferentes de punição. O reforço positivo envolve apresentar um resultado favorável, como dar a uma criança um doce depois que ela limpa seu quarto. Reforço negativo envolve a remoção de um estímulo desagradável, como dizer a um criança que, se ela comer todas as suas batatas então ela não terá que comer seus brócolis. Desde que a criança considera brócolis uma consequência desagradável e comer as batatas leva à remoção desta consequência indesejável, comer as batatas é então reforçado negativamente.

Punição positiva significa aplicar um evento desagradável depois de um comportamento. Apanhar, por exemplo, é um exemplo comum de punição positiva. Este tipo de punição é muitas vezes referida como punição por aplicação. Uma consequência negativa é aplicada diretamente para reduzir o comportamento indesejado.

Punição negativa envolve tirar algo agradável depois que um comportamento ocorre. Por exemplo, se uma adolescente não limpar seu quarto, seus pais poderiam dizer que ela não pode ir ao shopping com as amigas. Tirar a atividade desejável atua como um punidor negativo sobre o comportamento anterior.


Traduzido e adaptado do artigo original de Kendra Cherry.

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *