Condicionamento Operante: Definição, Como Funciona + Exemplos

Como Reforço e Punição modificam o comportamento

O condicionamento operante (por vezes referido como condicionamento instrumental) é um método de aprendizado que ocorre através de recompensas e punições para o comportamento. Através de condicionamento operante, uma associação é feita entre um comportamento e uma consequência para esse comportamento.

Por exemplo, quando um rato de laboratório pressiona um botão azul, ele recebe uma bolinha de comida como recompensa, mas quando ele aperta o botão vermelho ele recebe um leve choque elétrico.

Como resultado, ele aprende a pressionar o botão azul, mas evitar o botão vermelho.

A história do condicionamento operante

BehaviorismoO condicionamento operante foi cunhado pelo behaviorista BF Skinner, razão pela qual você pode ocasionalmente ouvi-lo referido como condicionamento Skinneriano. Como um behaviorista, Skinner acreditava que não era realmente necessário olhar para pensamentos e motivações internas, a fim de explicar o comportamento. Em vez disso, ele sugeriu, devemos olhar apenas para as causas externas, observáveis do comportamento humano.

Através da primeira parte do século 20, o behaviorismo havia se tornado uma grande força dentro da psicologia. As ideias de John B. Watson dominaram essa escola de pensamento desde o início. Watson focava nos princípios do condicionamento clássico , sugerindo que poderia tomar qualquer pessoa, independentemente da sua origem e treiná-la para ser qualquer coisa que ele escolhesse.

Enquanto os primeiros behavioristas tinha centrado os seus interesses na aprendizagem associativa, Skinner estava mais interessado em como as consequências de ações das pessoas influenciavam seu comportamento.

Skinner usou o termo operante para se referir a qualquer “comportamento ativo que atua sobre o meio ambiente para gerar consequências” (1953). Em outras palavras, a teoria de Skinner explicou como podemos adquirir a gama de comportamentos aprendidos que exibimos a cada dia.

Sua teoria foi fortemente influenciada pelo trabalho do psicólogo Edward Thorndike, que propôs o que chamou de lei do efeito. De acordo com este princípio, as ações que são seguidas por resultados desejáveis são mais suscetíveis de serem repetidas, enquanto aquelas seguidas por resultados indesejáveis são menos susceptíveis de serem repetidas.

O condicionamento operante se baseia em uma premissa bastante simples – ações que são seguidas por reforço serão reforçadas e tem mais probabilidade de ocorrer novamente no futuro. Se você contar uma história engraçada na classe e todo mundo rir, provavelmente você vai ser mais propenso a contar essa história de novo no futuro.

Por outro lado, as ações que resultam em punição ou consequências indesejáveis serão enfraquecidas e terão menos probabilidade de ocorrerem novamente no futuro. Se você contar a mesma história novamente em outra classe, mas ninguém rir, desta vez, você vai ser menos propenso a repetir a história novamente no futuro.

Tipos de comportamentos

Skinner distinguiu entre dois tipos diferentes de comportamentos: comportamentos respondentes e comportamentos operantes . Comportamentos respondentes são aqueles que ocorrem automaticamente e reflexivamente, como puxar sua mão de volta de um fogão quente ou levantar sua perna quando o médico bate em seu joelho.

Você não tem que aprender esses comportamentos, eles simplesmente ocorrem de forma automática e involuntariamente.

Comportamentos operantes, por outro lado, são aqueles sob nosso controle consciente. Alguns podem ocorrer espontaneamente e outros propositadamente, mas são as consequências dessas ações que influenciam ou não as ocorrências futuras. Nossas ações sobre o meio ambiente e as consequências dessa ação tornam-se uma parte importante do processo de aprendizagem.

Enquanto o condicionamento clássico pode explicar comportamentos respondentes, Skinner percebeu que não poderia ser responsável por uma grande quantidade de aprendizagem. Em vez disso, Skinner sugeriu que o condicionamento operante tinha importância muito maior.

Skinner inventou dispositivos diferentes durante sua infância e ele colocou essas habilidades para trabalhar durante seus estudos sobre o condicionamento operante. Ele criou um dispositivo conhecido como câmara de condicionamento operante, na maioria das vezes referida hoje como uma caixa de Skinner. A câmara era essencialmente uma caixa que poderia conter um pequeno animal tal como um rato ou pombo. A caixa também continha uma barra ou a chave que o animal poderia pressionar para receber uma recompensa.

A fim de controlar as respostas, Skinner também desenvolveu um dispositivo conhecido como um gravador cumulativo. O dispositivo gravava respostas como um movimento ascendente de uma linha de modo a que as taxas de respostas poderiam ser lidas por olhar para o declive da linha.

Componentes do condicionamento operante

Alguns conceitos-chave no condicionamento operante:

Reforço

O reforço é qualquer acontecimento que reforça ou aumenta o comportamento que se segue. Existem dois tipos de reforços:

  1. Reforçadores positivos são eventos favoráveis ou resultados que são apresentados após o comportamento. Em situações que refletem o reforço positivo, uma resposta ou comportamento é reforçada pela adição de algo, como elogio ou uma recompensa direta.
  2. Reforçadores negativos envolvem a remoção de eventos ou resultados desfavoráveis após a exibição de um comportamento. Nestas situações, a resposta é reforçada pela remoção de algo considerado desagradável.

Em ambos os casos de reforço, o comportamento aumenta.

Punição

Punição é a apresentação de um evento adverso ou resultado que provoca uma diminuição no comportamento que se segue. Existem dois tipos de punição:

  1. Punição positiva, por vezes referida como punição por aplicação, apresenta um evento desfavorável ou resultado a fim de enfraquecer a resposta que se segue.
  2. Punição negativa, também conhecida como a punição por remoção, ocorre quando um evento favorável ou resultado é removido após um comportamento ocorrer.

Em ambos os casos de punição, o comportamento diminui.

Esquemas de reforço

Skinner também descobriu que, quando e com que frequência comportamentos eram reforçadas desempenhava um papel na velocidade e força da aquisição. Ele identificou vários diferentes esquemas de reforço:

  1. Reforço contínuo envolve a entrega de um reforço cada vez que uma resposta ocorre. Aprendizagem tende a ocorrer de forma relativamente rápida, no entanto, a taxa de resposta é muito baixa. Extinção também ocorre muito rapidamente uma vez que o reforço é interrompido.
  2. Esquema de razão fixa são um tipo de reforço parcial. As respostas são reforçadas apenas após a ocorrência de um número específico de respostas. Isso normalmente leva a uma taxa de resposta bastante estável.
  3. Esquema de intervalo fixo é outra forma de reforço parcial. Reforço ocorre apenas após um certo intervalo de tempo decorrido. As taxas de resposta permanecem relativamente estáveis e começam a aumentar à medida que o tempo de reforço se aproxima, mas lentas imediatamente após o reforço tem sido entregue.
  4. Esquema de reforço de razão variável também é um tipo de reforço parcial que envolve reforçar o comportamento depois de um variado número de respostas. Isto leva a uma alta taxa de resposta e as taxas de extinção lentas.
  5. Esquema de reforço de intervalo variável é a forma final de reforço parcial que Skinner descreveu. Esta agenda envolve a entrega de reforço após um período variável de tempo decorrido. Isto também tende a conduzir a uma taxa de resposta rápida e lenta taxa de extinção.

Exemplos do condicionamento operante

Podemos encontrar exemplos de condicionamento operante funcionando ao nosso redor. Considere o caso de crianças que completam a lição de casa para ganhar uma recompensa de um pai ou professor, ou funcionários que acabam projetos para receber elogios ou promoções.

Nestes exemplos, a promessa ou possibilidade de recompensas provoca um aumento no comportamento, mas condicionamento operante pode também ser usado para diminuir um comportamento. A remoção de um resultado desejável ou aplicação de resultado negativo pode ser utilizada para diminuir ou prevenir comportamentos indesejáveis. Por exemplo, uma criança pode ser informada de que vai perder privilégio do recreio se falar fora de hora em sala de aula. Este potencial para a punição pode levar a uma diminuição da indisciplina.

Saiba mais: As diferenças entre condicionamento clássico e condicionamento operante


Inscreva-se no nosso Canal de Psicologia no Youtube


Referências

Domjan, M. (2003). The Principles of Learning and Behavior, Fifth Edition. Belmont, CA: Thomson/Wadsworth.

Skinner, B. F. (1935) Two types of conditioned reflex and a pseudo type Journal of General Psychology, 12, 66-77.

Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Cambridge, Massachusetts: B.F. Skinner Foundation.

Skinner, B. F. (1948). Superstition’ in the pigeon. Journal of Experimental Psychology, 38, 168-172.

Skinner, B. F. (1953). Science and human behavior. New York: Simon & Schuster.

Thorndike, E. L. (1905). The elements of psychology. New York: A. G. Seiler.

Por Kendra Cherry

3 respostas a “Condicionamento Operante: Definição, Como Funciona + Exemplos”

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *