Esquemas de reforço de comportamento •Psicologia •Behaviorismo

O que são esquemas de reforço?

mulher com cachorro - treinamento canino - reforco - condicionamento operante

No condicionamento operante, esquemas de reforço são um componente importante do processo de aprendizagem. Quando e quantas vezes nós reforçamos um comportamento pode ter um impacto dramático na força e velocidade da resposta.

Um esquema de reforço é basicamente uma regra afirmando que as instâncias de um comportamento serão reforçadas. Em alguns casos, um comportamento pode ser reforçado cada vez que ocorre. Às vezes, um comportamento pode ser não reforçada sempre.

Reforço positivo ou reforço negativo podem ser usados, dependendo da situação. Em ambos os casos, o objetivo é sempre reforçar o comportamento e aumentar a probabilidade de ocorrer de novo no futuro.

Em contextos do mundo real, comportamentos provavelmente não vão ser reforçados cada vez que eles ocorrem. Para situações onde você está propositalmente tentando treinar e reforçar uma ação, como na sala de aula, nos esportes, ou em treinamento animal, você pode optar por seguir um esquema de reforço específico.

Como você verá abaixo, alguns esquemas são mais adequados para determinados tipos de situações de treinamento. Em alguns casos, o treinamento pode começar com um esquema e mudar para outro uma vez que o comportamento desejado foi ensinado.

Certos esquemas de reforço podem ser mais eficazes em situações específicas. Existem dois tipos de esquemas de reforço:

1. Reforço contínuo

Em reforço contínuo, o comportamento desejado é reforçado cada vez que ocorre. Este esquema é melhor usado durante as fases iniciais da aprendizagem, a fim de criar uma forte associação entre o comportamento e a resposta. Uma vez que a resposta tenha se ligado firmemente, o reforço é geralmente ligado a um esquema de reforço parcial.

2. Reforço parcial

Em reforço parcial, a resposta é reforçada uma única parte do tempo. Comportamentos aprendidos são adquiridos mais lentamente com reforço parcial, mas a resposta é mais resistente à extinção.

Há quatro esquemas de reforço parcial:

  1. Esquemas de razão fixa são aqueles em que uma resposta é reforçada somente após um determinado número de respostas. Este esquema produz uma taca alta e constante de resposta com apenas uma breve pausa após a entrega do reforçador. Um exemplo de um esquema de razão fixa seria entregar uma pelota de alimento para um rato após ele pressionar uma barra cinco vezes.
  2. Esquemas de razão variável ocorrem quando uma resposta é reforçada após um número imprevisível de respostas. Este esquema cria uma taxa alta e constante de respostas. Jogos de azar e loterias são bons exemplos de uma recompensa baseada em um esquema de razão variável. Em um ambiente de laboratório, isso pode envolver a entrega de pelotas do alimento a um rato depois de pressionar um bar, novamente depois de quatro prensas de barra, e uma terceira pelota após duas prensas de barras.
  3. Esquemas de intervalo fixo são aqueles em que a primeira resposta é recompensada somente após um determinado período de tempo decorrido. Este esquema provoca grandes quantidades de respostas perto do fim do intervalo, mas um índice de respostas mais lento imediatamente após a entrega do reforçador. Um exemplo disto em um ambiente de laboratório seria o reforço de um rato com um pelota de comida para a primeira prensa da barra após um intervalo de 30 segundos ter decorrido.
  4. Esquemas de intervalo variável ocorrem quando uma resposta é recompensada depois de uma quantidade indeterminada de tempo. Este calendário produz um ritmo lento e constante de resposta. Um exemplo disso seria a entrega de uma pelota de alimentos para um rato após a primeira prensa na barra depois de um intervalo de um minuto, uma outra pelota para a primeira resposta após um intervalo de cinco minutos, e um terceiro fornecimento de alimentos para a primeira resposta após intervalo de três minutos.

Escolhendo uma esquema de reforço

Decidir quando reforçar um comportamento pode depender de um certo número de fatores. Nos casos em que você está especificamente tentando ensinar um novo comportamento, uma programação contínua é muitas vezes uma boa escolha. Uma vez que o comportamento foi aprendido, a mudança para uma programação parcial é muitas vezes preferível.

Realisticamente, reforçar um comportamento cada vez que ocorre pode ser difícil e requer uma grande dose de atenção e recursos. Esquemas de reforços parciais não só tendem a levar a comportamentos que são mais resistentes à extinção, mas também reduzem o risco de que o sujeito será saciado. Se o reforçador usado não é mais desejado ou gratificante, o sujeito pode parar de executar o comportamento desejado. Por exemplo, imagine que você está tentando ensinar um cão a sentar-se. Se você estiver usando comida como recompensa, o cão pode parar de executar a ação uma vez que ele está cheio. Em tais casos, algo como elogio ou atenção pode ser um reforçador mais eficaz.


Referências

Ferster, C.B., & Skinner, B.F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts

Por Kendra Cherry

3 respostas a “Esquemas de reforço de comportamento •Psicologia •Behaviorismo”

  1. Muito bom, mas não é claro para leigos. Exemplos muito simplistas, deem exemplos com seres humanos em situações cotidianas.

    1. Um exemplo seria os vícios em redes sociais. Ficamos horas e horas, arrastando pra baixo na espera de encontrar um vídeo bom. As vezes somos recompensados com dopamina (hormônio da felicidade) após ver um vídeo incrível e continuamos na busca de outro melhor ainda. Isso se relaciona com o reforço parcial com uma recompensa após um número de vídeos imprevisíveis.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *