Aprendizado por condicionamento



Ivan Pavlov - Condicionamento Clássico


Existem algumas formas de aprendizado e, neste comento, vamos falar sobre uma forma nada cognitiva, na qual o cérebro utiliza da repetição e do sistema de recompensas para reproduzir ou reprimir um determinado comportamento.


Neste post, vou falar um pouco sobre o condicionamento clássico, objeto de estudo do fisiologista russo Ivan Pavlov, que dedicou seu trabalho estudando o condicionamento em cães.


Esse estudo sobre condicionamento clássico, realizado por Pavlov, estabeleceu grande parte das bases da psicologia comportamental atual. A ideia básica deste estudo é simplesmente aprender alguma coisa por associação.


Vocês já devem ter me ouvido falar que o cérebro cria associação, com base em experiências e memórias passadas. No caso deste aprendizado, acontece por associação simultânea.

Primeiro, vamos definir estímulo. Estímulo é qualquer ato, influência ou agente que gera uma resposta.


O Dr. Pavlov identificou quatro princípios básicos:

1. Estímulo incondicionado - aciona automaticamente algum tipo de resposta.

2. Resposta incondicionada - acionada automaticamente em função de um estímulo incondicionado.

3. Estímulo condicionado - quando um estímulo neutro (sem relação com nenhuma resposta) fica associado a um estímulo incondicionado, gerando uma resposta condicionada.

4. Resposta condicionada - aprendida a partir de um estímulo anteriormente neutro.

Eu sei que parece meio confuso. Então, deixa eu exemplificar:


1. Suponhamos que você escutou um barulho repentino muito alto (estímulo incondicionado), mas você não sabe identificar o que é. Neste momento, você levou um susto (resposta incondicionada).

Barulho → Susto


2. Agora, suponhamos que, antes de você ouvir este mesmo barulho, alguém tenha cutucado você. Este toque foi associado ao susto, causado pelo barulho. Se isso acontecer repetidas vezes, você condicionará o cutucão (estímulo condicionado) ao susto (resposta condicionada).

Toque → Barulho → Susto

Se repetido várias vezes, gera:

Toque → Susto


B. F. Skinner - Condicionamento Operante


Condicionamento operante é aquele em que alguém aprende algo com base nas consequências, sendo elas recompensas ou punições. O condicionamento operante pode ser dividido em quatro tipos:

1. Reforço positivo - ocorre quando um comportamento é reforçado e a probabilidade de se repetir aumenta por ter uma condição positiva de resultado (um presente, por exemplo);

2. Reforço negativo - um comportamento é reforçado a fim de evitar ou interromper uma condição negativa (um desprazer, por exemplo);

3. Punição - ocorre quando um comportamento é enfraquecido e a probabilidade de ocorrência diminui por resultar em uma condição negativa (castigo, por exemplo); e

4. Extinção - quando um comportamento é enfraquecido porque o resultado não levou a uma condição positiva (frustração, por exemplo).


Os reforços positivo e negativo reforçam determinado comportamento, aumentando a probabilidade dele acontecer novamente.

Enquanto a punição e a extinção enfraquecem, diminuindo a probabilidade de um comportamento ocorrer novamente.


A frequência e o momento em que um comportamento é reforçado podem afetar muito a resistência do comportamento e a taxa de resposta, e isso é chamado de frequência de reforço. Entende-se por frequência a quantidade da ocorrencia de um comportamento em um determinado período de tempo.


Pode-se usar reforços positivo e negativo, e o objetivo é sempre fortalecer o comportamento e aumentar a probabilidade de que ocorra novamente. As programações de reforço podem ser divididas em dois tipos:


Reforço contínuo: toda vez que um comportamento ocorre, ele é reforçado.

Reforço parcial: um comportamento é reforçado em parte do tempo.


O reforço parcial pode, ainda, ser dividido em 4 programações a saber:

1. Esquemas de razão fixa - quando uma resposta é reforçada após um determinado número de respostas;

2. Esquemas de razão variável - quando uma resposta é reforçada após um número aleatório de respostas;

3. Esquemas de intervalo fixo - quando uma resposta é reforçada após um determinado intervalo de tempo; e

3. Esquemas de intervalo variável - quando uma resposta é reforçada após um intervalo de tempo imprevisível.


13 visualizações

©2020 por Faculdade da Mente.

SMPW Trecho 3 Bloco B Loja 15 Edifício BanShop - Brasília/DF

CNPJ 24.701.671/0001-48

Telefone/WhatsApp +55 (61) 4141-9965

A data estimada para entrega dos produtos dependerá do produto escolhido