Você já deve ter se deparado com situações em que tomou uma decisão que era eficaz em curto prazo para lidar com algum problema, mas que gerou mais problemas um tempo depois, como, por exemplo, ter bebido demasiadamente pelo “calor da hora”, esquecendo-se de que iria trabalhar no outro dia de ressaca, ou de outras consequências aversivas que isto poderia trazer, como a briga com alguém próximo ou até lesões e acidentes. Muitas vezes nos engajamos em comportamentos cujos reforços eram mais imediatos em oposição a outros comportamentos cujas consequências pudessem ser mais satisfatórias ou importantes para nossa vida. É o caso de indivíduos mais impulsivos que seguidamente se colocam em situações de risco em virtude dos reforçadores de curto prazo, ou de sujeitos com dependência química que acabam usando alguma droga que gera prazer ou alívio imediato, deixando de lado todas as implicações que isso pode trazer, ou o caso do adolescente que prefere se divertir ao invés de estudar para a prova do final do semestre. Na verdade, todos nós temos uma preferência por essas consequências imediatas e não conseguimos muitas vezes tolerar um pouco de atraso nas nossas gratificações. Você já se questionou por que isso acontece? Por que estes comportamentos associados a recompensas mais imediatas possuem uma valência tão forte? Quais os riscos que este padrão pode trazer? É possível desenvolver tolerância ao atraso das gratificações?
Para começar respondendo a algumas destas questões um rápido jogo de economia faz-se indicado. Gostaria de solicitar ao leitor que observe entre duas opções de recompensas hipotéticas e decida qual destas seria a sua escolha mais provável. A primeira opção será uma recompensa menor e imediata (R1 – R$ 10), enquanto a outra recompensa possui um valor hipotético maior (R2 – R$100), mas será entregue com um período variável de atraso:
1) Você preferiria receber 10 reais agora, ou 100 reais agora?
2) 10 reais agora, ou 100 reais daqui a dez minutos?
3) 10 reais agora, ou 100 reais amanhã?
4) 10 reais agora, ou 100 reais daqui a uma semana?
5) 10 reais agora, ou 100 reais daqui a um mês?
6) 10 reais agora, ou 100 reais daqui a um ano?
De forma geral, quanto mais tempo demora a entrega da recompensa maior, menor o seu valor de escolha, sendo menos provável que o indivíduo opte por esta recompensa atrasada. Em algum momento você deve ter desistido da recompensa de maior magnitude, em função de seu atraso. Este fenômeno chamado “Desvalorização pelo atraso da recompensa” (DD, do inglês Delay Discounting) não é exclusividade da espécie humana, mas também ocorre em outros animais, como ratos, cachorros, gatos, e primatas (Perry & Carroll, 2008). A desvalorização tende a criar um gráfico típico de curva decrescente hiperbólica (veja imagem ao lado) na qual o valor subjetivo da recompensa maior ou preferida decai com o passar do tempo.
Dois recentes artigos deste blog apresentaram temas que são altamente associados à DD, a procrastinação (Dias, 2015) e o autocontrole (Grandi, 2015). Os comportamentos de procrastinação, de forma geral, têm função reforçadora imediata. Alguns exemplos são: mexer no Facebook, tocar violão, fazer festa, ir ao parque, etc. Esses comportamentos podem ser mais interessantes do que terminar aquele artigo para uma revista, ou um projeto para apresentar ao chefe, mesmo que estes possivelmente rendam uma publicação ou uma promoção. Some a isso a poderosa valência do alívio da “tensão” (reforço negativo) ao entregar a tarefa no último instante (também imediata) e você tem um padrão comportamental altamente reforçado.
O autocontrole, por sua vez, reside em ter consciência de grande parte das variáveis mantenedoras de determinados comportamentos, e uma das variáveis a ser considerada é o tempo de intervalo entre o que fazemos e o que acontece depois (Adriani & Laviola, 2006). Em maior ou menor grau todos somos controlados pelo quanto o reforço demora a ocorrer; somos todos um pouco imediatistas, não tolerando aguardar por muito tempo gratificações. No entanto, sujeitos impulsivos tendem a apresentar uma desvalorização pelo atraso da recompensa muito mais proeminente. Em razão disto não conseguem tolerar recompensas atrasadas, quase sempre sendo controlados pelas consequências de curto prazo. Este padrão comportamental também pode ser encontrado em sujeitos adictos, os quais geralmente se comportam buscando satisfação imediata, como no caso da dependência química, gambling, adições de eletrônicos (como videogame, internet, etc.), e também em sujeitos com transtorno de Déficit de Atenção e Hiperatividade (TDAH), Transtorno Obsessivo-compulsivo, Transtorno de Humor Bipolar e Personalidade Borderline, dentre outros.
Jogos virtuais usam e abusam do conhecimento deste processo, fazendo com que seus usuários passem horas e horas parados com um celular na mão passando de fase após fase no Candy Crush e similares. O uso constante das redes sociais também pode indicar o DD: não conseguimos aguardar o final do dia para ler a timeline no Facebook, precisamos fazer isto a cada minuto, buscando ou uma postagem interessante ou o número crescente de “curtir” em algum post nosso; neste caso a produtividade e as metas podem ficam em segundo plano. Um padrão de respostas impulsivo associado à baixa tolerância à DD se relaciona com prejuízo no planejamento e execução de tarefas de longo prazo, podendo acompanhar maior exposição a comportamentos de risco, como sexo desprotegido, direção imprudente, violência e até mesmo condutas suicidas. No entanto, recompensas imediatas também podem ter grande magnitude e nem sempre devem ser consideradas prejudiciais ao organismo.
Embora a DD possa ter um papel evolutivo no momento em que a disponibilidade de recompensas atrasadas seja menor ou improvável, a vida em sociedade exige que consigamos tolerar o atraso das gratificações. Precisamos esperar um longo mês de trabalho para ganharmos nosso salário, assim como devemos trabalhar com afinco durante anos para recebermos uma promoção. A união íntima é outro tipo de contexto em que muitas vezes precisamos nos engajar em comportamentos cuja recompensa virá bastante tempo depois, deixando de lado condutas associadas a reforços imediatos, como no caso da traição, das explosões em função da bagunça do outro, ou da crítica a algum atraso do cônjuge.
A tolerância ao atraso da recompensa é uma habilidade que é desenvolvida ao longo da infância e adolescência (Reynolds & Schiffbauer, 2010). Os mais jovens tendem a se comportar mais pelas consequências imediatas que adultos. Crianças preferem jogar videogame ou brincar com os amigos ao invés de estudar para “serem profissionais bem-sucedidos na adultez”. Adolescentes também são governados por recompensas imediatas oriundas de comportamentos vinculados à sexualidade, grupos, uso de álcool e outras drogas e “aventuras”. O neurodesenvolvimento do córtex pré-frontal e de certos núcleos do estriado parece estar associado ao desenvolvimento de DD e às habilidades de tolerância à recompensa adiada (Humby & Wilkinson, 2011).
Na clínica analítico-comportamental o fenômeno também pode se apresentar na tendência de alguns de nossos clientes utilizarem estratégias de curto prazo de gratificação ou resolução de problemas, mas que podem acompanhar eventos aversivos que ocorrem a médio e longo prazo, em detrimento de estratégias de tolerância ao atraso das gratificações. Na Terapia de Aceitação e Compromisso (ACT) o comportamento impulsivo se relaciona com a impossibilidade de engajamento por ações flexíveis cuja gratificação não é imediata (Luoma, Hayes, & Walser, 2007); na Terapia Dialética Comportamental (DBT) a impulsividade é um dos componentes da teoria biossocial e está relacionada com desregulação emocional (Linehan, 2014); e na Psicoterapia Analítica Funcional (FAP) comportamentos impulsivos podem se apresentar como comportamentos clinicamente relevantes, tais como intolerância ao mal-estar ou a reclamação de que a terapia não está funcionando tão imediatamente quanto esperado (Kanter, Tsai, & Kohlenberg, 2010). O próprio racional da FAP apresenta relação com este aspecto temporal da recompensa. É mais poderoso reforçar uma melhoria logo após esta ocorrer em sessão do que dias depois.
Como podemos tolerar o atraso das gratificações?
A partir da década de 1960 Mischel desenvolveu o estudo das habilidades de sustentação de escolha pela recompensa preferida e atrasada (DG, do inglês, Delay of Gratification) (Reynolds & Schiffbauer, 2010). Inicialmente, o pesquisador perguntava às crianças qual dos reforçadores primários disponíveis (bolo, biscoitos, etc.) era o seu favorito. À criança era solicitado que sustentasse sua escolha durante um período, podendo sempre optar pela recompensa não-tão-preferida disponível imediatamente caso quisesse. Mischel encontrou evidências que estas habilidades se desenvolveriam desde aproximadamente 4 anos, ou seja, que crianças pequenas já teriam habilidades para sustentar a escolha de uma recompensa preferida não imediata.
Estas habilidades podem ser treinadas no cotidiano, como por exemplo, ao se ensinar à criança a habilidade de leitura. Em um primeiro momento, pode-se utilizar reforçadores arbitrários mais imediatos, como por exemplo, a possibilidade de jogar videogame ou receber elogios e, com o avanço no ensino, as contingências com reforçadores naturais podem aparecer, como ao terminar um gibi ou ler um bom texto, os quais nem sempre ocorrem imediatamente. O modelo terapêutico da ACT considera que muitas das condutas de esquiva de experiências aversivas que possuem eficácia em curto prazo podem reduzir o acesso aos reforços de grande magnitude que nem sempre estão disponíveis imediatamente. A habilidade de tolerância à gratificação pode ser treinada no momento em que o cliente se torna consciente de que sua esquiva tem eficácia apenas em curto prazo, e que estas podem acompanhar eventos aversivos de médio e longo prazo. Desta forma, a escolha de ações de compromisso, nem sempre vinculadas a reforços imediatos, pode se tornar mais provável. A própria magnitude das recompensas da escolha pela ação comprometida passará a manter esta forma de agir.
O desenvolvimento de tolerância à DD pode promover uma melhoria de qualidade de vida no momento em que o acesso às recompensas de grande magnitude se torna mais provável e frequente. Portanto, é imprescindível que a avaliação da DD e o treino de habilidades de tolerância façam parte do repertório de intervenção dos clínicos analítico-comportamentais, assim como de qualquer profissional que utilize ferramentas de análise funcional na sua prática.
Referências
Adriani, W., & Laviola, G. (2006). Delay aversion but preference for large and rare rewards in two choice tasks: implications for the measurement of self-control parameters. BMC Neuroscience, 7, 11. http://doi.org/1471-2202-7-52 [pii]10.1186/1471-2202-7-52
Dias, D. (2015). Deixando 2015 pra depois? Sobre metas de início de ano e procrastinação. Recuperado de https://comportese.com/2015/02/deixando-2015-pra-depois-sobre-metas-de-inicio-de-ano-e-procrastinacao/
Grandi, S. P. (2015). Autocontrole: a Análise do Comportamento pode ajudar? Recuperado de https://comportese.com/2015/03/autocontrole-a-analise-do-comportamento-pode-ajudar/
Humby, T., & Wilkinson, L. S. (2011). Assaying dissociable elements of behavioural inhibition and impulsivity: translational utility of animal models. Current Opinion in Pharmacology, 11(5), 534–539. http://doi.org/10.1016/j.coph.2011.06.006
Kanter, J. W., Tsai, M., & Kohlenberg, R. J. (2010). The Practice of Functional Analytic Psychotherapy. Springer Science & Business Media.
Linehan, M. M. (2014). DBT? Skills Training Manual, Second Edition. Guilford Publications.
Luoma, J. B., Hayes, S. C., & Walser, R. D. (2007). Learning ACT: An Acceptance & Commitment Therapy Skills-training Manual for Therapists. New Harbinger Publications.
Perry, J. L., & Carroll, M. E. (2008). The role of impulsive behavior in drug abuse. Psychopharmacology (Berlin), 200(1), 1–26. http://doi.org/10.1007/s00213-008-1173-0
Reynolds, B., & Schiffbauer, R. (2010). Delay of Gratification and Delay Discounting: A Unifying Feedback Model of Delay-Related Impulsive Behavior. The Psychological Record, 55(3). Recuperado de http://opensiuc.lib.siu.edu/tpr/vol55/iss3/