Livro: Varian, Hal - Microeconomia (2015) - Parte XXIII

                        

Livro: Varian, Hal - Microeconomia (2015) - Parte XXII


Pgs. 815-849:


CAPÍTULO 30: "Aplicações da teoria dos jogos"


707 - Por enquanto, o início se trata de colocar ideias simples do capítulo anterior em linguagem chata: ...um equilíbrio de Nash é um par de estratégias (l*, c*) tal que



708 - ...O conceito de equilíbrio de Nash formaliza a ideia de “consistência mútua”. (...) são as crenças e as ações dos jogadores que são mutuamente consistentes num equilíbrio de Nash.


709 - Observe que em alguns casos um dos jogadores pode se mostrar indiferente entre melhores respostas. É por isso que só exigimos que c* seja uma das melhores respostas de coluna e que l* seja uma das melhores respostas de linha. Se houver uma única melhor resposta para cada escolha, então a curva de melhor resposta pode ser representada por uma função de melhor resposta.


710 - Por tudo isso, reconhece o equilíbrio de Nash apenas como generalização do de Cournot, já visto. Ou seja, Cournot é um tipo de Nash.


711 - ...Não só ele. O equilíbrio de Bertrand, também apresentado no Capítulo 28, é um equilíbrio de Nash relativo a estratégias de determinação de preços.


712 - (Obviamente eu não tive a mínima paciência para o "exercício resolvido" que se seguiu a tudo isso, com linhas e colunas, explicado da forma mais abstrata/chata possível.)


713 - O resumo da coisa é que em várias situações há mais de um equilíbrio de Nash possível. Nos exemplos dele, três. "Quando os participantes têm boas razões para acreditar que um dos equilíbrios é mais “natural” do que outros, esse é chamado de ponto focal do jogo".


714 - Volta a abordar o dilema do prisioneiro, mas nada muito novo. Um sistema de punições/retaliações poderia levar à cooperação. Os contratos são muito úteis para alcançar todo tipo de resultado, mas eles precisam apoiar-se na existência de um sistema jurídico que assegure o respeito a tais contratos. Isso faz sentido no caso de negócios entre empresas, mas não é uma pressuposição adequada a outros contextos, como jogos militares ou negociações internacionais.


715 - Classifica a corrida armamentista como "jogo de garantia". 



716 - ...Uma forma de alcançar essa certeza ocorre se um dos participantes o fizer primeiro, permitindo, digamos, uma inspeção. Observe que isso pode ser feito unilateralmente, pelo menos enquanto se acredita nos ganhos do jogo. Se um dos participantes anuncia que se abstém de construir mísseis nucleares e fornece evidências suficientes de sua escolha ao outro participante, pode ficar certo de que o outro participante também se absterá.


717 - Jogo "roleta russa": Nesse jogo, os dois jogadores ficam em pior situação ao fazerem a mesma coisa (dirigindo em linha reta ou desviando-se) do que se fizessem coisas diferentes. Exemplifica com carros correndo em direção ao outro para bater. Quem desviar sai desmoralizado. Os equilíbrios de Nash aqui são um fazendo algo diferente do outro, seja qual for. A batida e o desvio duplo são as piores opções. Nesses casos, "quem ganhar ou quem perder, nem vai ganhar nem vai perder, vai todo mundo perder". Enfim, esses jogos todos são exemplos de "jogos de coordenação".



718 - ...No jogo da segurança, na batalha dos sexos (um quer filme de ação e a outra de arte, mas saem sem poder se comunicar) e em “roleta russa”, isso pode ser conseguido quando um dos participantes faz o primeiro movimento e se compromete com uma escolha em particular. O outro vai seguir o equilíbrio imposto pelo agente "determinado", digamos assim. Pelo menos haverá algum. O caso  problemático é o "dilema do prisioneiro": ...se um dos jogadores resolve não confessar, o outro tem interesse em fazê-loEm lugar de jogadas sequenciais, a repetição e a contratação são as formas principais de “resolver” o dilema do prisioneiro.


719 - Passa a falar dos jogos de competição. São os "jogos de soma zero". É a grande maioria dos esportes. Parte das probabilidades de êxito, ou seja, utilização de "estratégias mistas":



720 - Aí é só montar a probabilidade da coisa: Se linha chuta para a esquerda com probabilidade p, obterá um ganho esperado de 50p + 90(1 – p) quando coluna pular para a esquerda e de 80p + 20(1 – p) quando coluna defender para a direita. Linha quer tornar seus ganhos os maiores possíveis, mas coluna deseja que sejam os menores. (...) Por exemplo, imagine que linha opte por chutar para a esquerda metade das vezes. Se coluna pular para a esquerda, linha agora terá um ganho esperado de 50 × ½ + 90 × ½ = 70; se coluna pular para a direita, linha terá um ganho esperado de 80 × ½ + 20 × ½ = 50. (...) Se coluna acredita que linha chutará para a esquerda metade do tempo, então coluna resolverá defender à direita, uma vez que essa é a opção que minimiza o ganho esperado de linha (maximizando, portanto, o ganho esperado de coluna). (...) A Figura 30.2 mostra os ganhos esperados de linha para diferentes escolhas de p. Isso simplesmente é a representação gráfica de duas funções 50p + 90(1 – p) e 80p + 20(1– p). Como as duas expressões são funções lineares de p, os gráficos são linhas retas. (...) 50p + 90(1 – p) = 80p + 20(1 – p):



721 - Isso aí é, portanto, o ganho mínimo de linha. Coluna minimizou. Portanto, se linha chuta para a esquerda 70% das vezes e coluna responde de forma ótima, linha obterá um ganho esperado de 50 × 0,7 + 90 × 0,3 = 62


722 - ..."E coluna? Podemos efetuar uma análise semelhante para suas escolhas. Imagine que coluna decida defender à esquerda com probabilidade q e à direita com probabilidade (1 – q). Então o ganho esperado de linha será 50q + 80(1 – q) se coluna pular para a esquerda e 90q + 20(1 – q) ao pular para a direita. Para cada q, coluna deseja minimizar o ganho de linha, mas coluna reconhece que linha deseja maximizar o mesmo ganho. (...) Desse modo, se coluna resolve pular para a esquerda com probabilidade ½, ela admite que linha alcançará um ganho esperado de 50 × ½ + 80 × ½ = 55 se linha chutar para a esquerda e 90 × ½ + 20 × ½ = 55 se chutar para a direita. Nesse caso, naturalmente, linha optará por chutar para a esquerda. (...) 50q + 80(1 – q) = 90p + 20(1 – q), o que implica q = 0,6":



723 - Essas probabilidades 0,6 e 0,7 são então as escolhas ótimas de cada. O equilíbrio esperado se ambos tentarem minimizar os ganhos do outro. Esses valores foram escolhidos para que os ganhos de linha e os de coluna sejam iguais, faça o que fizer o outro jogador, já que encontramos esses valores igualando os ganhos das duas estratégias que os oponentes poderiam escolher. A incerteza leva a essas escolhas. ...essas escolhas são um equilíbrio de Nash: cada jogador está otimizando, dadas as escolhas do outro.


724 - ....Em equilíbrio, linha fará gol em 62% das vezes e deixará de fazer em 38% das oportunidades. Isso é o melhor que pode conseguir, se o outro jogador responder de forma ótima.


725 - (Enfim, é um saco, muita informação, meio confuso e não sei se usarei isso qualquer dia na vida, ou seja, é interessante, mas desinteressante ao mesmo tempo. De toda forma, deu pra pegar a lógica da coisa se algum dia quiser usar).


726 - Entrando na biologia, começa a tratar de jogos de coexistência: imagine que uma mesma espécie - cachorros selvagens - pode se comportar ora como pombo (gostam de dividir as coisa "de boa") ora como falcão ("agressivos e querem tudo"): Se ambos os cachorros selvagens jogarem pombo, acabarão com (2, 2). Se um deles jogar falcão e o outro, pombo, o jogador falcão ganha tudo. Se ambos jogarem falcão, os dois cachorros serão gravemente feridos.



727 - Obviamente não pode haver equilíbrio se todos jogarem falcão, pois, se algum cachorro jogasse pombo, acabaria com 0 em lugar de –2. E, se todos os cachorros jogassem pombo, compensaria se alguém se desviasse e jogasse falcão, de modo que, no equilíbrio, é necessária alguma mistura de tipos falcão e de tipos pombo. Que mistura poderíamos esperar? ...


728 - (...) Imagine que a fração que joga falcão seja p. Então, um falcão encontrará outro falcão com probabilidade p e um pombo com probabilidade 1 – p. O ganho esperado do tipo falcão será H = –2p + 4(1 – p). O ganho esperado do tipo pombo será D = 2(1 – p). ...


729 - (...) Imagine que o tipo que registra o maior ganho se reproduza mais rapidamente, transmitindo a tendência a jogar falcão ou pombo a sua descendência. Portanto, se H > D, veríamos que aumenta a fração de tipos falcão na população, enquanto, se H < P, esperaríamos um aumento do tipo pombo. ...


730 - (...) A única forma de manter equilíbrio na população é igualar os ganhos dos dois tipos. Isso exige que H = –2p + 4(1 – p) = 2(1 – p) = D, que se resolve para p = 1/2. Verificamos que uma mistura de pombos e falcões em igual proporção é um equilíbrio. Será, em algum sentido, estável? Representamos graficamente a população que joga falcão na Figura 30.5.



731 - ...Observe que, quando p > 1/2, o ganho de se jogar falcão é menor do que o de jogar pombo, de modo que esperaríamos que os pombos se reproduzissem mais rapidamente, levando- nos de volta à proporção de equilíbrio, 50% de pombos e 50% de falcões. Do mesmo modo, quando p < 1/2, o ganho de se jogar falcão é maior do que o de se jogar pombo, provocando uma reprodução mais rápida dos falcões.


732 - (Enfim, bem interessante).


733 - ...Esse argumento mostra que p = 1/2 é um equilíbrio, mas que ele é também estável sob forças evolucionistas. Considerações desse tipo levaram a um conceito conhecido como estratégia evolucionariamente estável (ESS – Evolutionary Stable Strategy). E vem de um equilíbrio de Nash, embora deduzido de modo mais complexo talvez.


734 - Passa a falar dos "jogos de compromisso": A irreversibilidade é parte do que significa ter um compromisso, enquanto a possibilidade de observação é fundamental para que o outro participante possa ser convencido a alterar seu comportamento. Ele dá uma viajada com a fábula do sapo e escorpião e conclui: Um sapo esperto teria imaginado alguma forma de fazer o escorpião se comprometer a não dar sua ferroada. Poderia, por exemplo, amarrar sua cauda. Ou poderia contratar um sapo matador que o vingasse, dando cabo da família do escorpião... O sapo ia lá saber que a porra do escorpião era "kamikaze".


735 - Na Colômbia, estima-se que ocorram mais de 2.000 sequestros ao ano. Na antiga União Soviética, os sequestros aumentaram de 5 em 1992 para 105 em 1999. (salvei por curiosidade. Não sabia).


736 - Imagine que alguns sequestradores capturam um refém e que então descobrem que não podem ser pagos. Deveriam liberar o refém? Este naturalmente promete não revelar a identidade de seus sequestradores, mas manterá a promessa? Uma vez liberado, não tem incentivo para fazê-lo – e tem todos os incentivos para punir seus captores. Mesmo que os sequestradores desejem liberar seu refém, não podem fazê-lo por receio de serem identificados. (...) Agora é o refém que tem um problema de compromisso. Como poderá convencer seus sequestradores de que não renegará sua promessa e revelará suas identidades? O refém precisa descobrir um modo de alterar os ganhos do jogo. Em especial, ele precisa encontrar uma maneira de se autoimpor um custo, caso identifique os sequestradores. (...Por exemplo:) convencer os sequestradores a fotografá-lo em uma situação embaraçosa e deixar a foto com eles.


737 - Esse tipo de estratégia é conhecido como “troca de reféns”. Na Idade Média, quando dois reis queriam garantir que um contrato não fosse rompido, eles trocavam reféns, como pessoas da família. Se um dos reis rompesse o contrato, os reféns seriam sacrificados.


738 - Deu mais um exemplo interessante com porcos. Só entendi a dinâmica da coisa ao ler tudo.


739 - Também coloca que, pela teoria dos jogos, a tendência seria velhos não pouparem de modo a serem sustentados pelos jovens no futuro, que não vão deixar aquelas pobres pessoas morrerem de fome. E, se pouparam, porque os jovens os ajudariam? Iriam é esbanjar e negligenciar os idosos. Daí deduz que uma contribuição compulsória para a aposentadoria é algo bem prudente, pela "falta de incentivos" natural da coisa.


740 - Pela definição de "extorsão" de Varian, todo monopólio pratica: ...Iremos supor que o valor que o proprietário atribui à mudança da cor da pintura seja de US$1.500 e que, de fato, o custo da pintura seja de US$200. Começando pelo alto da árvore, se o empreiteiro cobrar US$1.500, ele auferirá um lucro de US$1.300, enquanto o cliente obterá uma utilidade líquida igual a zero. O proprietário, no exemplo, paga porque contratar outro empreiteiro custaria mais que US$1.300 em tempo perdido. Premissa meio esquisita, mas ok...


741 - ...O problema pode ser este: ...o cliente relutará em contratar empreiteiros com fama de extorsionários, o que obviamente é ruim para o empreiteiro. (...) Esse efeito da reputação pode ser examinado num contexto de jogos repetidos em que a extorsão presente terá no futuro um custo para o empreiteiro. Afinal, não é um monopólio. 


742 - ...Como as empresas resolvem esses problemas de extorsão? A resposta básica está nos contratos. Normalmente, os empreiteiros negociam contratos especificando que tipos de alteração na obra são possíveis e como serão calculados seus custos. Às vezes, recorre-se à arbitragem ou a outros processos de solução de litígios embutidos nos contratos. Muito tempo, energia e dinheiro são dedicados à elaboração de contratos para garantir que não ocorrerá qualquer extorsão.


743 - Modelo de negociação de Rubinstein: é uma parada meio "Salomão" menos drástico: Alice e Beto, têm de dividir entre eles US$1. Eles concordam em destinar no máximo três dias à negociação da divisão. No primeiro dia, Alice faz uma oferta. Beto pode aceitar ou voltar no dia seguinte com uma contraproposta. E, no terceiro dia, Alice tem de fazer uma oferta final. Se não chegarem a um acordo nesses três dias, os dois ficarão com zero. Disso deduz umas fórmulas chatas baseadas no tempo - "ganho futuro" do valor do dólar, ao que entendi - que a negociação toda tomará. De toda forma, admite que a vantagem é claramente de Alice, que pode ficar até com "todo" ganho a depender dessa "preferência temporal" aí, ou sei lá como chamar. Enfim, não entendi porque é útil um modelo tão injusto, nem em que se aplica. 




744 - Depois ele foi mais realista com a coisa toda. As pessoas pensam pouco em tempo e às vezes preferem zero a ver o outro se dando bem de forma injusta. "De acordo com a teoria, deve ser proposto algo como US$0,99 para Alice, US$0,01 para Beto. Beto, considerando que US$0,01 é melhor do que nada, aceita, e Alice vai para casa feliz por estar estudando economia. (...) Infelizmente a coisa não funciona assim. Um resultado mais provável é que Beto, furioso com a proposta indecorosa de US$0,01, diga “de jeito algum” e Alice acabe sem nada. Reconhecendo essa possibilidade, Alice tenderá a adoçar a oferta. Experimentos feitos com estudantes americanos mostram que a oferta média é de US$0,45 e que essa divisão tende a ser aceita na maioria dos casos. (...) Os jogadores que fazem a proposta estão agindo racionalmente, no sentido de que os US$0,45 estão próximos de maximizar o ganho esperado, dada a frequência observada da rejeição"


EXERCÍCIOS


745 - Só pra fixar: P = Num equilíbrio de Nash entre duas pessoas, cada jogador está dando a melhor resposta a quê? Numa estratégia dominante de equilíbrio, cada jogador está dando a melhor resposta a quê?; R = Em um equilíbrio de Nash, cada jogador está dando uma melhor resposta à melhor resposta de seu adversário. Num equilíbrio de estratégia dominante, cada escolha do jogador é uma melhor resposta a qualquer escolha feita pelo outro jogador.


746 - P = O texto afirma que linha acerta 62% do tempo no equilíbrio. De onde sai esse número?; R = É o ganho esperado de linha na estratégia de equilíbrio, quando chuta para a esquerda com probabilidade 0,7, enquanto coluna pula para a esquerda com probabilidade 0,6. Temos de somar os resultados de linha em quatro eventos: a probabilidade de que linha chute para a esquerda e coluna defenda à esquerda × o ganho de linha nesse caso + a probabilidade de que linha chute para a direita e coluna defenda à esquerda × o ganho de linha nesse caso, e assim por diante. Os números são (0,7)(0,6)50 + (0,7)(0,4)80 + (0,3)(0,6)90 + (0,3)(0,4)20 = 62.


.


Comentários