class: center, middle, inverse, title-slide .title[ # EAE-1301: Teoria dos Jogos ] .author[ ### Pedro Forquesato
http://www.pedroforquesato.com
Sala 217/FEA2 -
pforquesato@usp.br
] .institute[ ### Departamento de Economia
Universidade de São Paulo ] .date[ ### 2024/2 - Tópico 1: Jogos estáticos de informação completa ] --- class: inverse, middle, center # Fundamentos da teoria dos jogos --- class: middle ## Jogos O que é um jogo? Podemos voltar ao primeiro artigo acadêmico de teoria dos jogos, Von Neumann (1928). "On the theory of games of strategy": > Hence we must first endeavor to find a clear formulation of the question. What, exactly, is a game of strategy? A great many different things come under this heading, anything from roulette to chess, from baccarat to bridge. And after all, any event - given the external conditions and the participants in the situation (provided the latter are acting of their own free will) - may be regarded as a game of strategy if one looks at the effect it has on the participants. (Footnote: This is the principal problem of classical economics: how is the absolutely selfish 'homo economicus" going to act under given external circumstances?) [Von28] --- class: middle ## Teoria dos Jogos A teoria dos jogos estuda modelos lógico-matemáticos de como **agentes racionais** tomam decisões em situações em que o resultado dessas decisões dependem das ações de outros agentes A teoria dos jogos **não** estuda o comportamento de humanos reais em tais interações, mas entendendo o que um agente puramente lógico faria, isso nos dá claridade sobre conceitos importantes como *barganha*, *reputação*, *credibilidade*, *comunicação*, *cooperação*, *incentivos*, etc Por isso, a teoria dos jogos tem aplicações em economia, ciência política, relações internacionais, estratégia, além de mais recentemente se tornar importante em computação --- class: middle ## Teoria dos Jogos Quando há motivo para crer que seres humanos agem parecidos com a predição lógica dos modelos, a teoria dos jogos tem valor **positivo** como predição do que vai acontecer no mundo real (p. ex. teoria de leilões) Como todo resultado de ciência positiva, se os jogos realmente descrevem o comportamento das pessoas é *testável empiricamente* (na teoria dos jogos comportamental ou experimental) Em algumas situações (mas nem sempre!), mesmo que as pessoas reais não ajam como na teoria dos jogos, ela pode ter valor **normativo** como a forma pela qual as pessoas *deveriam* se comportar (e.g., xadrez) --- class: middle ## Esse curso Cobriremos os principais temas de teoria dos jogos *não-cooperativos*: jogos estáticos de informação completa (parte 1), jogos dinâmicos de informação perfeita e imperfeita (parte 2) e jogos de informação incompleta (parte 3) As aulas expositivas focarão principalmente na teoria, e vamos discutir aplicações e jogos importantes nos workshops de exercícios, para vocês refletirem por si mesmos sobre esses problemas O que não vamos cobrir: em particular, temas importantes que não vamos cobrir são teoria dos jogos cooperativa, jogos de matching, e implementação e desenho de mecanismo --- class: middle ## Jogos Como o nome diz, a teoria dos jogos estuda **jogos**, que podem ser literalmente jogos, como xadrez, Hex, Nim, ou Poker; ou podem ser modelos que representam de forma simples interações entre agentes Um jogo é representado por: 1. um conjunto de **jogadores** 2. cada jogador tem um conjunto (potencialmente diferente) de **ações** 3. cada jogador tem **preferências** entre os diferentes *perfis de ações* que podem ser resultantes do jogo --- class: middle ## O dilema dos prisioneiros Sem dúvidas o mais importante e famoso jogo na teoria dos jogos é o **dilema dos prisioneiros** (e voltaremos a ele diversas vezes ao longo desse curso) Nele, Ana e Bernardo estão na prisão esperando indiciamento. A evidência é suficiente para condenar ambos por caixa 2 (com tempo de prisão de 2 anos), mas se um dos dois fazer delação premiada, ele fica apenas 1 e o outro é preso por corrupção passiva (pena de 5 anos) — se ambos confessarem, os dois são presos pelo crime mais grave, mas com atenuante (pena de 4 anos) Frequentemente estudaremos situações estilizadas como acima, mas elas guardam em si lições importantes sobre o mundo real --- class: middle ## O dilema dos prisioneiros Como representamos esta situação na forma de um *jogo*? Cada jogo tem (pelo menos) os três componentes que citamos anteriormente — no caso do nosso dilema dos prisioneiros, são: 1. **Jogadores:** Ana e Bernardo 2. **Ações:** Ana e Bernardo podem cooperar ou confessar 3. **Preferências:** Ana: para ela, (confessar, cooperar) é melhor que (cooperar, cooperar), que é melhor que (confessar, confessar), e o pior é (cooperar, confessar) — Bernardo: (cooperar, confessar) `\(\succ\)` (cooperar, cooperar) `\(\succ\)` (confessar, confessar) `\(\succ\)` (confessar, cooperar) Nesse curso vamos apenas(\*) estudar *jogos finitos*, em que o número de jogadores e o número de estratégias são ambos finitos --- class: middle ## Preferências Para alguns propósitos, tudo o que precisamos são das preferências **ordinais** dos jogadores (o que é melhor que o quê) — mas quando chegarmos em *estratégias mistas*, isto é, probabilidades sobre estratégias, isso não será mais suficiente: precisaremos de preferências **cardinais** Então por consistência vamos desde o começo darmos valores numéricos para o *payoff* de cada jogador com cada perfil de ações: a **utilidade** `\(v_i (a_i, a_{-i})\)` E vamos daqui em diante *supor* que se um agente ganha *payoff* de `\(5\)` com probabilidade `\(1/2\)` e `\(7\)` com probabilidade `\(1/2\)`, então a sua utilidade é `$$\frac{1}{2}5 + \frac{1}{2}7 = 6$$` --- class: middle ## Forma normal Há infinitas matrizes de *payoffs* que representam o dilema dos prisioneiros, uma delas é: <img src="figs/week-1-fig-1b.png" width="30%" style="display: block; margin: auto;" /> Essa representação de jogos (especialmente de 2 jogadores), em que as linhas são as ações do jogador 1 (Ana) e as colunas as ações do jogador 2 (Bernardo) com os *payoffs* de cada perfil em forma de bimatriz (o 1o número é do jogador 1, o 2o do jogador 2) é chamada de **jogo na forma normal** --- class: middle ## Informação completa Mas há mais uma classe de suposições que estão "escondidas" por trás desse jogo em forma normal: que os jogadores sabem (i) quem são os outros jogadores, (ii) quais ações cada jogador tem, e (iii) os *payoffs* de todos os jogadores para cada perfil de ações Na verdade, precisamos de *muito* mais do que isso: precisamos que cada jogador saiba que os outros jogadores sabem que ele sabe que eles sabem que ele sabe... — chamamos essa iteração de **conhecimento comum** Quando supomos que todos os componentes do jogo são de *conhecimento comum* dizemos que temos um **jogo de informação completa** --- class: middle ## Estratégias Resta um conceito para definirmos antes de começarmos a resolver os jogos: as *estratégias* dos agentes, isto é, o que eles planejam jogar Uma **estratégia pura** elenca para cada situação discernível pelo agente em que ele é chamado a jogar uma *ação*: nos jogos mais simples que analisamos nessa 1a parte do curso, uma estratégia pura é equivalente a uma ação (por exemplo, cooperar ou confessar) — mas mais frente no curso não será não! Uma **estratégia mista** é uma distribuição de probabilidade *sobre as estratégias puras*: por exemplo, cooperar com probabilidade 1/3 e confessar com probabilidade 2/3 — como probabilidade pode ser 1 e 0, estratégias puras são triviamente mistas --- class: middle ## A guerra dos sexos Outro jogo famoso que veremos várias vezes ao longo do curso é a **guerra dos sexos**, de Luce e Raiffa (1957) <img src="figs/week-1-fig-0.png" width="25%" style="display: block; margin: auto;" /> Ao contrário do dilema dos prisioneiros, a guerra dos sexos é uma forma de **jogo de cooperação**: Ana e Bernardo querem sempre ir ao mesmo evento, por mais que Ana goste mais de ópera e Bernardo goste mais de futebol --- class: middle ## Jogos estáticos Vamos começar com a análise de jogos onde os jogadores escolhem as suas ações simultaneamente e sem observar as ações dos outros Situações que ocorrem uma única vez e os jogadores decidem simultaneamente as suas ações, como o dilema dos prisioneiros ou a guerra dos sexos, são especialmente propícios para se modelar na *forma normal* Chamamos esse tipo de interação estratégica de *jogos estáticos* (quando o aspecto temporal não é relevante) — se supormos também conhecimento comum de todos os aspectos do jogo, temos **jogos estáticos de informação completa** --- class: middle ## Conceitos de solução Agora só falta *resolver* os jogos! Para isso precisamos definir um **conceito de solução**: uma regra formal que dita como um jogo será/deveria ser jogado Frequentemente, um conceito de solução não gera respostas precisas sobre qual será o resultado do jogo: para restringir essas previsões, boa parte do desenvolvimento da teoria dos jogos envolveu criar conceitos mais restritos de equilíbrio, os **refinamentos** Cada conceito de solução representa uma diferente *suposição sobre como os jogadores tomam decisões*: portanto, diferentes conceitos podem ser mais razoáveis em diferentes aplicações --- class: middle <img src="figs/week1-fig18.png" width="25%" style="display: block; margin: auto;" /> Alguns **conceitos de solução** (não todos) que vamos cobrir no curso (e um que não vamos), e a relação entre eles: uma seta entre um conceito e outro indica que o conjunto de soluções do primeiro está contido no segundo, isto é, ele é um **refinamento** do segundo conceito --- class: middle, center, inverse # Racionalidade e dominância (Tadelis, cap. 4) --- class: middle ## Racionalidade A princípio, jogadores podem escolher as suas estratégias por qualquer motivo ("o nome tem mais letras", "eu gosto de escolher sempre a primeira opção", etc) A suposição mais plausível que podemos fazer (pelo menos na maioria dos casos) é que os agentes são **racionais** — intuitivamente, isso quer dizer que eles buscam no jogo, dado o que acreditam que os outros jogadores vão fazer, obter resultados que eles preferem Mas como veremos, em muitas situações ser "mais racional" pode levar a *payoffs* bem menores do que agentes "menos racionais" --- class: middle <img src="figs/week-1-fig-0.png" width="33%" style="display: block; margin: auto;" /> Voltemos agora à **guerra dos sexos**: o que podemos dizer sobre quais estratégias que jogadores *racionais* irão escolher? --- class: middle ## Racionalidade A resposta é *nada*! Se Ana acredita que Bernardo vai ao futebol, ela quererá ir ao futebol; se ela acredita que Bernardo vai à ópera, ela quererá ir à ópera: sem saber quais são as *crenças* de Ana, não podemos saber o que ela vai jogar Mesmo Ana e Bernardo sendo completamente racionais, não há por que esperar que não aconteça de Ana ir ao futebol e Bernardo vá à ópera, ambos não se encontrando e tendo *payoff* zero A ideia desse primeiro tópico é tentar definir quais resultados dos jogos podem acontecer se assumirmos apenas que os agentes são racionais: na guerra dos sexos, tudo pode acontecer! --- class: middle ## Dominância A restrição mais óbvia sobre racionalidade é que um jogador racional não deveria nunca jogar uma ação que é *sempre* pior que alguma outra, e deveria sempre jogar alguma ação que é *sempre* melhor que *todas* as outras **Afirmação 1:** Se uma opção é estritamente melhor que todas as outras *não importa a estratégia do(s) oponente(s)*, então um jogador racional sempre vai escolher ela — chamamos esse tipo de estratégia de **estritamente dominante** **Afirmação 2:** Um jogador racional nunca irá escolher uma estratégia que é sempre estritamente pior que alguma outra *não importa a estratégia do(s) oponente(s)* — chamamos esse tipo de estratégia de **estritamente dominada** --- class: middle <img src="figs/week-1-fig-1b.png" width="40%" style="display: block; margin: auto;" /> Se a Ana escolhe cooperar, ela recebe -2 caso Bernardo coopere e -5 caso ele confesse; se Ana escolhe confessar, ela recebe -1 caso Bernardo coopere e -4 caso ele confesse — ou seja, *confessar é estritamente dominante* Se Ana é racional, ela deve sempre confessar! Como o jogo é *simétrico*, o mesmo vale para Bernardo: se ele for racional, deve sempre confessar! --- class: middle ## Equilíbrio em estratégias dominantes Esse raciocínio nos leva ao nosso primeiro *conceito de solução* do curso: o **equilíbrio em estratégias dominantes** (EED) O EED é o conceito de solução mais forte em teoria dos jogos: *se* ele existir, ele sempre vai ser *único*, e é o que depende de menos suposições sobre os jogadores para ser crível — tudo o que precisamos é que sejam racionais! A sua aplicabilidade é rara, entretanto: poucos jogos são como o dilema dos prisioneiros em que todos os jogadores têm estratégias dominantes — em geral precisaremos de mais suposições para resolver um jogo --- class: middle ## Equilíbrio em estratégias dominantes Parece à primeira vista que como em um EES todos os jogadores estão jogando cada um uma estratégia que é *sempre* melhor que as outras, então os jogadores estariam garantindo o seu melhor *payoff* possível no jogo Isto é, que a alocação seja **eficiente de Pareto**: não há outra alocação (resultado) possível do jogo que seja melhor para todos os jogadores O apelo do dilema dos prisioneiros é mostrar da forma mais simples possível que essa intuição está errada! O EES do jogo **não** é eficiente de Pareto: o perfil `\((M, M)\)`, com *payoff* `\((-2,-2)\)` é estritamente melhor para ambos! --- class: middle ## O dilema dos prisioneiros > The idea that groups tend to act in support of their group interests is supposed to follow logically from this widely accepted premise of rational, self-interested behavior. In other words, if the members of some group have a common interest or object, and if they would all be better off if that objective were achieved, it has been thought to follow logically that the individuals in that group would, if they were rational and self-interested, act to achieve that objective. Olson (1965) apud Historicamente, o *dilema dos prisioneiros* foi importante para se contrapor à visão acima, comum no começo do século XX, de que agentes racionais sempre deveriam se coordenar para evitar situações ruins para todos --- class: middle ## Crenças e melhor-resposta Para irmos além, é bom definir de forma mais precisa alguns conceitos: primeiro, uma **crença** (determinística) de um jogador `\(i\)` é um perfil de estratégias dos outros jogadores `\(s_{-i}\)` que ele acredita que será jogado Estratégia `\(s_i\)` é uma **melhor-resposta** a uma crença determinística dos outros jogadores `\(s_{-i}\)` se não há outra estratégia que dê *payoff* (estritamente) maior contra esse perfil de estratégias que `\(s_i\)` A ideia de melhor-resposta nos dá outra afirmação sobre o comportamento de agentes racionais, e a nossa definição (formal) de racionalidade --- class: middle ## Racionalidade **Afirmação 3 (Racionalidade):** Um jogador racional que acredite que os outros jogadores escolherão um perfil de estratégias `\(s_{-i}\)` sempre irá jogar uma melhor-resposta para `\(s_{-i}\)` Se essa é a nossa definição de *racionalidade*, então é importante que ela implique afirmações 1 e 2: e de fato é fácil mostrar que uma estratégia estritamente dominada nunca é melhor-resposta Ademais, dizemos que um jogador `\(i\)` **acredita na racionalidade de `\(j\)`** se as crenças de `\(i\)` sempre colocam probabilidade zero em estratégias de `\(j\)` que não são racionais --- class: middle <img src="figs/week-1-fig-4.png" width="60%" style="display: block; margin: auto;" /> Achemos as estratégias **racionais** no jogo acima, isto é, aquelas que são melhor-resposta para alguma crença dos jogadores sobre as estratégias do outro jogador --- class: middle <img src="figs/week-1-fig-3.png" width="55%" style="display: block; margin: auto;" /> Analisemos agora o jogo acima. Podemos dizer algo mais sobre qual será o resultado do jogo entre agentes racionais? --- class: middle ## Crenças de ordem superior No jogo, C é dominada para o jogador 2, então ele sendo racional nunca irá jogá-la — isso quer dizer que o jogador 1 pode desconsiderar R? *Depende!* Apenas se 1 for racional **e** *acreditar que o jogador 2 é racional* Se 1 acredita que 2 não jogará C, ele deve jogar U, que é estritamente dominante sem C — mas 2 pode assumir que 1 jogará U apenas se ele é racional **e** *acredita que o jogador 1 acredita que ele é racional* O primeiro parágrafo representa uma **crença de 1ª ordem na racionalidade**, enquanto o segundo uma *crença de 2ª ordem*, se 1 assumir que 2 tem crença de 2ª ordem na racionalidade dele, então ele está tendo uma *crença de 3ª ordem na racionalidade*, e assim em diante --- class: middle ## Racionabilidade Se todos os jogadores são racionais e têm crenças de `\(k\)`-ésima ordem na racionalidade dos outros jogadores, para todo número (natural) `\(k\)`, então dizemos que há **conhecimento comum de racionalidade** Se há conhecimento comum de racionalidade, então podemos ir retirando iterativamente estratégias que não são melhor-resposta para nenhuma estratégia que se mantém no jogo, até não haver mais estratégias que possam ser removidas Esses perfis de estratégias que permanecem formam o nosso segundo conceito de solução do curso: os perfis de estratégias **racionalizáveis** (o que é diferente de racionais!) --- class: middle <img src="figs/week1-fig12.png" width="55%" style="display: block; margin: auto;" /> Considere agora uma versão do dilema dos prisioneiros em que o jogador 1 pode aceitar a culpa sozinho e livrar o outro jogador (ação `\(X\)`) — nesse caso ele pega 6 anos de prisão e o jogador 2 vai livre se ficou em silêncio, mas pega 1 ano de cadeia caso tenha delatado: a adição de uma estratégia claramente irrazoável torna cooperar *racional*! (mas não *racionalizável*) --- class: middle ## Eliminação iterada A **racionabilidade** só mantém no jogo estratégias que para alguma crença *compatível com conhecimento comum de racionalidade* que um jogador tenha, essa estratégia seria uma melhor-resposta para tal crença Como vimos pela **Afirmação 2**, um jogador racional jamais escolherá uma *estratégia estritamente dominada* — podemos então para cada jogador eliminar tais estratégias que um jogador racional jamais faria E igualmente, um jogador que *acredite na racionalidade* do outro jogador nunca vai crer que ele jogará estratégias estritamente dominadas, e assim em diante, da mesma forma como fizemos com *racionabilidade* --- class: middle ## Eliminação iterada de estratégias dominadas Se um jogador `\(i\)` sabe que `\(j\)` é racional, então ele pode eliminar de consideração as estratégias de `\(j\)` que são estritamente dominadas, e escolher a sua estratégia no jogo reduzido — se `\(j\)` crê que `\(i\)` crê que ele é racional, então `\(j\)` sabe que `\(i\)` não escolherá estratégias dominadas quando ignorando estratégias que `\(j\)` nunca utilizaria, e assim em diante Seguindo esse processo "infinitamente", supondo *conhecimento comum de racionalidade*, aplicamos o nosso terceiro conceito de solução do curso: a **eliminação iterada de estratégias estritamente dominadas** (EIEED) --- class: middle <img src="figs/week-1-fig-3.png" width="55%" style="display: block; margin: auto;" /> Quais estratégias sobrevivem a *eliminação iterada de estratégias estritamente dominadas* no jogo acima? --- class: middle ## Resolvível por dominância No jogo anterior, há apenas um perfil de estratégias que sobrevive EIEED (e racionabilidade): é possível cravar o resultado do jogo mesmo assumindo apenas *conhecimento comum de racionalidade* (dizemos que um jogo assim é **resolvível por dominância**) Ainda que esse requerimento seja (muito!) mais forte que apenas racionalidade (como no EED), ainda assim é bem mais leve que quaisquer das outras noções de equilíbrio que veremos adiante no curso É fácil demonstrar que não faz diferença a ordem em que realizamos na eliminação EIEED para a obtenção dos perfis de estratégia sobreviventes --- class: middle ## Dominança fraca Uma estratégia ser estritamente dominante faz dela bastante convincente, mas é fácil imaginar que esse tipo de situação é bem rara em aplicações — um tipo muito mais comum de acontecer é a estratégia fracamente dominante Uma **estratégia fracamente dominante** é tal que para qualquer outra estratégia, ela é sempre tão boa quanto e pelo menos em um caso estritamente melhor Ao contrário do EED, mesmo que todos os jogadores tenham estratégias fracamente dominantes, elas não formam uma solução natural e única para o jogo, e teremos que usar algum outro conceito de solução --- class: middle ## Estratégias fracamente dominadas Por outro lado, uma estratégia é dita **fracamente dominada** se existe alguma outra estratégia que é sempre tão boa quanto, e para pelo menos um perifl de estratégias dos outros jogadores, é estritamente melhor Intuitivamente, um jogador está sendo bastante "imprudente" se ele escolhe uma estratégia fracamente dominada: por mais que não seja irracional (se ele crê que os outros jogadores escolherão um perfil para o qual ela é melhor-resposta), ele não *ganha nada* se estiver certo, mas pode perder muito se estiver errado! Da mesma forma que com EIEED, podemos pensar em processos de **eliminação iterada de estratégias fracamente dominadas** (EIEFD) --- class: middle <img src="figs/week1-fig17.png" width="45%" /><img src="figs/week1-fig17b.png" width="45%" /> Dois exemplos de propriedades indesejáveis da EIEFD: (i) a ordem de eliminação de estratégias fracamente dominadas altera os perfis de estratégia sobreviventes (nada bom), e ainda pior: (ii) a EIEFD também remove equilíbrios de Nash do jogo (e equilíbrios diferentes dependendo da ordem!) --- class: middle, center, inverse # Equilíbrio de Nash em estratégias puras (Tadelis, cap. 5) --- class: middle ## Solução e equilíbrio Até aqui vimos 2 conceitos de *solução* que nos dão respostas precisas sobre o resultado de um jogo: 1. O **equilíbrio em estratégias dominantes** é a mais convincente solução na teoria dos jogos: ela depende apenas da racionalidade dos jogadores, e vale independentemente das crenças deles sobre a ação dos oponentes — infelizmente, raramente ela "morde" 2. Quando o jogo é **resolvível por dominância**, o perfil resultante é também uma solução convincente (mas menos, porque demanda conhecimento comum de racionalidade) — mas igualmente, em geral jogos não são resolvíveis por dominância De resto, a EIEED e racionabilidade apenas pode restringir "o tamanho" do jogo — não podemos avançar na análise sem suposições mais fortes --- class: middle ## Conceitos de equilíbrio E talvez poderíamos argumentar (e certamente tem quem argumente) que *não deveríamos* avançar mais do que isso: deveríamos remover as ações estritamente dominadas (ou nunca melhor-resposta) e simplesmente dizer que todos os outros resultados são possíveis ¯\\\_(ツ)_/¯ Compreensivelmente, tal recomendação encontrou pouca aceitação entre os teoristas dos jogos, e especialmente entre os pesquisadores aplicados: para cada jogo, eles queriam uma solução (equilíbrio) que *sempre exista* e nos dê um (e preferencialmente apenas um!) perfil de estratégias resultantes Para isso precisamos de hipóteses mais heróicas sobre os nossos jogadores --- class: middle ## Equilíbrio de Nash O conceito (de longe) mais importante em teoria de jogos é o de equilíbrio de Nash — começaremos com uma definição que (reconhecidamente) não é a mais natural, mas que clarifica o tamanho do salto que estamos dando da seção anterior para cá Um *perfil* de estratégias `\((s^*_1, s^*_2, ..., s^*_i,...,s^*_N)\)` é um **equilíbrio de Nash** (EN) quando: (i) é conhecimento comum que todos os jogadores são racionais; (ii) é conhecimento comum que o jogador `\(1\)` acredita que os outros jogadores jogarão `\(s^*_{-1}\)`, o jogador `\(2\)` acredita que os outros jogadores jogarão `\(s^*_{-2}\)`, etc, e que *eles estão certos* --- class: middle ## Equilíbrio de Nash Vimos já que um jogador racional sempre irá jogar uma melhor-resposta para a sua crença do que o outro jogador irá jogar — o equilíbrio de Nash adiciona a condição de que é conhecimento comum que essas crenças *são iguais entre os jogadores* e que elas *estão certas* Voltemos à guerra dos sexos: quais são os equilíbrios de Nash do jogo? <img src="figs/week-1-fig-0.png" width="30%" style="display: block; margin: auto;" /> --- class: middle ## A guerra dos sexos Já vimos que todas as estratégias são racionalizáveis na guerra dos sexos (ou de outra forma nenhuma estratégia é estritamente dominada), o que implica que todos os perfis de estratégia podem ocorrer com jogadores racionais! É possível que Ana ache que Bernardo vai ao futebol e vá então ver futebol (sua melhor-resposta à sua crença), enquanto Bernardo ache que Ana vai à ópera e vá ele à ópera (sua melhor-resposta) — mas daí eles vão se desencontrar! Mas esse *não* é um equilíbrio de Nash, pois *as suas crenças estão erradas*: os únicos equilíbrios de Nash em estratégias puras são `\((O,O)\)` e `\((F,F)\)` --- class: middle ## Equilíbrio de Nash Um perfil de estratégias puras `\((s_1^*, s_2^*, ..., s_N^*)\)` é um **equilíbrio de Nash em estratégias puras** quando para cada jogador `\(i\)`, `\(s_i^*\)` é *melhor-resposta* para `\(s^*_{-i}\)`, i.e, para toda outra estratégia `\(s_i\)` do jogador `\(i\)`: `$$u_i (s_i^*, s^*_{-i}) \geq u_i (s_i, s^*_{-i})$$` O equilíbrio de Nash é um conceito de **estabilidade** — o perfil de EN é *estável a desvios unilaterais*: se por acaso a situação normal (seja lá o que for isso) é jogar um equilíbrio de Nash, então ninguém desejará *sozinho* desviar --- class: middle <img src="figs/blackrock.jpg" width="65%" style="display: block; margin: auto;" /> --- class: middle ## Por que jogar equilíbrios de Nash? Se jogadores pudessem conversar antes do jogo e *se* eles concordassem em algum perfil de estratégias, então esse perfil teria que ser um EN (mas por que concordariam? E não deveria isso fazer parte da descrição do jogo?) Se o jogo é repetido com jogadores *ingênuos* atualizando sua estratégia com base nos *payoffs* passados, então essa população tenderá a convergir a algum(ns) ENs (tal estudo é parte da *teoria dos jogos evolucionária*) [Mai98] Também **normas e convenções sociais** podem *coordenar* ações em um EN (o que Schelling (1960) chama de **pontos focais**): em uma sociedade patriarcal, pode parecer razoável que Ana e Bernardo ambos esperem se encontrar no futebol (o favorito dele), e se crerem isso nenhum dos dois irá querer desviar --- class: middle ## Por que jogar equilíbrios de Nash? Uma variante das convenções é o *aprendizado de jogo*: se os agentes pudessem aprender sobre o seu oponente em vários *jogos fictícios* antes do jogo "de verdade", é razoável que eles eventualmente convergiriam para um EN No fim do dia, o máximo que podemos dizer é que **se** há uma "forma óbvia" de se jogar o jogo, ela tem que ser um equilíbrio de Nash — ele nos dá então uma condição necessária, mas não suficiente, para "resolvermos" o jogo Em um jogo de coordenação, todos dirigirem do lado esquerdo da rua ou todos do lado direito ambos vão ser EN — qual deles se aplica dependerá do contexto e da nossa intuição (problema de **seleção de equilíbrio**) --- class: middle ## Algoritmo para encontrar equilíbrios Uma terceira forma de ver o equilíbrio de Nash é como um *ponto-fixo* da *correspondência* de melhor-resposta dos jogadores Essa perspectiva é útil para (além de provar a existência de equilíbrio, que não faremos aqui) nos dar o seguinte algoritmo para encontrar EN Para cada estratégia (por enquanto ação) dos oponentes (linhas para o jogador 2 e colunas para o jogador 1), marcar a sua melhor-resposta — quando acharmos um "ponto-fixo" (linha `\(k\)` é melhor-resposta para coluna `\(j\)` e coluna `\(j\)` é a melhor-resposta para linha `\(k\)`) temos um equilíbrio de Nash --- class: middle <img src="figs/week-1-fig-3.png" width="55%" style="display: block; margin: auto;" /> Usemos o algoritmo do slide anterior para encontrar os equilíbrios de Nash do jogo acima --- class: middle ## Equilíbrios de Nash e dominância O EN tem as sequintes relações com os conceitos vistos até aqui: 1. Um EN nunca pode dar probabilidade positiva para estratégias estritamente dominadas (mas fracamente dominadas sim!!) 2. Um EN sempre envolve apenas estratégias racionalizáveis e que nunca desaparecem no processo de EIEED 3. Um equilíbrio em estratégias dominantes sempre é EN, e o único (por 1) 3. Se EIEED ou racionabilidade levam a um único perfil sobrevivente (*resolvível por dominância*), então ele é um EN, e de novo único (por 2) --- class: middle <img src="figs/week-1-fig-5.png" width="55%" style="display: block; margin: auto;" /> Como encontrar EN é tão importante (a base de tudo que veremos daqui em diante), façamos mais o exemplo acima --- class: middle, center, inverse # Estratégias mistas (Tadelis, cap. 6) --- class: middle ## Estratégias mistas Até aqui restringimos atenção a *estratégias puras* — mas e se Ana quiser jogar uma moeda para o alto e ir no futebol se der cara e na ópera se der coroa? A princípio não deveríamos excluir **estratégias mistas** desse tipo Isso pode ser importante, por exemplo, em *jogos de soma-zero*, em que frequentemente os jogadores não querem que o oponente saiba o que eles irão jogar (e lembrem-se que em um EN é conhecimento comum que as crenças estão corretas, ou seja, todos sabem as estratégias de todos!) Outra importância é mais "teórica": acontece que apenas permitindo estratégias mistas podemos *garantir que sempre exista um equilíbrio de Nash* --- class: middle ## Matching pennies Considere o jogo de *soma-zero* "par ou ímpar" (**matching pennies**): dois jogadores decidem ao mesmo tempo se mostram um número par de dedos ou ímpar, e 1 ganha se a soma der par e 2 se a soma for ímpar Se o jogador 1 crê que o jogador 2 escolherá *par* (por exemplo), então ele deve escolher *par*, mas se o jogador 2 acredita que o jogador 1 escolherá *par*, ele racionalmente escolherá *ímpar*! Ou um dos jogadores não é racional ou está errado em suas crenças: não pode haver EN em estratégias puras! Outro jogo também de *soma-zero* é o "pedra, tesoura ou papel" (aka Jokenpô), ele tem equilíbrio de Nash em estratégias puras? --- class: middle ## Estratégias mistas Uma forma de um jogador deixar os outros jogadores incertos sobre qual será a sua *ação*, mesmo dado que em equilíbrio as crenças dos outros jogadores sobre a *estratégia* dele estejam corretas, é uma estratégia que aleatorize sobre as suas ações! Uma **estratégia mista** é uma distribuição de probabilidade sobre o conjunto de *estratégias puras* (não ações!) daquele jogador — congruentemente, a partir daqui também permitiremos que os jogadores tenham *crenças probabilísticas* sobre o que as estratégias dos outros jogadores --- class: middle ## Estratégias mistas Se um jogador tem como possíveis estratégias puras (ações) `\(\{s_{i1}, s_{i2}, s_{i3}\}\)`, então estratégias mistas são da forma `\((p_1, p_2, p_3)\)`, onde `\(p_k\)` é a probabilidade do jogador escolher a estratégias `\(s_{ik}\)`, e: `$$p_1,\ p_2,\ p_3 \geq 0\text{ e }p_1 + p_2 + p_3 = 1$$` Denotamos elas por `\(\sigma_i = (p_1, p_2, 1 - p_1 - p_2)\)`, onde já omitimos `\(p_3\)` por serem linearmente dependentes — então uma estratégia pura `\(s_{ik}\)` nada mais é que uma estratégia mista com `\(\sigma_i (s_{ik}) = 1\)` e `\(\sigma_i (s_{ij}) = 0\)` para `\(j \neq k\)` Uma **estratégia completamente pura** é uma tal que a probabilidade de toda estratégia é estritamente positiva, i.e., `\(\sigma_i (s_{ik}) > 0\)` para todo `\(k\)` --- class: middle ## Estratégias mistas Estratégias mistas generalizam as puras: quando falarmos em "estratégias" nos referiremos sempre a estratégias mistas (incluindo puras como parte) Note que mesmo que o jogo seja finito, como quase todos os jogos que veremos no curso, quando permitimos estratégias mistas agora o conjunto de escolha é um contínuo (um *simplex*, para os interessados) Estratégias mistas trazem dificuldades quando o conjunto de estatégias possíveis é contínuo: evitaremos esses problemas fazendo como quase todo mundo e consideraremos apenas estratégias puras nesse (raro) caso --- class: middle ## Estratégias e crenças Do mesmo jeito que estratégias, podemos pensar em crenças probabilísticas: uma **crença** de um jogador `\(i\)` é uma probabilidade `\(\pi_i (s_{-i})\)` para cada perfil de estratégias (puras) dos seus oponentes Assim temos que no *matching pennies*, se o jogador `\(1\)` acredita que o oponente jogará `\(\pi_1 (H) = 1/3\)` e `\(\pi_1 (T) = 2/3\)`, a sua **utilidade esperada** de jogar `\(H\)` é: `$$u \left(H, \frac{1}{3}\circ H + \frac{2}{3} \circ T\right) = \frac{1}{3} u\left(H, H \right) + \frac{2}{3} u\left(H, T \right) = \frac{1}{3} 1 + \frac{2}{3} (-1)$$` `$$= -\frac{1}{3}$$` --- class: middle ## Cálculo probabilístico O mesmo vale para estratégias mistas (com um pouquinho mais de conta): a utilidade esperada de uma estratégia mista `\(\sigma_i(H) = 1/2\)` e `\(\sigma_i (T) = 1/2\)` com as crenças do slide anterior é `$$u \left(\frac{1}{2}\circ H + \frac{1}{2}\circ T, \frac{1}{3}\circ H + \frac{2}{3} \circ T\right) = \frac{1}{6} u\left(H, H \right) + \frac{1}{6} u\left(T, H \right) +$$` `$$\frac{1}{3} u\left(H, T \right) + \frac{1}{3} u\left(T, T \right) = \frac{1}{6} - \frac{1}{6} - \frac{1}{3} + \frac{1}{3} = 0$$` --- class: middle ## Racionalidade com estratégias mistas O conceito de estratégias (e crenças) probabilísticas é muito importante para o que vimos antes: muitas vezes uma estratégia não é estritamente dominada por estratégias puras, mas o é por uma estratégia mista Analogamente, às vezes uma ação não é racionalizável por crenças em estratégias puras dos outros jogadores, mas é uma *melhor-resposta* para uma crença probabilística sobre as estratégias dos outros jogadores Embora introduzimos os conceitos de EIEED e racionabilidade usando estratégias puras por razões didáticas, todas as propriedades deles dependem da consideração também de estratégias mistas (ou crenças probabilísticas) --- class: middle <img src="figs/week1-fig7.png" width="40%" style="display: block; margin: auto;" /> Com essa nova arma sob os nossos braços, resolvamos então o jogo acima por *eliminação iterada de estratégias estritamente dominadas* --- class: middle ## Racionabilidade e EIEED Dado que a racionabilidade e o EIEED são "dois lados da mesma moeda", uma pergunta natural é se eles são equivalentes, isso é, os perfis de estratégia racionalizáveis são sempre os mesmos que sobrevivem a EIEED, e vice-versa Deve ser claro que não importa o jogo, uma estratégia estritamente dominada nunca será melhor-resposta, então o conjunto de estratégias que sobrevivem a EIEED contém o conjunto de estratégias racionalizáveis (este 2º é mais forte) O oposto também é verdade em jogos entre 2 jogadores (Pearce, 1984), mas com 3 ou mais a equivalência só se mantém se permitirmos crenças correlacionadas sobre as estratégias dos outros jogadores (vide questão 16) --- class: middle ## Equilíbrio de Nash em estratégias mistas A extensão do equilíbrio de Nash para estratégias mistas é direta: um *perfil* de estratégias mistas `\(\sigma^*\)` é um **equilíbrio de Nash** quando para todo jogador `\(i\)` `\(\sigma_i^*\)` é *melhor-resposta* para (a crença probabilística) `\(\sigma^*_{-i}\)`, isto é, para todo jogador `\(i\)` e toda estratégia mista `\(\sigma_i\)` de `\(i\)`: `$$u_i \left(\sigma_i^*, \sigma^*_{-i}\right) \geq u_i \left(\sigma_i, \sigma^*_{-i}\right)$$` --- class: middle ## Encontrando equilíbrios em estratégias mistas Encontramos ENs em estratégias mistas usando a **condição de indiferença**: uma estratégia mista só será um EN se o jogador estiver indiferente entre todas as estratégias puras jogadas com probabilidade positiva em equilíbrio Além disso, todas as estratégias puras jogadas com probabilidade zero têm que dar utilidade àquele jogador no máximo igual às estratégias puras jogadas com probabilidade positiva Nesse caso, o jogador poderia jogar qualquer coisa (ele está indiferente entre as estratégias com probabilidade positiva), mas o equilíbrio requer que ele escolha algo que satisfaça a condição de indiferença para os outros jogadores --- class: middle ## Matching pennies Voltemos ao "par ou ímpar". Sabemos que não há equilíbrio em estratégias puras, mas há em estratégias mistas? Chame `\(\sigma_1 (H) = p\)` e `\(\sigma_2(H) = q\)` Então a *condição de indiferença* requer que: `$$u\left(H, q \circ H + (1 - q) \circ T \right) = u\left(T, q \circ H + (1 - q) \circ T \right)$$` $$ = q u(H, H) + (1 - q) u(H, T) = q u(T, H) + (1 - q)u(T,T)$$ De onde vem que `\(q - (1-q)= (1-q) - q\)` ou `\(q = 1/2\)` — por simetria, temos que `\(p=1/2\)` também: o único EN do jogo é `\(\left( (1/2, 1/2), (1/2, 1/2) \right)\)` --- class: middle <img src="figs/week1-fig16.png" width="50%" style="display: block; margin: auto;" /> Acima desenhamos as **funções de melhor-resposta** (às vezes chamadas de curvas de reação) do *matching pennies* — o cruzamento das curvas representa o (único) *ponto-fixo* da correspondência de melhor-resposta, e portanto denota o (único) equilíbrio de Nash do jogo --- class: middle ## Existência Na verdade, que o *matching pennies* tenha equilíbrio de Nash não é uma surpresa, pois como John Nash (Nobel '94) mostrou em sua tese de doutorado, todo jogo finito tem algum equilíbrio de Nash **Teorema (Nash, 1950):** Todo jogo de `\(N < \infty\)` jogadores em que o conjunto `\(S_i\)` de estratégias puras é finito para todo jogador `\(i\)` tem ao menos um equilíbrio de Nash (em estratégias puras ou mistas) Note que em jogos infinitos (seja em número de jogadores ou ações) a existência de equilíbrio de Nash já não é mais necessariamente garantida --- class: middle ## O teorema do índice Outro teorema que é bastante útil para nossos propósitos é o **Teorema do Índice**, que diz que *quase todos* os jogos finitos em forma normal têm um número **ímpar** (e em particular finito) de equilíbrios de Nash O *quase todos* aqui é para evitar *payoffs* iguais para perfis de ações diferentes: dizemos que essa propriedade vale "geralmente" ou "com probabilidade 1", já que é muito mais provável que os *payoffs* sejam (talvez ligeiramente) diferentes do que exatamente iguais Esse teorema é ótimo para resolver jogos, pois o número de equilíbrios em estratégias puras (fácil de achar) nos dá uma dica de quantos equilíbrios em estratégias mistas o jogo tem — só tome cuidado com o "geralmente"! --- class: middle <img src="figs/week1-fig14.png" width="35%" style="display: block; margin: auto;" /> Quantos equilíbrios de Nash o jogo acima tem? --- class: middle ## Justificando estratégias mistas Se a pergunta "Por que as pessoas jogariam equilíbrios de Nash?" já deixa teoristas dos jogos acordados à noite, para equilíbrios envolvendo estratégias mistas o problema é *muito pior* Pois dado o perfil de estratégias de EN dos outros jogadores, o jogador `\(i\)` está *completamente indiferente* (entre as estratégias com probabilidade positiva): e ainda assim, temos que acreditar que ele vai escolher exatamente a aleatorização do EN, ainda que não ganhe absolutamente nada com isso! Novamente, uma justificativa é evolucionária; outra justificativa que veremos no final do curso é o *Teorema de Purificação de Harsanyi* --- class: middle ## Mecanismos de aleatorização Um conceito relacionado é a ideia de **mecanismos de aleatorização**: sinais aleatórios que é conhecimento comum que existem e que são observados pelos jogadores — e assim eles podem condicionar neles as suas estratégias! Esses mecanismos públicos são importantes porque eles podem gerar *correlações* nas estratégias dos agentes (dependendo da realização do mecanismo): ao contrário de estratégias mistas que precisam ser *independentes* entre diferentes jogadores Mecanismos de aleatorização são interessantes na teoria dos jogos porque eles expandem as possibilidades de equilíbrio --- class: middle ## Equilíbrio correlacionado Embora o mecanismo de aleatorização possa ser qualquer coisa, é mais prático (e equivalente) pensar que algum "observador" está *sugerindo* estratégias (puras) para cada jogador Um **equilíbrio correlacionado** é então um mecanismo de aleatorização e um perfil de estratégias sugeridas condicionadas no mecanismo de aleatorização, tal que jogar a estratégia sugerida pelo mecanismo é sempre pelo menos tão bom quanto qualquer outra estratégia possível, dadas as estratégias dos outros jogadores (também condicionais às mensagens deles) Notem que para cada jogador o observador só revela a sugestão *a ele*, embora cada sugestão pode ser correlacionada entre os jogadores (ou seja, a probabilidade é sobre um perfil de estratégias) --- class: middle <img src="figs/week1-fig15.png" width="35%" style="display: block; margin: auto;" /> De volta à **Batalha dos Sexos**, que possui um equilíbrio em estratégias mistas talvez pouco atrativo — mas se o casal estiver vendo cada um da sua casa um jogo de futebol da China vs Lituânia e for conhecimento comum que a probabilidade da China ganhar é `\(1/2\)`, eles conseguem fazer melhor que isso! --- class: middle <img src="figs/week1-fig19.png" width="40%" style="display: block; margin: auto;" /> Outro exemplo é o **jogo do trânsito** acima: em uma intersecção, dois carros podem ambos esperar (o que é ruim para ambos, pois não resolve nada), um esperar e o outro passar, que não é ruim para o primeiro mas melhor para o segundo, ou ambos avançarem, o que é o pior, pois gera um acidente! — embora o jogo tenha EN, a sociedade avançou para uma solução mais justa com um *mecanismo de aleatorização* (o semáforo) --- class: middle, center, inverse # Estratégias max-min e jogos de soma-zero (Osborne, cap. 11) --- class: middle ## Jogos de soma-zero **Jogos de soma-zero** foram historicamente os 1ºs a serem analisados [VM07], e são jogos *de 2 jogadores* em que os jogadores têm *interesse exatamente opostos*: se o jogador 1 ganha `\(1\)`, o jogador 2 perde `\(1\)`: os *payoffs* "somam zero" Exemplos já vimos o par ou ímpar e o jokenpô, mas também temos xadrez, damas, poker, esconde-esconde, pega-pega — geralmente "jogos" mesmo, mas também há várias aplicações em engenharia, por exemplo em mísseis Jogos de soma-zero também permitem uma interpretação interessante do equilíbrio de Nash como estratégias *maxminimizadoras* e *minmaximizadoras* dos jogadores, como veremos, que são conceitos importantes em geral --- class: middle ## Maximinimização Imagine que você se encontra em um jogo com um desconhecido sem ter ideia de qual será a estratégia dele: uma atitude conservadora é se proteger ao máximo caso o oponente queira te prejudicar (ou o faça inadvertidamente) Para cada estratégia sua, você poderia checar qual é o *pior* resultado possível para si (dependendo da estratégia do oponente), e escolher a estratégia cujo *pior resultado* é o *menos pior*: essa é a **estratégia maximin** `$$\max_{\sigma_1} \min_{\sigma_{2}} u_1 (\sigma_1, \sigma_{2})$$` Aqui é como se você escolhesse "primeiro" uma estratégia `\(\sigma_1\)`, e o adversário sabendo `\(\sigma_1\)` iria minimizar o seu *payoff* (i.e., `\(\min_{\sigma_{2}} u_1 (\sigma_1, \sigma_{2})\)`) — e esperando isso, você vai escolher `\(\sigma_1\)` já querendo se precaver --- class: middle ## Maximinimização Ou seja, a *estratégia maximin* maximiza a utilidade esperada do jogador sob a hipótese (reconhecidamente bastante pessimista) de que o objetivo do outro jogador é prejudicar ele ao máximo Agora se essa hipótese é demasiado pessimista na maior parte dos jogos, ela faz bastante sentido em jogos de soma-zero, pois cada jogador maximiza o seu *payoff* minimizando o do adversário! Outra forma de ver a maximinimização é que a **estratégia maximin** é uma "estratégia de defesa", com a qual um jogador busca o máximo que ele pode **garantir** de *payoff* no jogo *não importa o que os outros façam* --- class: middle <img src="figs/week1-fig9.png" width="25%" style="display: block; margin: auto;" /> Considere o jogo acima em que apenas mostramos o *payoff* do jogador 1 (para os nossos propósitos o *payoff* de 2 é irrelevante): qual é a estratégia pura de 1 que é maximin? Existe alguma estratégia mista que garante um *payoff* maior para 1? --- class: middle ## Algoritmos Encontramos a estratégia maxmin achando a estratégia que dá o mesmo *payoff* para *si mesmo* não importa o que os outros jogarem — essa é a noção de "garantir" um payoff, que chamamos de **nível de segurança** Percebam a diferença para um equilíbrio de Nash em estratégias mistas, em que em equilíbrio as estratégias que um jogador escolhe devem cumprir a condição de indiferença *para os outros jogadores*! Em geral essa estratégia maxmin será um estratégia mista, mas não precisa necessariamente ser (ver questão 8 do workshop) --- class: middle <img src="figs/week1-fig10.png" width="35%" style="display: block; margin: auto;" /> O jogo acima é um jogo de soma-zero acima (note que os *payoffs* para cada perfil de ações de fato sempre somam zero) — qual é a estratégia *maximin* para os jogadores 1 e 2? --- class: middle ## Minimaximização O conceito "inverso" da maximinimização é a **minimaximização**: `$$\min_{\sigma_2} \max_{\sigma_{1}} u_1 (\sigma_1, \sigma_{2})$$` De novo, (heuristicamente) "lemos da esquerda para a direita no tempo": primeiro o oponente escolhe uma estratégia `\(\sigma_2\)` tentando sacanear você, mas você pode responder a `\(\sigma_2\)` escolhendo a sua **melhor-resposta** — e novamente, prevendo isso o jogador 2 irá escolher `\(\sigma_2\)` tal que a sua melhor-resposta àquela estratégia lhe dê a menor utilidade possível A estratégia *minimax* é uma "estratégia de ataque", que atinge o valor mínimo que o jogador 2 pode *garantir que o jogador 1 não exceda* --- class: middle <img src="figs/week1-fig11.png" width="75%" style="display: block; margin: auto;" /> Jogos de soma-zero podem ser representados da forma matricial (direita) com apenas um número por célula, sendo entendido esse como o *payoff* do jogador 1, e o *payoff* do jogador 2 o negativo dele (vide esquerda) — achemos as estratégias maximin e minimax em estratégias puras para o jogador 1 no jogo acima --- class: middle ## A desigualdade max-min Um resultado (que aliás vale de forma muito mais geral) de matemática que nos será útil é que sempre será verdade que: `$$\max_{\sigma_1} \min_{\sigma_{2}} u_1 (\sigma_1, \sigma_{2}) \leq \min_{\sigma_2} \max_{\sigma_{1}} u_1 (\sigma_1, \sigma_{2})$$` Ou seja, o valor máximo que o jogador 1 pode garantir para si sempre é menor ou igual o valor mínimo que o jogador 2 pode garantir que 1 não exceda — isso vale em geral! Caso o jogo seja de soma-zero, temos também que (como `\(\min f(x) = - \max (-f(x))\)`): `$$\min_{\sigma_2} \max_{\sigma_{1}} u_1 (\sigma_1, \sigma_{2}) = \min_{\sigma_2} \left( - \min_{\sigma_{1}} u_2 (\sigma_1, \sigma_{2})\right) = - \max_{\sigma_2} \min_{\sigma_{1}} u_2 (\sigma_1, \sigma_{2})$$` --- class: middle ## A desigualdade max-min Ou seja, em um jogo de soma-zero a estratégia minimax do jogador 1 dá os mesmos *payoffs* que a estratégia maximin do jogador 2! Juntando os dois resultados, temos que: `$$\max_{\sigma_1} \min_{\sigma_{2}} u_1 (\sigma_1, \sigma_{2}) \leq - \max_{\sigma_2} \min_{\sigma_{1}} u_2 (\sigma_1, \sigma_{2})$$` (Lembrando que em um jogo de soma-zero os *payoffs* dos jogadores 1 e 2 sempre têm sinais opostos) — existe situações em que essa desigualdade vale com igualdade? O polímata Von Neumann, uma das maiores mentes da história humana, quando não ocupado criando armas de homicídio em massa, provou em 1928 que sim! --- class: middle ## O teorema minimax Certamente o primeiro grande teorema de teoria dos jogos, e que marca o nascimento da disciplina, é o **teorema minimax**: **Teorema (Von Neumann, 1928):** Em um jogo finito, para todo jogador `\(i\)`, `$$\max_{\sigma_1} \min_{\sigma_{2}} u_1 (\sigma_1, \sigma_{2}) = - \max_{\sigma_2} \min_{\sigma_{1}} u_2 (\sigma_1, \sigma_{2})$$` `$$= \min_{\sigma_2} \max_{\sigma_{1}} u_1 (\sigma_1, \sigma_{2}) = u_1(\sigma_1^*, \sigma_{2}^*) = v$$` onde `\(\sigma^*\)` é (qualquer) *equilíbrio de Nash* do jogo! Chamamos `\(v\)` do **valor do jogo** — ou seja, em um jogo de soma-zero um perfil de estratégias é equilíbrio de Nash *se e somente se* cada jogador está jogando sua *estratégia maximin* --- class: middle <img src="figs/week-1-fig-0.png" width="35%" style="display: block; margin: auto;" /> E se o jogo não for de soma-zero? Voltemos à famosa guerra dos sexos: qual é a estratégia *maximin* e *minimax* do jogador 1? Quais são os equilíbrios de Nash do jogo? Como eles se comparam? --- class: middle <img src="figs/week1-fig6.png" width="55%" style="display: block; margin: auto;" /> Vamos terminar essa parte do curso analisando o famoso jokenpô — agora vocês nunca mais vão perder de crianças de 5 anos jogando esse jogo (espero)! --- class: middle ## Conclusão E essa foi (uma introdução para) a base fundamental da teoria dos jogos: a teoria de **jogos estáticos de informação completa**! Esses são jogos que acontecem apenas uma vez e ambos jogadores agindo ao mesmo tempo (*jogo estático*), e que é conhecimento comum para todos os jogadores todos os componentes do jogo (número de jogadores, *payoffs*, estratégias disponíveis, que o jogo é estático, que a *informação é completa*) O próximo passo é relativizar ambas as suposições no nome: que os jogos são estáticos (parte 2, que olhamos **jogos dinâmicos**) e que a informação é completa (parte 3 do curso, **jogos de informação incompleta**) --- class:middle # Bibliography <small> [Mai98] G. J. Mailath. "Do people play Nash equilibrium? Lessons from evolutionary game theory". In: _Journal of Economic Literature_ 36.3 (1998), pp. 1347-1374. [VM07] J. Von Neumann and O. Morgenstern. "Theory of games and economic behavior: 60th anniversary commemorative edition". In: _Theory of games and economic behavior_. Princeton university press, 2007. [Von28] J. Von Neumann. "ON THE THEORY OP GAMES OP STRATEGY1". In: _Mathematische Annalen_ 100 (1928), pp. 295-320. </small>