Clique Aqui A teoria do jogo ideal - gto

Lista de Usuários Marcados

Página 1 de 2 12 ÚltimoÚltimo
Resultados 1 a 10 de 12
Like Tree34Likes

Tópico: A teoria do jogo ideal - gto

  1. #1
    Short Stack Avatar de Maiconbit
    Data de Ingresso
    29/12/13
    Localização
    Goiânia - Go
    Posts
    33

    A teoria do jogo ideal - gto

    GTO (GAME THEORY OPTIMAL) ou a Teoria do jogo "ideal", a definição de GTO é a estratégia utilizada em termos de equilibrio, isso quer dizer que se você estiver jogando a estratégia GTO não importa o que seu oponente faça ele nunca terá um EV+.
    Na sua definição ela se define com o jogo ideal, mas será isso mesmo?
    Eu primeiramente pensei que seria uma teoria de jogo imbatível, mas analisando GTO ela é lucrativa contra qualquer jogador, mas nem sempre será a estratégia mais lucrativa, porque existem jogadores que podem ser explorados, o que faz com que EXPLO (Estratégia de exploração) seja mais lucrativa que GTO.

    Então acredito que isso contradiz um pouco a auto afimarção do nome como uma teoria ideal.

    Seria possível jogar uma estratégia GTO e EXPLO, mixando o seu jogo?

    Isso a tornaria uma estratégia mais consistente e lucrativa?

    Muitos afirmam que se você estiver jogando a estratégia GTO e em certo momentos passar a utilizar a explorativa, você deixará espaços para ser explorado por seu adversário.
    Então não existe uma estratégia ideal, não temos como maximizar nosso EV na medida do possível e jogar inexplorável. Outra coisa que tenho como dúvida é será que existe alguma estratégia imbatível no poker? Uma vez que mesmo que sejamos capazes de jogar matematicamente correto e explorar ao máximo nosso oponente, o poker ainda consiste de outras váriaveis, ele é um jogo de pessoas, onde temos várias informações adicionais que podem ser útil no jogo.

    O que vocês acham? Gostaria de opniões!
    AVISO: TÓPICO ANTIGO
    Atenção: Este é um tópico criado há mais de 90 dias. Caso não tenha respostas recentes, tenha certeza de que sua resposta é conveniente e útil o suficiente para reativar esta discussão, do contrário você poderá ser advertido/suspenso.
    Registre-se ou faça login para ver assinaturas.

  2. #2
    Table Captain Avatar de Mandracon
    Data de Ingresso
    30/12/14
    Localização
    Brasil
    Posts
    901
    Contra um vilão q nunca se adapta qdo vc joga desbalanceado, não eh necessário gto, a melhor estratégia contra ele será mesmo explorar o máximo possível. Já contra um vilão q observa e se adapta eh necessário se preocupar para não ser explorado.
    Ou seja, eh preciso conhecer o vilão para definir a melhor estratégia.
    Acho q o correto eh mixar o jogo sim.
    Registre-se ou faça login para ver assinaturas.

  3. #3
    Expert
    Data de Ingresso
    09/05/09
    Posts
    3.415
    pedra papel tesoura.... a melhor estratégia é mixar aleatoriamente 1/3 cada movimento.... mas se pega uma criança que vc ta vendo que joga mais pedra que a média, vc vai explorar ela jogando mais papel.

    o truque é jogar papel mais vezes sem que ela perceba que você a está explorando... se jogar todas as mãos papel, até uma criança vai readaptar e jogar todas as vezes tesoura.


    Deste modo, é importante saber qual o gto (1/3 cada mão) para poder partir pro lado exploratório (digamos 1/4pedra;1/4 tesoura;1/2papel) sem ficar óbvio pro vilão que vc o está explorando.

    Ao contrário do senso comum, explorar o máximo possível pode ter um retorno imediatamente melhor, mas se contarmos com o Ev adaptativo, um pós equilíbrio entre o gto e o explo traz melhor resultados.


    edit: no mundo do mtt low stakes onde vc vai ver o cara uma vez na vida, é válido explorar 100%
    caofa, Cris, warc82 and 1 others like this.
    Registre-se ou faça login para ver assinaturas.

  4. #4
    Short Stack Avatar de Maiconbit
    Data de Ingresso
    29/12/13
    Localização
    Goiânia - Go
    Posts
    33
    Citação Postado originalmente por andrevadiu2 Ver Post
    pedra papel tesoura.... a melhor estratégia é mixar aleatoriamente 1/3 cada movimento.... mas se pega uma criança que vc ta vendo que joga mais pedra que a média, vc vai explorar ela jogando mais papel.

    o truque é jogar papel mais vezes sem que ela perceba que você a está explorando... se jogar todas as mãos papel, até uma criança vai readaptar e jogar todas as vezes tesoura.



    Deste modo, é importante saber qual o gto (1/3 cada mão) para poder partir pro lado exploratório (digamos 1/4pedra;1/4 tesoura;1/2papel) sem ficar óbvio pro vilão que vc o está explorando.

    Ao contrário do senso comum, explorar o máximo possível pode ter um retorno imediatamente melhor, mas se contarmos com o Ev adaptativo, um pós equilíbrio entre o gto e o explo traz melhor resultados.


    edit: no mundo do mtt low stakes onde vc vai ver o cara uma vez na vida, é válido explorar 100%
    Concordo que em low stackes a estratégia explorativa será muito melhor por termos mais aleatoriedade do field e muitos vilões random e recreativos. Mas acho que utilizar GTO contra os reg's tbem é algo a se pensar. E qto a idéia de que seria impossível se criar uma extratégia imbatível ou "ideal"? O que vc acha?
    Registre-se ou faça login para ver assinaturas.

  5. #5
    Expert Avatar de drone666
    Data de Ingresso
    21/08/08
    Localização
    Bangkok
    Posts
    3.792
    resumidamente, tu deveria ter uma estrategia GTO como padrao, e assim que conseguir ver desvios e desbalanceamentos em na estrategia de cada adversario, tu faz ajustes pra explorar esses desvios
    Registre-se ou faça login para ver assinaturas.

  6. #6
    Expert
    Data de Ingresso
    09/05/09
    Posts
    3.415
    Citação Postado originalmente por Maiconbit Ver Post
    Concordo que em low stackes a estratégia explorativa será muito melhor por termos mais aleatoriedade do field e muitos vilões random e recreativos. Mas acho que utilizar GTO contra os reg's tbem é algo a se pensar. E qto a idéia de que seria impossível se criar uma extratégia imbatível ou "ideal"? O que vc acha?
    Gto é bom contra uma população em geral, pra vc saber onde é o meio e moldar suas tendências a partir daí. O GTO strictu-sensu ou seja o ótimo teórico é impossível, do mesmo modo que é impossível chegar no final das casas decimais de pi (3.141592...) porém já chegamos em um ponto, pelo menos em HU onde aproximamos bastante as casas depois da vírgula. O chamado 'near gto solution'. OS computadores de hoje em dia já chegam bem perto de um gto simplificado e provavelmente no futuro, a aproximação vai ser maior ainda.

    Porém, bato na tecla que a estratégia ideal tem esse nome por ser matematicamente ideal do ponto de vista da teoria dos jogos. Isso não quer dizer que ela seja ideal em termos de lucro. O ideal pra mim pode ser aumentar meu ROI, e hourly rate e não jogar um jogo perfeito.

    Outra confusão que se faz muito em torno do GTO é que ele não é adaptável. A base é estática mas as variáveis são tantas, que se torna um equilíbrio dinâmico.

    Um exemplo de equilíbrio estático que estamos acostumados a ver hoje em dia no poker, sao as tabelas de shove e call NASH pra headsup. Isso é um exemplo de equilíbrio, porém preflop. Tudo que ele faz é tornar o vilão indiferente... em outras palavras, se você shova uma mão XX em um uma profundidade de blinds B, o vilão é indiferente se deve pagar ou foldar um range R. Não por conta da sua mão específica, mas por conta do seu range inteiro. Algumas mãos do range protegem as vezes que ele paga, outras protegem as vezes que ele folda, e a isso, atribui o equilíbrio.

    shovar AA 20bb deep pelo equilibrio de nash significa que o shove é +ev que o fold. Mas e o limp? e o miniraise? e o 3x?
    à medida que estudamos o comportamento do jogo pós flop, vamos entendendo que um limp pode ser, em muitas situações mais +ev que o shove.

    O interessante é que o jogo tem tantas variáveis (cartas, actions, sizings) que o grau de opções pode chegar ao infinito.

    será que é +ev abrir 2x; 2.25x ou 2.15x com KK em 20bb deep? em um flop KAA, deveriamos shovar, checkback, bet 33%, bet 66% ou bet 25%? O equilíbrio vai se extendendo em partes cada vez mais icroscópicas e elaboradas, algumas são até contra intuitivas e envolvem jogadas futuras, como aumentar com J5, mas check com J6 em um flop J66 pois precisamos levar um range de nuts pro river. E ainda vai mais fundo... desses J6, o check acontece em 95% das vezes, mas devemos shovar 3% e dar mr 2% e por aí vai...

    Enfim, desde formação de ranges, a sizing e mixagem intra-combos, combinado com todas as possíveis texturas, e stacks possíveis chegamos a um resultado praticamente incalculável, pela tecnologia de hoje, mas conseguimos arredondar.

    Você sabia que por exemplo, quando embaralhamos um deck normal, a ordem presente nesse baralho é, estatisticamente confiável, a primeira e a última já criada na história do universo?

    se acha impressionante, tenho certeza que vai curtir esse video do vsauce:


    mals ae pela parede de texto hsuahsuahs acho q me empolguei
    Última edição por andrevadiu2; 18-03-2016 às 13:03.
    lcfreitag, maier, caofa and 11 others like this.
    Registre-se ou faça login para ver assinaturas.

  7. #7
    Chip Leader Avatar de caofa
    Data de Ingresso
    18/04/11
    Posts
    1.018
    Não importa quão perto do gto vs está, vc nunca vai conseguir impedir o vilão de ter uma expectativa positiva. Isso é bem intuitivo porque vc não consegue impedir que o vilão tenha um ev positivo com AApf, ou trinca no turn, ou um monsterdraw no flop. Em várias situações que temos uma mão razoavelmente forte, qualquer linha que escolhermos vai ter uma expectativa positiva, não há como impedir que isso aconteça. O que se quer é minimizar a expectativa do range do vilão e maximizar a do nosso range.

    Sobre mixar entre gto e exploitative, acho que não apenas seja possível, mas compulsório para os jogos mais duros de nlh, hoje. Apesar de ser verdade que quando se desvia do gto pra explorar alguém, se abre margem para ser explorado, isso não é muito preocupante. 1o porque isso assume que a sua estratégia gto original já seja inexplorável, o que não é verdade. E 2o porque o problema seria o vilão saber que você está desviando da sua estratégia e saber também qual é a estratégia derivada que vc escolheu, alem disso ele teria que saber como contra-atacar essa estratégia escolhida. Muito dificilmente esse será o caso. Aqui é bem importante o que o vadiu falou, sobre explorar os adversários sem que eles saibam que estão sendo explorados.

    Pelo que eu entendo, essa seria a estratégia ideal do poker de humanos. Explorar o máximo que conseguirmos os adversários mas sem dar incentivos para que eles mudem de estratégia. Assim, hipoteticamente, podemos continuar explorando eles eternamente sem gastar energia extra para reorganizar nossa estratégia em função da contra-estratégia do vilão. Hipoteticamente por que na realidade isso também não é verdade, as pessoas não tem estratégias fixas, elas mudam de estratégia quer elas estejam conscientes disso ou não...

    Sobre a estratégia imbatível, seria o gto puro (ainda inexistente). Essa estratégia vai ganhar de todas as outras estratégias e vai empatar contra ela mesma. O que não quer dizer que essa seja a melhor estratégia overall (não tenho certeza disso na real, o gto é capaz de se adaptar? Se esse hipotético gto puro for capaz de se adaptar dado as informações de seus adversários, aumentando unilateralmente o seu ev, então ele provavelmente seria capaz de ter a winrate maxima vs qualquer oponente. Mas pelo que vi até agra, os bots jogam uma estratégia única e invariável em função do vilão, tendo como inputs: a sua mão, o seu range, o range esperado do vilão pro equilíbrio, o board e stacksizes. Não faria parte dos inputs a estimação do quão fora do equilíbrio o range do vilão será jogado, dado suas jogadas anterior). Esse gto puro é uma função de uma capacidade de processamento gigante, rodando por tempo pra caralho, pra chegar em respostas que vão ser na maioria das vezes contra-intuitivas e as vezes até pouco produtivas pra nós humanos (geralmente envolvendo o que o vadiu falou das estratégias mistas; i.e apostar uma dada mão 57% das vezes e checkar 43%). A parte mais aplicável disso é resolver pro equilíbrio de situações simplificadas, ou jogos mais simples, e extrapolar as conclusões dessas soluções pra partes específicas do nlh ou plo, ou qlqr outro jogo que seja...

    Bottom line é entender os conceitos principais do gto, sobre quais premissas ele está baseado. Ter uma boa ideia de como seria a modelagem do equilíbrio pra uma dada situação, estimar com qual intensidade e direção o vilão está fora desse equilíbrio e explorar ele em função disso.

    Na minha visão, o que mais importa é o processo de se chegar no equilíbrio. O equilíbrio em si não é tão importante. Isso porque nlh é tão complexo que o equilíbrio nem faria muito sentido pra mente humana média. Agora como se chega ao equilíbrio? Analisando a expectativa de estratégias, suas contra-estratégias e as suas contra-contra-estratégias (e vai embora)... E o poker do mundo real é isso, é o jogo da eterna adaptação. A real é que ninguém está jogando no equilíbrio em 99.9% dos jogos de hoje. Então o que interessa é como explorar da melhor forma diversas estratégias que não estão
    no equilíbrio (geralmente vão tar bem longe, mas algumas vezes podem estar razoavelmente perto). E como se faz isso? Com a melhor contra-estratégia vs uma dada estratégia x. Por isso é importante entender essa dinâmica que existe antes de se chegar ao equilíbrio, dinâmica essa que nada mais é do que a interação entre as estratégias possíveis. Entender isso com um certo grau de profundidade dá uma noção bem forte pra identificar quais os principais erros que os vilões dos seus jogos estão cometendo e qual é a melhor forma de aumentar seu ev contra eles.
    Registre-se ou faça login para ver assinaturas.

  8. #8
    Amador
    Data de Ingresso
    11/12/11
    Posts
    24
    Onde posso encontrar + coisas sobre gto galera ?! alguem da um help ?
    Registre-se ou faça login para ver assinaturas.

  9. #9
    Grinder
    Data de Ingresso
    07/04/11
    Posts
    244
    Citação Postado originalmente por xigoretx Ver Post
    Onde posso encontrar + coisas sobre gto galera ?! alguem da um help ?
    No Sensei tem um video do Yuri só sobre isso.
    Registre-se ou faça login para ver assinaturas.

  10. #10
    Chip Leader Avatar de Gilmour
    Data de Ingresso
    01/11/12
    Posts
    1.185
    li todos os posts e n entendi porra nenhuma. ainda bem q eu jogo mtt
    VinnyCout, gutoo.7 and CaioCPassos like this.
    Registre-se ou faça login para ver assinaturas.

Página 1 de 2 12 ÚltimoÚltimo

Permissões de postagem

  • Você não pode iniciar novos tópicos
  • Você não pode enviar respostas
  • Você não pode enviar anexos
  • Você não pode editar suas mensagens
  •  
© 2007-2019 · MaisEV · Todos os direitos reservados