AlphaZero já é melhor em vários jogos de tabuleiro do que humanos

AlfaZero

Já sabemos há muito tempo que uma das divisões da Alfabeto, especificamente aquele batizado com o nome de DeepMind, que se ocupa do desenvolvimento dos diversos projetos relacionados com o mundo da inteligência artificial dentro da empresa norte-americana, trabalha no desenvolvimento de um software capaz de vencer qualquer adversário humano em diversos jogos de mesa.

Especificamente, quero falar com você sobre o software AlfaZero, da qual já falamos há muito tempo e que depois de muitos meses, em que continuou a se desenvolver, conseguiu melhorar a tal ponto que hoje já se mostrou o melhor player do mundo em praticamente todos os jogos que conhece. O melhor de tudo isso, ou pelo menos é o que DeepMind nos garante é que AlphaZero está apenas treinando.

go

AlphaZero já é o melhor jogador do mundo em vários dos mais complexos jogos de tabuleiro criados pelo homem

Como você certamente se lembrará, há alguns meses os engenheiros responsáveis ​​pelo desenvolvimento do AlphaZero já tornavam seu projeto muito melhor do que qualquer humano em diferentes jogos de tabuleiro. Depois de todo esse tempo, aparentemente, os responsáveis ​​resolveram agregar grandes melhorias em seu software de inteligência artificial Portanto, esta nova versão enfrentará a anterior. Os resultados foram impressionantes, após várias horas, esta versão já era a melhor do mundo.

Com tamanha capacidade de aperfeiçoamento, não é de estranhar que seus criadores tenham decidido levar sua capacidade para outros jogos de tabuleiro como xadrez ou shogi, onde já conseguiu ser o melhor do mundo em ambos, embora, pessoalmente, eu tenha que admita que o que mais chama a atenção é a forma como este software 'aprender', uma vez que os responsáveis eles apenas mostram a ela as regras do jogo e a deixam jogarOu seja, este software não busca ser o melhor do mundo, é apenas treinamento.

xadrez

AlphaZero é capaz de treinar a si mesmo

Isso é precisamente o que podemos extrair do último papel publicado pelos responsáveis ​​pelo desenvolvimento do AlphaZero onde se comenta que após um desenvolvimento bastante caro em termos de implementação de código e testes de teste, eles têm suas capacidades de crescer exponencialmente. Um exemplo de tudo é que, para o AlphaZero aprender a jogar Go, eles apenas adicionaram as regras do jogo e o fizeram jogar contra a versão que já era a melhor do mundo ... em poucas horas AlphaZero havia conseguido vencer por 100 vitórias a 0.

Extrapolando isso para outros jogos de tabuleiro, descobrimos que algo semelhante aconteceu, um exemplo que temos no xadrez onde, apenas por conhecer as regras e após um treinamento de apenas 4 horas, AlphaZero foi capaz de vencer nada menos que Stockfish, um dos motores de xadrez mais poderosos do mundo. Temos um novo exemplo no shogi, uma espécie de jogo muito semelhante ao xadrez, mas de origem japonesa onde, com apenas duas horas de treinamento conseguiu ser imbatível.

shogi

O propósito que DeepMind tem para este software é fazê-lo aprender qualquer coisa por si mesmo

Certamente você já deve ter percebido que AlphaZero está finalmente se tornando um especialista em jogos de tabuleiro, embora, a verdade é que os engenheiros e cientistas por trás do projeto não buscam esse fim, mas sim seu objetivo é muito maior, conseguem extrair suas técnicas de aprendizagem para implementá-los em muitas outras áreas, ou seja, Eles procuram alcançar um algoritmo capaz de aprender qualquer coisa, algo muito semelhante ao que acontece com os humanos.

Embora possa parecer que ainda há um longo caminho a percorrer, o que é verdade, devemos levar em consideração o grande progresso que estão fazendo no DeepMind com seus motores de inteligência artificial, assim como evoluir e refinar a uma taxa constante então certamente e antes que possamos imaginar, estaremos finalmente diante de uma inteligência artificial capaz de aprender qualquer coisa, tarefa, trabalho ... por si mesma e sem a necessidade de explicações.

Mais informação: MIT


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.