AlphaZero je již lepší v různých deskových hrách než lidé

Alpha Zero

Už nějakou dobu víme, že jedna z divizí Abeceda, konkrétně ten pokřtěný jménem DeepMind, který má na starosti vývoj různých projektů souvisejících se světem umělé inteligence v rámci severoamerické společnosti, pracuje na vývoji softwaru, který je schopen porazit každého lidského soupeře při různých stolních hrách.

Konkrétně s vámi chci mluvit o softwaru Alpha Zero, o kterém jsme dlouho hovořili a který se po mnoha měsících, ve kterých se stále vyvíjela, dokázal vylepšit natolik, že se dnes již ukázal jako nejlepší hráč na světě prakticky ve všech hrách ví to. Nejlepší z toho všeho, nebo alespoň to je to, o čem nás DeepMind ujišťuje, je to AlphaZero jen trénuje.

go

AlphaZero je již nejlepším hráčem na světě v několika nejsložitějších deskových hrách vytvořených člověkem

Jak si jistě pamatujete, před několika měsíci inženýři zodpovědní za vývoj AlphaZero již udělali svůj projekt mnohem lepším než kdokoli jiný v různých deskových hrách. Po celou tu dobu se zjevně odpovědní rozhodli přidat velká vylepšení softwaru pro umělou inteligenci Tato nová verze bude tedy čelit té předchozí. Výsledky byly působivé, po několika hodinách byla tato verze již nejlepší na světě.

S takovou zdokonalenou schopností nepřekvapuje, že se její tvůrci rozhodli využít tuto kapacitu i na další deskové hry, jako jsou šachy nebo shogi, kde se již v obou dokázala stát nejlepší na světě, i když osobně musím připustit, že to, co je nejpozoruhodnější, je způsob, jakým tento software 'učit se', protože odpovědné osoby jen jí ukáží pravidla hry a nechají ji hrátJinými slovy, tento software se nesnaží být nejlepší na světě, je to pouze školení.

šachy

AlphaZero je schopen trénovat sám

To je přesně to, co můžeme extrahovat z posledního papír publikováno osobami odpovědnými za vývoj AlphaZero, kde se uvádí, že po poměrně nákladném vývoji, pokud jde o implementaci kódu a testovací testy, dostali své schopnosti exponenciálně růst. Příkladem všeho je, že aby se AlphaZero naučilo hrát Go, přidalo pouze pravidla hry a přimělo ji hrát proti verzi, která už byla nejlepší na světě ... po několika hodinách se AlphaZero podařilo vyhrajte o 100 výher na 0.

Při extrapolaci na další deskové hry zjistíme, že se stalo něco podobného, ​​příklad, který máme v šachy kde, pouhou znalostí pravidel a po a trénink pouze 4 hodinyAlphaZero nedokázal porazit nikoho jiného než Stockfish, jeden z nejsilnějších šachových strojů na světě. Máme nový příklad v shogi, druh hry velmi podobný šachu, ale japonského původu, kde s jen dvě hodiny tréninku dokázal být nepřekonatelný.

shōgi

Účelem, který má DeepMind pro tento software, je, aby se sám naučil cokoli

Určitě si teď uvědomíte, že AlphaZero se konečně stává odborníkem na deskové hry, i když pravdou je, že inženýři a vědci stojící za projektem se nesnaží dosáhnout tohoto cíle, ale jejich cíl je mnohem větší, dokáží extrahovat své techniky učení implementovat je v mnoha dalších oblastech, tj. snaží se dosáhnout algoritmu schopného se cokoli naučit, něco velmi podobného tomu, co se děje s lidmi.

I když se může zdát, že je před námi ještě dlouhá cesta, něco, co je pravda, musíme vzít v úvahu velký pokrok, kterého dosahují v DeepMindu pomocí svých motorů umělé inteligence, vyvíjet a zdokonalovat konstantní rychlostí Takže určitě a než si dokážeme představit, konečně budeme čelit umělé inteligenci, která je schopná se naučit cokoli, úkol, práci ... sama a bez nutnosti vysvětlování.

Více informací: MIT


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.