AlphaZero jest już lepszy w różnych grach planszowych niż ludzie

AlfaZero

Od jakiegoś czasu wiemy, że jeden z działów Alfabet, a konkretnie ten ochrzczony imieniem DeepMind, która jest odpowiedzialna za rozwój różnych projektów związanych ze światem sztucznej inteligencji w firmie północnoamerykańskiej, pracuje nad rozwojem oprogramowania, które jest w stanie pokonać każdego człowieka w różnych grach planszowych.

W szczególności chcę z tobą porozmawiać o oprogramowaniu AlfaZero, o którym długo rozmawialiśmy i że po wielu miesiącach, w których nieustannie się rozwija, udało mu się ulepszyć do tego stopnia, że ​​już dziś udowodnił, że jest najlepszym graczem na świecie praktycznie we wszystkich rozgrywkach to wie. Najlepsze z tego wszystkiego, a przynajmniej to, co zapewnia DeepMind, jest to AlphaZero to tylko trening.

go

AlphaZero jest już najlepszym graczem na świecie w kilku najbardziej złożonych grach planszowych stworzonych przez człowieka

Jak zapewne pamiętacie, kilka miesięcy temu inżynierowie odpowiedzialni za rozwój AlphaZero już zrobili swój projekt znacznie lepiej niż jakikolwiek człowiek w różnych grach planszowych. Po całym tym czasie najwyraźniej osoby odpowiedzialne zdecydowały się dodać duże ulepszenia oprogramowania sztucznej inteligencji aby ta nowa wersja zmierzyła się z poprzednią. Wyniki były imponujące, po kilku godzinach ta wersja była już najlepsza na świecie.

Przy takiej zdolności do doskonalenia nie dziwi fakt, że jego twórcy zdecydowali się przenieść jego możliwości do innych gier planszowych, takich jak szachy czy shogi, gdzie udało mu się już być najlepszym na świecie w obu, chociaż osobiście muszę przyznać, że to Najbardziej uderzający jest sposób, w jaki to oprogramowanie ”uczyć się', ponieważ osoby odpowiedzialne po prostu pokazują jej zasady gry i pozwalają jej graćInnymi słowy, to oprogramowanie nie stara się być najlepszym na świecie, jest tylko szkoleniem.

szachy

AlphaZero jest w stanie samodzielnie trenować

To jest dokładnie to, co możemy wydobyć z ostatniego papier opublikowany przez osoby odpowiedzialne za rozwój AlphaZero, w którym komentuje się, że po dość drogim rozwoju pod względem implementacji i testowania kodu ich zdolności rosły wykładniczo. Przykładem wszystkiego jest to, że aby AlphaZero nauczył się grać w Go, dodali tylko zasady gry i sprawili, że gra przeciwko wersji, która była już najlepsza na świecie ... po zaledwie kilku godzinach AlphaZero udało się wygrać 100 wygrywa do 0.

Ekstrapolując to na inne gry planszowe, dowiadujemy się, że wydarzyło się coś podobnego, przykład, który mamy w szachy gdzie, po prostu znając zasady i po szkolenie tylko 4 godzinyAlphaZero był w stanie pokonać nikogo innego jak Stockfisha, jeden z najpotężniejszych silników szachowych na świecie. Mamy nowy przykład w shogi, rodzaj gry bardzo podobnej do szachów, ale pochodzenia japońskiego, gdzie, z zaledwie dwie godziny treningu udało się być nie do pobicia.

shōgi

Celem DeepMind w przypadku tego oprogramowania jest sprawienie, aby samo nauczyło się wszystkiego

Z pewnością do tej pory zdałeś sobie sprawę, że AlphaZero w końcu staje się ekspertem w grach planszowych, chociaż prawda jest taka, że ​​inżynierowie i naukowcy stojący za projektem nie dążą do tego celu, a ich cel jest znacznie większy, udaje im się wydobyć swoje techniki uczenia się, aby wdrażać je w wielu innych obszarach, czyli szukają algorytmu zdolnego do uczenia się wszystkiego, coś bardzo podobnego do tego, co dzieje się z ludźmi.

Chociaż może się wydawać, że jest jeszcze długa droga, co jest prawdą, musimy wziąć pod uwagę ogromny postęp, jaki robią w DeepMind dzięki silnikom sztucznej inteligencji, tak samo jak ewoluować i udoskonalać w stałym tempie więc na pewno i wcześniej, niż możemy sobie wyobrazić, w końcu staniemy przed sztuczną inteligencją zdolną do uczenia się wszystkiego, wykonywania zadań, pracy… samodzielnie i bez potrzeby wyjaśniania.

Więcej informacji: MIT


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.