AlphaZero нь янз бүрийн ширээний тоглоомд хүнээс илүү сайн байдаг

AlphaZero

-Ийн нэг хэлтэс гэдгийг бид нэлээд эрт дээр үеэс мэддэг байсан Alphabet, ялангуяа нэртэй баптисм хүртсэн хүн Deepmindнь Хойд Америкийн компаний хүрээнд зохиомол оюун ухааны ертөнцтэй холбоотой янз бүрийн төслүүдийг боловсруулах ажлыг хариуцаж ажилладаг бөгөөд янз бүрийн ширээний тоглоомууд дээр хүн бүрийн өрсөлдөгчийг ялах чадвартай програм хангамжийг боловсруулдаг.

Ялангуяа би тантай програм хангамжийн талаар ярихыг хүсч байна AlphaZero, бид удаан хугацааны турш ярьсан бөгөөд үргэлжлүүлэн хөгжсөөр ирсэн олон сарын дараа өнөөг хүртэл бараг бүх тоглоомд дэлхийн хамгийн шилдэг тоглогч болохоо нэгэнт нотолж чаджээ. энэ нь мэддэг. Энэ бүхний хамгийн шилдэг нь, эсвэл дор хаяж энэ нь DeepMind-ийн баталж өгсөн зүйл юм AlphaZero зүгээр л бэлтгэл хийж байна.

go

AlphaZero нь хүний ​​бүтээсэн хамгийн төвөгтэй ширээний тоглоомуудын аль хэдийн дэлхийн шилдэг тоглогч болжээ

Хэдэн сарын өмнө AlphaZero-ийн хөгжлийг хариуцсан инженерүүд төслөө янз бүрийн ширээний тоглоомд оролцож байсан бүх хүнээс хамаагүй дээр болгосон гэдгийг та санаж байгаа байх. Энэ бүх хугацааны дараа хариуцлагатай хүмүүс нэмэхээр шийдсэн бололтой хиймэл оюун ухааны програм хангамжийн томоохон сайжруулалтууд Тэгэхээр энэ шинэ хувилбар нь өмнөх хувилбартайгаа нүүр тулах болно. Үр дүн нь гайхалтай байсан, хэдэн цагийн дараа энэ хувилбар дэлхийн хамгийн шилдэг хувилбар байсан.

Сайжруулах ийм чадавхитай тул бүтээгчид нь энэ чадвараа дэлхийн хамгийн шилдэг нь болж чадсан шатар, шоги гэх мэт бусад ширээний тоглоомуудад ашиглахаар шийдсэн нь гайхмаар зүйл биш юм. Хамгийн гайхалтай нь энэ програм хангамжийн арга хэлбэр юм гэдгийг хүлээн зөвшөөр "сурах', хариуцлага хүлээх хүмүүсээс хойш тэд зүгээр л түүнд тоглоомын дүрмийг үзүүлээд тоглуулдагӨөрөөр хэлбэл энэхүү програм хангамж нь дэлхийн хамгийн шилдэг нь байхыг эрмэлздэггүй, зөвхөн сургалт явуулдаг.

шатар

AlphaZero нь өөрөө өөрийгөө сургах чадвартай

Энэ бол яг л бидний сүүлчийнхээс гаргаж авах боломжтой зүйл юм цаасан AlphaZero-ийг хөгжүүлэх үүрэг бүхий хүмүүс хэвлүүлсэн бөгөөд үүнд кодыг хэрэгжүүлэх, турших тал дээр нэлээд үнэтэй хөгжүүлсний дараа тайлбар хийжээ. тэд хурдацтай өсөх чадварыг эзэмшсэн. Бүх зүйлийн жишээ бол AlphaZero-д Go тоглож сурахын тулд тэд зөвхөн тоглоомын дүрмийг нэмж, дэлхийн аль хэдийн хамгийн шилдэг хувилбарын эсрэг тоглуулахад хүргэсэн юм ... хэдхэн цагийн дараа AlphaZero үүнийг хийж чаджээ. 100 хожиж 0-ээр хожих.

Үүнийг бусад ширээний тоглоомуудтай холбон тайлбарласнаар бид үүнтэй төстэй зүйл тохиолдсон болохыг олж мэдэв шатар хаана, дүрмийг мэдэж, а ердөө 4 цагийн сургалтAlphaZero нь дэлхийн хамгийн хүчирхэг шатрын хөдөлгүүрүүдийн нэг болох Стокфишээс өөрийг ялж чадаагүй юм. Бидэнд шинэ жишээ бий shogi, шатартай маш төстэй боловч япон гаралтай тоглоом ердөө хоёр цагийн бэлтгэл ялагдашгүй байж чадсан.

Шоги

DeepMind-ийн энэхүү програм хангамжийн зорилго нь аливаа зүйлийг өөрөө сурахад оршино

AlphaZero нь эцэст нь ширээний тоглоомын мэргэжилтэн болж байгааг та ойлгосон байх, гэхдээ төслийн ард байгаа инженер, эрдэмтэд энэ зорилгыг эрэлхийлээгүй харин зорилго нь илүү их байгаа тул сурах арга техникээ гаргаж аваарай. тэдгээрийг бусад олон салбарт хэрэгжүүлэх, өөрөөр хэлбэл тэд аливаа зүйлийг сурах чадвартай алгоритмд хүрэхийг эрэлхийлдэг, хүнтэй тохиолддогтой төстэй зүйл.

Цаашид үнэхээр хол байх ёстой мэт санагдаж байгаа ч гэсэн тэд хиймэл оюун ухааны хөдөлгүүрүүдтэйгээ DeepMind-т хийж буй томоохон ахиц дэвшилийг харгалзан үзэх ёстой. өөрчлөгдөж, тогтмол түвшинд боловсронгуй болно Тиймээс бид төсөөлөхөөсөө өмнө ямар ч зүйл, даалгавар, ажил ... -ыг өөрөө тайлбарлан тайлбарлахгүйгээр сурах чадвартай хиймэл оюун ухаантай тулгарах болно.

Нэмэлт мэдээлэл: MIT


Нийтлэлийн агуулга нь бидний зарчмуудыг баримталдаг редакцийн ёс зүй. Алдааны талаар мэдээлэхийн тулд товшино уу энд байна.

Сэтгэгдэл бичих эхний хүн бай

Сэтгэгдэлээ үлдээгээрэй

Таны и-мэйл хаяг хэвлэгдсэн байх болно. Шаардлагатай талбарууд нь тэмдэглэгдсэн байна *

*

*

  1. Мэдээллийг хариуцах: Мигель Анхель Гатан
  2. Мэдээллийн зорилго: СПАМ-ыг хянах, сэтгэгдлийн менежмент.
  3. Хууль ёсны байдал: Таны зөвшөөрөл
  4. Мэдээллийн харилцаа холбоо: Хуулийн үүргээс бусад тохиолдолд мэдээллийг гуравдагч этгээдэд дамжуулахгүй.
  5. Өгөгдөл хадгалах: Occentus Networks (ЕХ) -с зохион байгуулсан мэдээллийн сан
  6. Эрх: Та хүссэн үедээ мэдээллээ хязгаарлаж, сэргээж, устгаж болно.