AlphaZeroはすでに人間よりもさまざまなボードゲームで優れています

アルファゼロ

私たちはかなり前から、の部門のXNUMXつが アルファベット、具体的にはの名前でバプテスマを受けたもの ディープマインド北米企業内の人工知能の世界に関連するさまざまなプロジェクトの開発を担当しているは、さまざまなテーブルゲームで人間の競争相手を打ち負かすことができるソフトウェアの開発に取り組んでいます。

具体的には、ソフトウェアについてお話ししたいと思います アルファゼロ長い間お話ししましたが、開発を続けてきた何ヶ月も経った今でも、ほぼすべてのゲームで世界最高のプレーヤーであることが証明されているほどに改善されています。それは知っています。 これらすべての中で最高のもの、または少なくともこれは、DeepMindが私たちに保証していることです AlphaZeroはトレーニング中です.

go

AlphaZeroは、人間が作成した最も複雑なボードゲームのいくつかですでに世界最高のプレーヤーです。

確かに覚えていると思いますが、数か月前、AlphaZeroの開発を担当するエンジニアは、さまざまなボードゲームで他のどの人間よりもプロジェクトを大幅に改善しました。 結局のところ、どうやら、責任者は追加することにしました 人工知能ソフトウェアの大幅な改善 したがって、この新しいバージョンは前のバージョンに直面します。 結果は印象的で、数時間後、このバージョンはすでに世界で最高でした。

このような改善能力があるので、その能力をチェスや将棋などの他のボードゲームに持ち込むことを決定したのは当然のことです。チェスや将棋はすでに両方で世界一になっていますが、個人的にはそうしなければなりません。それを認める最も印象的なのは、このソフトウェアの方法です。学ぶ'、責任者から 彼らはただ彼女にゲームのルールを見せて、彼女に遊ばせます言い換えれば、このソフトウェアは世界で最高になることを目指しているのではなく、トレーニングだけです。

チェス

AlphaZeroはそれ自体をトレーニングすることができます

これはまさに最後から抽出できるものです AlphaZeroの開発の責任者によって公開され、コードの実装とテストテストの点でかなり高価な開発の後、 彼らは指数関数的に成長する能力を手に入れました。 すべての例は、AlphaZeroが囲碁のプレイを学ぶために、ゲームのルールを追加し、すでに世界で最高のバージョンと対戦するようにしたことです...わずか数時間後にAlphaZeroは100勝で0に勝ちます。

これを他のボードゲームに外挿すると、同様のことが起こっていることがわかります。 チェス ここで、ルールを知っているだけで、 わずか4時間のトレーニング、AlphaZeroは、世界で最も強力なチェスエンジンのXNUMXつであるStockfishに勝るものはありませんでした。 に新しい例があります 将棋、チェスに非常に似ているが、日本の起源の一種のゲームで、 わずかXNUMX時間のトレーニング なんとか無敵になりました。

将棋

DeepMindがこのソフトウェアに対して持っている目的は、それ自体で何かを学習させることです。

確かに今では、AlphaZeroがボードゲームのエキスパートになりつつあることに気付くでしょう。ただし、プロジェクトの背後にいるエンジニアや科学者はこの目的を追求するのではなく、目標ははるかに大きく、学習テクニックを他の多くの分野でそれらを実装します。 彼らは何でも学ぶことができるアルゴリズムを達成しようとしています、人間で起こることと非常によく似た何か。

まだ長い道のりがあるように思われるかもしれませんが、それは事実ですが、人工知能エンジンを使用したDeepMindでの大きな進歩を考慮に入れる必要があります。 一定の速度で進化し、洗練する 想像以上に確実に、そして早く、私たちはついに、説明を必要とせずに、それ自体で、何でも、タスク、仕事を学ぶことができる人工知能に直面するでしょう。

詳細情報: マサチューセッツ工科大学(MIT)


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。