AlphaZero đã giỏi hơn trong các trò chơi hội đồng khác nhau so với con người

alphazero

Chúng tôi đã biết từ lâu rằng một trong những bộ phận của Bảng chữ cái, cụ thể là người được rửa tội với tên là Deepmind, phụ trách phát triển các dự án khác nhau liên quan đến thế giới trí tuệ nhân tạo trong công ty Bắc Mỹ, làm việc trên việc phát triển phần mềm có khả năng đánh bại bất kỳ đối thủ nào là con người trong các trò chơi trên bàn khác nhau.

Cụ thể là tôi muốn nói chuyện với bạn về phần mềm alphazero, điều mà chúng ta đã nói từ lâu và sau nhiều tháng, trong đó nó tiếp tục phát triển, đã cố gắng cải thiện đến mức ngày nay nó đã được chứng minh là cầu thủ xuất sắc nhất thế giới trên thực tế. các trò chơi nó biết. Điều tốt nhất của tất cả những điều này, hoặc ít nhất đây là điều DeepMind đảm bảo với chúng tôi rằng AlphaZero chỉ là đào tạo.

go

AlphaZero đã là người chơi giỏi nhất thế giới trong một số trò chơi hội đồng phức tạp nhất do con người tạo ra

Như bạn chắc chắn sẽ nhớ, một vài tháng trước, các kỹ sư phụ trách phát triển AlphaZero đã làm cho dự án của họ tốt hơn nhiều so với bất kỳ con người nào trong các trò chơi hội đồng khác nhau. Sau tất cả thời gian, rõ ràng, những người chịu trách nhiệm đã quyết định thêm cải tiến lớn cho phần mềm trí tuệ nhân tạo của bạn để phiên bản mới này đối mặt với phiên bản trước. Kết quả rất ấn tượng, sau vài giờ, phiên bản này đã là tốt nhất trên thế giới.

Với khả năng cải tiến như vậy, không có gì ngạc nhiên khi những người sáng tạo ra nó đã quyết định đưa nó vào các trò chơi trên bàn cờ khác như cờ vua hoặc shogi, nơi nó đã trở thành trò chơi tốt nhất trên thế giới về cả hai mặt, mặc dù cá nhân tôi phải thừa nhận rằng nó Điều nổi bật nhất là cách thức mà phần mềm này 'học', vì những người chịu trách nhiệm họ chỉ cho cô ấy biết luật chơi và để cô ấy chơiNói cách khác, phần mềm này không tìm cách trở thành tốt nhất trên thế giới, nó chỉ là đào tạo.

cờ vua

AlphaZero có khả năng tự đào tạo

Đây chính xác là những gì chúng tôi có thể trích xuất từ giấy được xuất bản bởi những người chịu trách nhiệm về sự phát triển của AlphaZero, nơi người ta nhận xét rằng sau một quá trình phát triển khá tốn kém về mặt thực thi và kiểm tra mã họ có năng lực để phát triển theo cấp số nhân. Một ví dụ về mọi thứ là, để AlphaZero học chơi cờ vây, họ chỉ thêm vào các quy tắc của trò chơi và làm cho nó chơi với phiên bản vốn đã là tốt nhất trên thế giới ... chỉ sau vài giờ AlphaZero đã xoay xở để thắng 100 trận thắng 0.

Ngoại suy điều này cho các trò chơi hội đồng khác, chúng tôi phát hiện ra rằng điều gì đó tương tự đã xảy ra, một ví dụ mà chúng tôi có trong cờ vua ở đâu, chỉ cần biết các quy tắc và sau khi đào tạo chỉ 4 giờ, AlphaZero có thể đánh bại không ai khác ngoài Stockfish, một trong những cỗ máy cờ vua mạnh nhất thế giới. Chúng tôi có một ví dụ mới trong shogi, một loại trò chơi rất giống với cờ vua nhưng có nguồn gốc từ Nhật Bản, với chỉ hai giờ đào tạo đã quản lý để trở thành bất bại.

shōgi

Mục đích của DeepMind cho phần mềm này là làm cho nó tự học bất cứ thứ gì

Chắc chắn bây giờ bạn sẽ nhận ra rằng AlphaZero cuối cùng cũng trở thành một chuyên gia trong các trò chơi trên bàn cờ, mặc dù sự thật là các kỹ sư và nhà khoa học đằng sau dự án không tìm kiếm kết thúc này mà là mục tiêu của họ lớn hơn nhiều, quản lý để rút ra các kỹ thuật học tập của họ triển khai chúng trong nhiều lĩnh vực khác, tức là họ tìm cách đạt được một thuật toán có khả năng học bất cứ thứ gì, một thứ rất giống với những gì xảy ra với con người.

Mặc dù có vẻ như vẫn còn một chặng đường dài phía trước, nhưng điều đó là đúng, chúng ta phải tính đến những tiến bộ vượt bậc mà DeepMind đang thực hiện với các công cụ trí tuệ nhân tạo của nó, phát triển và tinh chỉnh với tốc độ không đổi vì vậy chắc chắn và trước khi chúng ta có thể tưởng tượng, cuối cùng chúng ta sẽ phải đối mặt với một trí tuệ nhân tạo có khả năng tự học bất cứ thứ gì, nhiệm vụ, công việc ... mà không cần giải thích.

Más información: MIT


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.