Το AlphaZero είναι ήδη καλύτερο σε διάφορα επιτραπέζια παιχνίδια από τους ανθρώπους

αλφαμηδέν

Γνωρίζουμε εδώ και αρκετό καιρό ότι ένα από τα τμήματα του Αλφάβητο, συγκεκριμένα αυτό που βαφτίστηκε με το όνομα του Deepmind, η οποία είναι υπεύθυνη για την ανάπτυξη των διαφόρων έργων που σχετίζονται με τον κόσμο της τεχνητής νοημοσύνης στην εταιρεία της Βόρειας Αμερικής, εργάζεται για την ανάπτυξη ενός λογισμικού που είναι ικανό να νικήσει οποιονδήποτε ανταγωνιστή σε διάφορα επιτραπέζια παιχνίδια.

Συγκεκριμένα θέλω να σας μιλήσω για το λογισμικό αλφαμηδέν, για το οποίο έχουμε ήδη μιλήσει για μεγάλο χρονικό διάστημα και ότι μετά από πολλούς μήνες, στους οποίους συνέχισε να εξελίσσεται, κατάφερε να βελτιωθεί σε τέτοιο βαθμό που σήμερα έχει ήδη αποδειχθεί ότι είναι ο καλύτερος παίκτης στον κόσμο σχεδόν σε όλους τα παιχνίδια που ξέρει. Το καλύτερο από όλα αυτά, ή τουλάχιστον αυτό που μας διαβεβαιώνει το DeepMind είναι ότι Το AlphaZero είναι απλώς προπόνηση.

go

Το AlphaZero είναι ήδη ο καλύτερος παίκτης στον κόσμο σε πολλά από τα πιο περίπλοκα επιτραπέζια παιχνίδια που δημιούργησε ο άνθρωπος

Όπως θα θυμάστε σίγουρα, πριν από λίγους μήνες οι μηχανικοί που είναι υπεύθυνοι για την ανάπτυξη του AlphaZero έχουν ήδη κάνει το έργο τους πολύ καλύτερο από οποιονδήποτε άνθρωπο σε διαφορετικά επιτραπέζια παιχνίδια. Μετά από όλο αυτό το διάστημα, προφανώς, οι υπεύθυνοι αποφάσισαν να προσθέσουν μεγάλες βελτιώσεις στο λογισμικό τεχνητής νοημοσύνης Έτσι, αυτή η νέα έκδοση θα αντιμετωπίσει την προηγούμενη. Τα αποτελέσματα ήταν εντυπωσιακά, μετά από αρκετές ώρες, αυτή η έκδοση ήταν ήδη η καλύτερη στον κόσμο.

Με τέτοια ικανότητα βελτίωσης, δεν προκαλεί έκπληξη το γεγονός ότι οι δημιουργοί του αποφάσισαν να μεταφέρουν την ικανότητά του σε άλλα επιτραπέζια παιχνίδια όπως το σκάκι ή το shogi, όπου έχει ήδη καταφέρει να είναι το καλύτερο στον κόσμο και στους δύο, αν και προσωπικά πρέπει να παραδεχτώ ότι αυτό που είναι πιο εντυπωσιακό είναι ο τρόπος με τον οποίο αυτό το λογισμικόμάθετε", αφού οι υπεύθυνοι της δείχνουν απλώς τους κανόνες του παιχνιδιού και την αφήνουν να παίξειΜε άλλα λόγια, αυτό το λογισμικό δεν επιδιώκει να είναι το καλύτερο στον κόσμο, είναι μόνο εκπαίδευση.

σκάκι

Το AlphaZero είναι ικανό να προπονηθεί

Αυτό ακριβώς μπορούμε να εξαγάγουμε από το τελευταίο χαρτί δημοσιεύθηκε από εκείνους που είναι υπεύθυνοι για την ανάπτυξη του AlphaZero όπου σχολιάζεται ότι μετά από μια μάλλον δαπανηρή ανάπτυξη όσον αφορά την εφαρμογή κώδικα και τις δοκιμές δοκιμών, έχουν τις δυνατότητές τους να αυξηθούν εκθετικά. Ένα παράδειγμα όλων είναι ότι, για να μάθει το AlphaZero να παίζει Go, πρόσθεσε μόνο τους κανόνες του παιχνιδιού και το έκανε να παίξει με την έκδοση που ήταν ήδη η καλύτερη στον κόσμο ... μετά από λίγες ώρες, το AlphaZero κατάφερε να κερδίσει 100 νίκες στο 0.

Επεκτείνοντας αυτό σε άλλα επιτραπέζια παιχνίδια ανακαλύπτουμε ότι κάτι παρόμοιο έχει συμβεί, ένα παράδειγμα που έχουμε στο σκάκι όπου, απλά γνωρίζοντας τους κανόνες και μετά από ένα εκπαίδευση μόνο 4 ωρώνΗ AlphaZero κατάφερε να κερδίσει τίποτα λιγότερο από τον Stockfish, έναν από τους ισχυρότερους σκακιστικούς κινητήρες στον κόσμο. Έχουμε ένα νέο παράδειγμα στο shogi, ένα είδος παιχνιδιού πολύ παρόμοιο με το σκάκι αλλά ιαπωνικής προέλευσης όπου, με μόλις δύο ώρες προπόνησης κατάφερε να είναι ανίκητος.

Σόγκι

Ο σκοπός που έχει το DeepMind για αυτό το λογισμικό είναι να το κάνει να μάθει οτιδήποτε από μόνο του

Σίγουρα μέχρι τώρα θα έχετε καταλάβει ότι το AlphaZero γίνεται επιτέλους ειδικός στα επιτραπέζια παιχνίδια, ωστόσο, η αλήθεια είναι ότι οι μηχανικοί και οι επιστήμονες πίσω από το έργο δεν επιδιώκουν αυτό το σκοπό, αλλά ο στόχος τους είναι πολύ μεγαλύτερος, καταφέρνουν να εξαγάγουν τις τεχνικές μάθησης να τα εφαρμόσετε σε πολλούς άλλους τομείς, δηλαδή, Επιδιώκουν να επιτύχουν έναν αλγόριθμο ικανό να μάθει οτιδήποτε, κάτι πολύ παρόμοιο με αυτό που συμβαίνει με τους ανθρώπους.

Παρόλο που φαίνεται ότι υπάρχει ακόμη πολύς δρόμος, κάτι που είναι αλήθεια, πρέπει να λάβουμε υπόψη τη μεγάλη πρόοδο που σημειώνουν στο DeepMind με τις μηχανές τεχνητής νοημοσύνης τους, όπως εξελίσσεται και τελειοποιεί με σταθερό ρυθμό οπότε σίγουρα και νωρίτερα από ό, τι μπορούμε να φανταστούμε, τελικά θα βρεθούμε αντιμέτωποι με μια τεχνητή νοημοσύνη ικανή να μάθει οτιδήποτε, εργασία, εργασία ... από μόνη της και χωρίς την ανάγκη εξηγήσεων.

Περισσότερες πληροφορίες: MIT


Γίνε ο πρώτος που θα σχολιάσει

Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.