Το Google DeepMind γνωρίζει ήδη πώς να τραβήξει μια καλή ποσότητα αντικειμένων

Google DeepMind

Μετά την επίδειξη των εντυπωσιακών ικανοτήτων και ικανοτήτων που το τεχνητή νοημοσύνη google, καθώς σίγουρα θα θυμάστε ότι είναι ικανό ακόμη και να βρίσκεται στο ύψος του καλύτερου παίκτη Go στον πλανήτη ή να μαθαίνει να παίζει το StarCraft II, όπου σίγουρα μετά από αρκετούς μήνες, αποδεικνύοντας επίσης τις τεράστιες ιδιότητές του, έχει σημειωθεί ότι η δουλειά του Deepmind ενός νέου βήματος, ώστε τώρα μπορώ να το κάνω ταυτοποιήστε αντικείμενα από τις ιδιότητές τους για να αποφασίσετε τον καλύτερο δυνατό τρόπο για να τα πιάσετε.

Για αυτό μια ομάδα προγραμματιστών και ερευνητών συγκροτήθηκε από τον iμηχανικοί από το Google και το Πανεπιστήμιο της Καλιφόρνια, αποφάσισε να ξεκινήσει την εξάσκηση με τον αλγόριθμο έτσι ώστε να εκπαιδεύεται όπως ακριβώς θα έκανε ένας άνθρωπος στην πρώτη παιδική του ηλικία, δηλαδή θα τον αφήσει να τραβήξει, να σπρώξει, να σπάσει και να πειραματιστεί γενικά με τον κόσμο μέσα σε ένα εικονικό entrojo με Βαθύ μυαλό.

Ο στόχος αυτής της εργασίας είναι να κάνει το DeepMind ικανό μάθετε τις ιδιότητες των φυσικών αντικειμένων για να αλληλεπιδράσετε μαζί τους. Αυτός ο τύπος διδασκαλίας είναι γνωστός με το όνομα «μάθηση βαθιάς ενίσχυσης«και θα επιτρέψει σε αυτήν την πλατφόρμα να επιτρέπει την επίλυση εργασιών σε πραγματικό χρόνο χωρίς συγκεκριμένες οδηγίες, κάτι πολύ παρόμοιο με τον τρόπο αλληλεπίδρασης με ένα συγκεκριμένο αντικείμενο, όταν δεν γνωρίζουμε τι είναι κατασκευασμένο ή πώς να το χρησιμοποιήσουμε, δηλαδή ενστικτωδώς.

Χάρη στη χρήση τεχνικών μάθησης βαθιάς ενίσχυσης, το DeepMind θα μπορεί να αλληλεπιδρά με οποιονδήποτε τύπο αντικειμένου.

Για να επιτευχθεί αυτό, οι ερευνητές δημιούργησαν δύο διαφορετικά περιβάλλοντα Για να μπορέσει το DeepMind να πειραματιστεί και να μάθει από τα λάθη του, για πρώτη φορά, αντιμετώπισε το σύστημα με πέντε μπλοκ του ίδιου μεγέθους αλλά με διαφορετικό βάρος, επιδιώκοντας να πάρει την πλατφόρμα για να εντοπίσει ποια ήταν η βαρύτερη όπου έμαθε ότι ο μόνος τρόπος να μαντέψουμε ότι αλληλεπιδρούσε με όλα τα αντικείμενα.

Δεύτερον, η πλατφόρμα βρισκόταν σε πύργους διαφορετικών υψών για το DeepMind για να υπολογίσει πόσα μπλοκ ήταν το καθένα. Σε περίπτωση επιτυχίας, προσφέρθηκε μια σειρά από ανταμοιβές ενώ, εάν συνέβη μια αποτυχία, δόθηκαν αρνητικά σχόλια στην πλατφόρμα. Με αυτές τις δοκιμές η πλατφόρμα έμαθε ανακαλύψτε νέους τρόπους δράσης με βάση την εφευρετικότητα. Χάρη σε αυτό το DeepMind είναι πλέον σε θέση να βρει λύσεις όταν δεν υπάρχουν σαφείς οδηγίες ή λείπουν άμεσα.

Περισσότερες πληροφορίες: ArXiv


Γίνε ο πρώτος που θα σχολιάσει

Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.