Google DeepMind știe deja cum să prindă o cantitate bună de obiecte

Google DeepMind

După ce a demonstrat capacitățile și abilitățile impresionante pe care google inteligență artificială, așa cum vă veți aminti cu siguranță capabil să fiți chiar la înălțimea celui mai bun jucător Go de pe planetă sau să învățați să jucați StarCraft II, unde cu siguranță, după câteva luni, și-a demonstrat calitățile imense, a ajuns la punctul în care munca depusă de DeepMind fă un nou pas pentru ca acum să pot identifică obiectele după proprietățile lor pentru a decide cel mai bun mod posibil de a le apuca.

Pentru aceasta, o echipă de dezvoltatori și cercetători formată din iingineri de la Google și de la Universitatea din California, a decis să înceapă să practice cu algoritmul, astfel încât să se educe la fel cum ar fi o ființă umană în cea mai fragedă copilărie, adică îl vor lăsa să tragă, să împingă, să se rupă și, în general, să experimenteze lumea într-un entrojo virtual comandat DeepMind.

Obiectivul acestei lucrări este de a face DeepMind capabil învățați proprietățile obiectelor fizice pentru a interacționa cu ele. Acest tip de predare este cunoscut sub numele de „învățare de consolidare profundă„și va permite acestei platforme să permită în timp real să rezolve sarcini fără instrucțiuni specifice, ceva foarte asemănător cu modul nostru de a interacționa cu un anumit obiect atunci când nu știm din ce este făcută sau cum să îl folosim, adică instinctiv .

Datorită utilizării tehnicilor de învățare prin întărire profundă, DeepMind va putea interacționa cu orice tip de obiect.

Pentru a realiza acest lucru, cercetătorii au creat două medii diferite Pentru ca DeepMind să poată experimenta și învăța din greșelile sale, pentru aceasta, în primul rând, a confruntat sistemul cu cinci blocuri de aceeași dimensiune, dar cu o greutate diferită, încercând să facă platforma să identifice care a fost cea mai grea unde a aflat că singurul mod de a ghici că a fost interacțiunea cu toate obiectele.

În al doilea rând, platforma a fost opusă împotriva turnurilor de înălțimi diferite, astfel încât DeepMind să calculeze câte blocuri erau în fiecare. În caz de succes, s-au oferit o serie de recompense, în timp ce, dacă s-a produs un eșec, feedback-ul negativ a fost dat platformei. Cu aceste teste platforma a învățat descoperă noi moduri de a acționa bazate pe ingeniozitate. Datorită acestui fapt, DeepMind este acum capabil să găsească soluții atunci când nu există instrucțiuni clare sau lipsesc direct.

Más și informare: ArXiv


Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.