Google DeepMind jam scias kiel kapti multe da objektoj

Google DeepMind

Post pruvi la impresajn kapablojn kaj kapablojn, kiujn la google artefarita inteligenteco, kiel vi certe memoros, kapabla eĉ esti ĉe la alteco de la plej bona Go-ludanto sur la planedo aŭ lerni ludi StarCraft II, kie certe post pluraj monatoj ankaŭ montrante siajn grandegajn kvalitojn, venis la afero, ke la laboro farita de Deepmind de nova paŝo tiel ke nun mi kapablas identigi objektojn per iliaj ecoj por decidi la plej bonan eblan manieron kapti ilin.

Por tio teamo de programistoj kaj esploristoj formita de iinĝenieroj de Google kaj la Universitato de Kalifornio, decidis ekpraktiki kun la algoritmo por ke li eduku sin same kiel homo farus en sia plej frua infanaĝo, tio estas, ili lasos lin tiri, puŝi, rompi kaj ĝenerale eksperimenti kun la mondo ene de virtuala entrojo ordonita de DeepMind.

La celo de ĉi tiu laboro estas igi DeepMind kapabla lerni la ecojn de fizikaj objektoj por interagi kun ili. Ĉi tiu speco de instruado estas konata sub la nomo de 'profunda plifortiga lernado'kaj permesos al ĉi tiu platformo permesi realtempe solvi taskojn sen specifaj instrukcioj, io tre simila al nia maniero interagi kun certa objekto, kiam ni ne scias, el kio ĝi konsistas aŭ kiel uzi ĝin, tio estas, aŭtomate. .

Dank'al la uzo de profundaj plifortigaj lernaj teknikoj DeepMind povos interagi kun iu ajn speco de objekto.

Por atingi tion la esploristoj kreis du malsamaj ĉirkaŭaĵoj tiel ke DeepMind povis eksperimenti kaj lerni de siaj eraroj, por tio unue ĝi alfrontis la sistemon kun kvin samgrandaj blokoj sed kun malsama pezo, serĉante ke la platformo identigu, kiu estis la plej peza, kie ĝi eksciis, ke la sola maniero diveni, ke ĝi interagas kun ĉiuj objektoj.

Due, la platformo estis kontraŭbatalita kontraŭ turoj de malsamaj altaĵoj tiel ke DeepMind kalkulus kiom da blokoj estis en ĉiu. En kazo de sukceso, serio de kompensoj estis ofertita dum, se fiasko okazis, negativa reago ricevis al la platformo. Per ĉi tiuj provoj la platformo lernis malkovri novajn agmanierojn bazitajn sur eltrovemo. Danke al ĉi tio, DeepMind nun povas trovi solvojn, kiam mankas klaraj instrukcioj aŭ ili rekte mankas.

Pli da informoj: Arxiv


La enhavo de la artikolo aliĝas al niaj principoj de redakcia etiko. Por raporti eraron alklaku Ĉi tie.

Estu la unua por komenti

Lasu vian komenton

Via retpoŝta adreso ne estos eldonita. Postulita kampojn estas markita per *

*

*

  1. Respondeculo pri la datumoj: Miguel Ángel Gatón
  2. Celo de la datumoj: Kontrola SPAM, administrado de komentoj.
  3. Legitimado: Via konsento
  4. Komunikado de la datumoj: La datumoj ne estos komunikitaj al triaj krom per laŭleĝa devo.
  5. Stokado de datumoj: Datumbazo gastigita de Occentus Networks (EU)
  6. Rajtoj: Iam ajn vi povas limigi, retrovi kaj forigi viajn informojn.