Гоогле ДеепМинд већ зна како да зграби добру количину предмета

Гоогле ДеепМинд

Након демонстрирања импресивних способности и способности које је гоогле вештачка интелигенција, као што ћете се сигурно сећати способни да чак будете на врхунцу најбољег Го играча на планети или да научите да играте СтарЦрафт ИИ, где је сигурно након неколико месеци такође показујући своје неизмерне квалитете, дошло до тога да је посао који је обавио ДеепМинд новог корака тако да сада могу идентификовати предмете по њиховим својствима како би се одлучио на најбољи могући начин да их зграби.

Због тога је тим програмера и истраживача који су формирали иинжењери из Гоогле-а и Универзитета у Калифорнији, одлучио је да почне да вежба са алгоритмом тако да се образује баш онако како би то чинило људско биће у његовом најранијем детињству, односно пустиће га да вуче, гура, ломи и уопште експериментише са светом у виртуелном ентроју којим заповеда ДеепМинд.

Циљ овог рада је учинити ДеепМинд способним за науче својства физичких предмета како би са њима ступили у интеракцију. Ова врста наставе позната је под називом 'учење дубоког појачања'и омогућиће овој платформи да у реалном времену дозволи решавање задатака без одређених упутстава, нешто врло слично нашем начину интеракције са одређеним објектом када не знамо од чега је направљен или како да га користимо, то јест инстинктивно .

Захваљујући употреби техника учења дубоког појачања, ДеепМинд ће моћи да комуницира са било којом врстом предмета.

Да би то постигли истраживачи су створили два различита окружења Да би ДеепМинд могао експериментисати и учити на својим грешкама, прво се суочио са системом са пет блокова исте величине, али различите тежине, настојећи да добије платформу да идентификује која је најтежа тамо где је сазнала да једини начин да се погоди је интеракција са свим објектима.

Друго, платформа је постављена на куле различитих висина како би ДеепМинд израчунао колико блокова је било у сваком. У случају успеха, понуђена је серија награда, док су се, у случају неуспеха, платформи давале негативне повратне информације. Овим тестовима платформа је научила открити нове начине деловања засноване на домишљатости. Захваљујући томе ДеепМинд је сада у могућности да пронађе решења када не постоје јасна упутства или их директно недостају.

Више Информацион: Аркив


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.