Tehnoloogiakompanii Google teatas koostööst Boston Dynamicsiga, mille raames integreeritakse Gemini Roboticsi kehaliselt realiseeritud mõtlemise mudelid neljajalgse roboti Spoti tarkvarasse – see on oluline samm kunstliku intelligentsi rakendamisel reaalmaailma robotitele. Koostöö võimaldab robotil paremini oma keskkonda tõlgendada, objekte tuvastada ja täita ülesandeid loomuliku keele juhiste põhjal, mitte ainult eelprogrammeeritud protseduuridele toetudes.
Integreerimine põhineb eksperimentaalsel tööl, mida tehti 2025. aasta sisemises hackathonil, kus arendajad uurisid, kuidas suured keelemudelid ja visuaalsed mõtlemissüsteemid võiksid suurendada Spoti autonoomiat. Kasutades Gemini Roboticsi, saab robot töödelda oma kaameratest saadud visuaalset sisendit ja tõlgendada kõrgtasemelisi juhiseid – näiteks ruumi esemete korraldamist – koordineeritud füüsiliste tegevustena.
Traditsioonilisest robotite programmeerimisest erinevalt, mis sageli sõltub kõva, samm-sammult loogikast, pakub süsteem paindlikumat liidest, mis põhineb vestlusjuhistel. Arendajad loovad vahesoftwarikihi Spoti tarkvararenduskomplekti (SDK) abil, mis võimaldab Gemini mudelite suhtlemist roboti rakendusliidese (API) kaudu. See raamistik võimaldab AI-l valida etteantud tegevuste hulgast, sealhulgas navigeerimist, objektide tuvastamist, pildi salvestamist, haaramist ja paigutamist.
Praktilistes demonstreerimistes näitas süsteem võimet tõlgendada üldisi juhiseid ja kohanduda dünaamilistesse keskkondadesse. Näiteks, kui robotile anti ülesanne esemete korraldamiseks, analüüsis AI-mudel visuaalset andmestikku, tuvastas asjakohased objektid ja juhis robotit tegevuste järjestuse läbi. Robotilt saadud tagasiside – näiteks ülesande täitmine või füüsilised piirangud – integreeriti reaalajas, võimaldades süsteemil oma käitumist käsitsi sekkumiseta kohandada.
Lähenemine säilitab operatsioonipiirid, piirates AI-d roboti API-s etteantud võimalustega, tagades nii prognoositava kui ka kontrollitava toimimise. See disain tasakaalustab kohanduvust ja turvalisust – oluline kaalutlus AI-de deployimisel füüsilistes süsteemides.
Koostöö rõhutab ka arendajatele võimalikke tõhususkaasu. Vähendades vajadust ulatusliku käsitsi koodimisega, võimaldavad loomulike keele liidesed inseneritel keskenduda eesmärkide defineerimisele, mitte iga tegevusjärjestuse programmeerimisele. See nihuke võib kiirendada robotite rakenduste arendamist paljudes valdkondades, sealhulgas tootmis, inspektsioon ja logistika.
Lihtsalt kuigi rakendus on endiselt eksperimentaalne, peegeldab demonstreerimine laiemaid trende füüsilises AI-s, kus alusmudelid kasutatakse üha rohkem masinatõlgenduse ja otsustusvõime täiustamiseks. Mõlemad ettevõtted on andnud märku, et edasi arendatakse veel, sealhulgas Gemini-põhiste süsteemide jätkuvat integreerimist robotiplatvormidesse.
Koostöö viitab üleminekule intuitiivsemale inim-masin suhtlusele, kus keerukat robotite käitumist saab juhtida lihtsustatud sisenditega. Kuna AI-mudelid edenevad, võivad sellised integreerimised laiendada autonoomsete süsteemide funktsionaalset ulatust samas kui vähendavad nende deployimise tehnilisi takistusi.
Postitus „Google ja Boston Dynamics integreerivad Gemini Roboticsi mudelid Spoti neljajalgse roboti tarkvarasse täiustatud tajumise ja ülesannete täitmise jaoks“ ilmus esimesena Metaverse Post’is.


