aifeed.skAI Feed
AI modely2 min čítania

Google DeepMind posúva robotiku bližšie k praxi

Google DeepMind uviedol Gemini Robotics ER-1.6, novú verziu reasoning-first modelu pre robotiku. Dôležité nie je len lepšie priestorové uvažovanie, ale aj to, že model vie čítať analógové ukazovatele a Google ho sprístupňuje cez Gemini API a AI Studio.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja
Kurátorovaný súhrn
Zdroj / autorita
AI Feed

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI modely a opiera sa o 3 zdroje.

Google DeepMind predstavil Gemini Robotics ER-1.6, novú verziu modelu zameraného na tzv. embodied reasoning, teda uvažovanie nad fyzickým svetom. Na prvý pohľad to môže vyzerať ako ďalší laboratórny update, no tentoraz ide o posun, ktorý je zaujímavý aj pre firmy a vývojárov mimo výskumu. Google tvrdí, že model výrazne zlepšuje vizuálne a priestorové chápanie scény, plánovanie krokov aj odhad, či bol fyzický task úspešne dokončený.

Najpraktickejšia novinka je schopnosť čítať prístroje a ukazovatele. DeepMind explicitne uvádza prácu s gauge metrami a sight glass indikátormi, teda s typom vizuálnych signálov, ktoré sú bežné v priemysle, logistike či údržbe zariadení. To je dôležité, pretože veľa reálnych robotických workflow stále naráža na prostý problém: robot síce vie "vidieť", ale nevie dostatočne spoľahlivo interpretovať stav fyzického systému tak, ako to robí človek pri obhliadke stroja alebo výrobnej linky.

Google zároveň priznáva, že k tejto schopnosti sa dostal aj cez spoluprácu s Boston Dynamics. Práve to naznačuje, že nejde len o akademický benchmark, ale o smerovanie k nasadeniam, kde robot pracuje v komplexnom prostredí a potrebuje robiť rozhodnutia podľa toho, čo vidí na paneloch, meračoch a kontrolných bodoch. Pre podnikové tímy je zaujímavé aj to, že Google pri ER-1.6 zdôrazňuje bezpečnostné správanie modelu pri adversariálnych priestorových úlohách a lepšie dodržiavanie fyzických obmedzení.

Silný signál prichádza aj z distribúcie. Gemini Robotics ER-1.6 je od dneška dostupný cez Gemini API a Google AI Studio, takže nejde len o interný výskumný artefakt. To znižuje bariéru pre experimentovanie: vývojári môžu rýchlejšie testovať robotické scenáre, multimodálne pipeline a integrácie so systémami, ktoré kombinujú vizuálne vnímanie, plánovanie a akciu. V praxi to môže urýchliť prototypovanie robotických asistentov pre inšpekcie, servis, skladové operácie alebo bezpečnostné kontroly.

Dôležité je aj širšie čítanie tejto novinky. Veľké AI firmy už nesúťažia iba v chatbotových benchmarkoch, ale čoraz viac v tom, kto dokáže preniesť modelové schopnosti do fyzického sveta. Ak sa ukáže, že ER-1.6 vie spoľahlivo generalizovať medzi rôznymi prostrediami a typmi zariadení, Google si tým buduje výhodu v segmente, kde sa bude spájať AI softvér, senzory, edge compute a priemyselná automatizácia. Pre trh je preto podstatné nielen samotné demo, ale aj to, že Google už túto vrstvu začína baliť do dostupných developer nástrojov.

Z pohľadu AIFeedu ide o tému, ktorú sa oplatí sledovať ďalej: ak sa okolo Gemini Robotics začne rýchlo tvoriť partnerský ekosystém, môže ísť o jeden z momentov, keď sa "agentic AI" presunie z kancelárskeho softvéru do robotiky, údržby a priemyselných workflow. Nie každé AI oznámenie má priamy praktický dopad, ale schopnosť interpretovať fyzické rozhrania a robiť bezpečnejšie rozhodnutia v priestore je presne ten typ pokroku, ktorý vie meniť nasadenie v teréne, nie iba prezentácie na pódiu.

Zdroje:

  • Google Blog: Gemini Robotics ER-1.6 enhances reasoning to help robots navigate real-world tasks.
  • Google DeepMind Blog: Gemini Robotics ER 1.6: Enhanced Embodied Reasoning.
  • Google News radar: sekundárne pokrytie témy v IEEE Spectrum a Robot Report potvrdilo praktický záujem trhu okolo integrácie s robotikou Boston Dynamics.

Zdroje

Súvisiace čítanie

Ďalšie články k téme

Viac z kategórie
Cerebras porovnáva Kimi K2.6 s Gemini 3.5 Flash na rýchlej inferencii
Modely

Cerebras porovnáva Kimi K2.6 s Gemini 3.5 Flash na rýchlej inferencii

Cerebras tvrdí, že otvorenejší model Kimi K2.6 na jeho infraštruktúre dosahuje podobnú inteligenciu ako Gemini 3.5 Flash, ale výrazne vyššiu rýchlosť výstupu. Porovnanie ukazuje, ako sa pri agentoch čoraz viac hodnotí latencia a počet tokenov za sekundu, nielen skóre benchmarkov.