AI modely15. apríla 20262 min čítania

Google DeepMind posúva robotiku bližšie k praxi

Google DeepMind uviedol Gemini Robotics ER-1.6, novú verziu reasoning-first modelu pre robotiku. Dôležité nie je len lepšie priestorové uvažovanie, ale aj to, že model vie čítať analógové ukazovatele a Google ho sprístupňuje cez Gemini API a AI Studio.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AI Feed

#Google DeepMind #Gemini Robotics #robotika #AI Studio #Boston Dynamics

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI modely a opiera sa o 3 zdroje.

Google DeepMind predstavil Gemini Robotics ER-1.6, novú verziu modelu zameraného na tzv. embodied reasoning, teda uvažovanie nad fyzickým svetom. Na prvý pohľad to môže vyzerať ako ďalší laboratórny update, no tentoraz ide o posun, ktorý je zaujímavý aj pre firmy a vývojárov mimo výskumu. Google tvrdí, že model výrazne zlepšuje vizuálne a priestorové chápanie scény, plánovanie krokov aj odhad, či bol fyzický task úspešne dokončený.

Najpraktickejšia novinka je schopnosť čítať prístroje a ukazovatele. DeepMind explicitne uvádza prácu s gauge metrami a sight glass indikátormi, teda s typom vizuálnych signálov, ktoré sú bežné v priemysle, logistike či údržbe zariadení. To je dôležité, pretože veľa reálnych robotických workflow stále naráža na prostý problém: robot síce vie "vidieť", ale nevie dostatočne spoľahlivo interpretovať stav fyzického systému tak, ako to robí človek pri obhliadke stroja alebo výrobnej linky.

Google zároveň priznáva, že k tejto schopnosti sa dostal aj cez spoluprácu s Boston Dynamics. Práve to naznačuje, že nejde len o akademický benchmark, ale o smerovanie k nasadeniam, kde robot pracuje v komplexnom prostredí a potrebuje robiť rozhodnutia podľa toho, čo vidí na paneloch, meračoch a kontrolných bodoch. Pre podnikové tímy je zaujímavé aj to, že Google pri ER-1.6 zdôrazňuje bezpečnostné správanie modelu pri adversariálnych priestorových úlohách a lepšie dodržiavanie fyzických obmedzení.

Silný signál prichádza aj z distribúcie. Gemini Robotics ER-1.6 je od dneška dostupný cez Gemini API a Google AI Studio, takže nejde len o interný výskumný artefakt. To znižuje bariéru pre experimentovanie: vývojári môžu rýchlejšie testovať robotické scenáre, multimodálne pipeline a integrácie so systémami, ktoré kombinujú vizuálne vnímanie, plánovanie a akciu. V praxi to môže urýchliť prototypovanie robotických asistentov pre inšpekcie, servis, skladové operácie alebo bezpečnostné kontroly.

Dôležité je aj širšie čítanie tejto novinky. Veľké AI firmy už nesúťažia iba v chatbotových benchmarkoch, ale čoraz viac v tom, kto dokáže preniesť modelové schopnosti do fyzického sveta. Ak sa ukáže, že ER-1.6 vie spoľahlivo generalizovať medzi rôznymi prostrediami a typmi zariadení, Google si tým buduje výhodu v segmente, kde sa bude spájať AI softvér, senzory, edge compute a priemyselná automatizácia. Pre trh je preto podstatné nielen samotné demo, ale aj to, že Google už túto vrstvu začína baliť do dostupných developer nástrojov.

Z pohľadu AIFeedu ide o tému, ktorú sa oplatí sledovať ďalej: ak sa okolo Gemini Robotics začne rýchlo tvoriť partnerský ekosystém, môže ísť o jeden z momentov, keď sa "agentic AI" presunie z kancelárskeho softvéru do robotiky, údržby a priemyselných workflow. Nie každé AI oznámenie má priamy praktický dopad, ale schopnosť interpretovať fyzické rozhrania a robiť bezpečnejšie rozhodnutia v priestore je presne ten typ pokroku, ktorý vie meniť nasadenie v teréne, nie iba prezentácie na pódiu.

Zdroje:

Google Blog: Gemini Robotics ER-1.6 enhances reasoning to help robots navigate real-world tasks.
Google DeepMind Blog: Gemini Robotics ER 1.6: Enhanced Embodied Reasoning.
Google News radar: sekundárne pokrytie témy v IEEE Spectrum a Robot Report potvrdilo praktický záujem trhu okolo integrácie s robotikou Boston Dynamics.

Zdroje

Google DeepMind posúva robotiku bližšie k praxi

Ďalšie články k téme

Claude Opus 5 cieli na dlhé agentické úlohy a prináša miliónový kontext

Hugging Face a NVIDIA mapujú simuláciu ako tréningové ihrisko pre fyzickú AI

Google vydáva Gemini 3.6 Flash a rýchlejší Flash-Lite pre agentické workflowy