AI produkty23. júna 20263 min čítania

IBM ukazuje CUGA na dvoch desiatkach agentických aplikácií

IBM Research publikoval na Hugging Face príklady agentických aplikácií postavených na CUGA. Harness má skryť orchestrace, stav, guardrails a multiagentné delegovanie za jednoduchšie rozhranie.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AI Feed

#open source #IBM Research #Hugging Face #agentické aplikácie #CUGA

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI produkty a opiera sa o 3 zdroje.

IBM Research zverejnil na Hugging Face praktickú ukážku CUGA, otvoreného agentického harnessu, ktorý má vývojárom ušetriť opakované skladanie runtime infraštruktúry. Namiesto ďalšieho veľkého frameworku s mnohými vrstvami článok zdôrazňuje jednoduchý model: vývojár definuje zoznam nástrojov a prompt, zatiaľ čo CUGA rieši plánovanie, beh nástrojov, stav, reflexiu, guardrails a prechod od jedného agenta k viacerým.

CUGA znamená Configurable Generalist Agent. IBM ho opisuje ako agent harness pre podnikové použitie, teda vrstvu, ktorá nesie mechaniku agentického systému. V typickom demo agente vyzerá všetko jednoducho, kým nepríde potreba riešiť stav medzi krokmi, bezpečné spúšťanie kódu, výmenu modelových providerov, kontrolu nástrojov alebo delegovanie medzi agentmi. Práve tieto časti sa v praxi často píšu znova a znova.

Nový príspevok nie je iba oznámením knižnice. IBM k nemu pripojil repozitár cuga-apps s približne dvomi desiatkami malých aplikácií, ktoré majú slúžiť ako čitateľné východiskové body. Medzi príkladmi sú filmový odporúčač, webový výskumník, arXiv Paper Scout, wiki prieskum, mestské briefingy, cestovné a receptové aplikácie, RAG nad PDF, audiosúbormi a videom, ops monitoring, agent nad IBM produktovou dokumentáciou aj viacagentný lead-generation systém.

Hodnota takýchto príkladov je v tom, že posúvajú diskusiu od abstraktného „agent frameworku“ k otázke, čo musí agent robiť pri reálnej úlohe. Ak má napríklad odporúčať architektúru v IBM Cloud, nestačí mu všeobecný textový model. Potrebuje nástroj na vyhľadanie skutočných služieb v katalógu, pravidlo, že odporúčania má opierať o katalóg, a spôsob, ako prípadne doplniť informácie z webu. CUGA sa snaží tieto prvky zabaliť do malej konštrukcie agenta.

Článok uvádza, že CUGA podporuje plánovanie pred akciou, tool calling, CodeAct štýl spúšťania generovaného kódu, execution loop, sledovanie premenných, reflexiu, deklaratívne guardrails, multiagentné delegovanie cez A2A, Docling-powered RAG a integrácie s OpenAPI, MCP a LangChain nástrojmi. Vývojár má pritom používať malú API plochu: vytvoriť CugaAgent so zoznamom nástrojov a promptom a zavolať agent.invoke.

Zaujímavé je aj nasadenie na open-weight modeli. Hosted príklady podľa článku bežia na gpt-oss-120b, nie na uzavretom frontier API. IBM tým naznačuje, že časť schopností agenta môže niesť harness: plánovanie, reflexia, stav a pravidlá môžu pomôcť menším alebo otvorenejším modelom zvládnuť úlohy, pri ktorých by samotný model bez runtime podpory zlyhával. To je dôležitý smer pre firmy, ktoré nechcú viazať všetky agentické systémy na jedného providera.

CUGA podporuje prepínanie providerov cez konfiguráciu vrátane OpenAI, Anthropic, IBM watsonx, LiteLLM a Ollama. Spúšťanie kódu môže bežať lokálne, v Dockeri alebo Podmane, prípadne cez E2B cloud. Takáto prenositeľnosť je pri enterprise agentoch praktická, pretože rovnaká aplikácia môže začínať ako experiment v lokálnom prostredí a neskôr potrebovať auditovateľný, izolovaný a spravovaný runtime.

IBM zároveň uvádza benchmarkové výsledky CUGA na AppWorld a WebArena. Tieto tvrdenia treba vnímať ako súčasť prezentácie projektu, nie ako samostatné nezávislé hodnotenie. Dôležitejší signál je však architektonický: agentické aplikácie potrebujú čoraz viac runtime prvkov, ktoré nie sú priamo „inteligenciou“ modelu, ale rozhodujú o spoľahlivosti systému.

Pre vývojárov je praktický prínos v možnosti kopírovať malé, jedno-súborové aplikácie a upravovať ich podľa vlastných nástrojov. Pre firmy je dôležitejší dôraz na guardrails, správu stavu, modelovú prenositeľnosť a viacagentné delegovanie. CUGA tak vstupuje do preplneného priestoru agentických nástrojov s pomerne jasným argumentom: menej ručného lepenia okolo modelu a viac opakovateľnej runtime vrstvy, ktorú možno preniesť z prototypu do spravovaného prostredia.

Zdroje

IBM ukazuje CUGA na dvoch desiatkach agentických aplikácií

Ďalšie články k téme

OpenAI rozširuje Daybreak: od hľadania zraniteľností k ich opravám

AWS ukazuje, ako izolovať tenantov v zdieľaných AI agentoch

Pydantic AI 2.0 je stabilný a stavia agentov okolo capabilities