AI výskum19. apríla 20263 min čítania

AI21 skladá agentov modulárne: orchestrace má byť auditovateľná, nie len plynulá

AI21 tvrdí, že budúcnosť agentov nie je v jednom veľkom black-boxe, ale v modulárnom rozdelení na reasoning, plánovanie a exekúciu. Takáto architektúra má zlepšiť auditovateľnosť, diagnostiku chýb aj praktické ladenie enterprise workflow.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AI Feed

#agenti #enterprise AI #evaluácie #AI21 #orchestrácia

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI výskum a opiera sa o 2 zdroje.

AI21 vo februárovom texte o „modular intelligence“ zarámovalo jednu z najdôležitejších architektonických otázok súčasnej agentickej vlny: má byť inteligentný systém jeden nepriehľadný tok, alebo skladba jasne oddelených komponentov? Firma sa prikláňa k druhej možnosti a svoju argumentáciu opiera nielen o inžiniersku prax, ale aj o analógiu s psycholingvistikou. Pointa je zrozumiteľná aj mimo akademického kontextu: pri zložitých podnikových úlohách nestačí vedieť, že agent dodal presvedčivú finálnu odpoveď. Dôležité je aj to, ako k nej dospel, čo sa pokazilo v strede procesu a ktorý krok treba opraviť.

AI21 preto hovorí o rozdelení systému na diskrétne vrstvy reasoning, plánovania a vykonania. V jej rámci Maestro nefunguje ako jeden monolitický modelový hovor, ale ako orchestrátor, v ktorom sa zámer, plán a realizácia oddeľujú natoľko, aby sa dali samostatne testovať. Z pohľadu produktu je to podstatný posun. Mnohé dnešné agentické demá vyzerajú pôsobivo, no pri reálnom nasadení narážajú na „context drift“: systém počas dlhšieho workflow stratí pôvodný cieľ, zamieša dôkazy, alebo zmení interpretáciu úlohy po tom, čo sa mu rozrastie kontextové okno. AI21 tvrdí, že explicitný plán túto stratu zámeru obmedzuje a zároveň vytvára stopu, ktorú možno auditovať.

Takýto prístup je dôležitý najmä pre enterprise prostredie, kde agent nie je len chatovací doplnok, ale súčasť procesu s konkrétnou zodpovednosťou. Ak firemný agent nesprávne vyhodnotí, či má viesť konverzáciu, alebo spustiť investigatívny workflow nad dokumentmi a tabuľkami, chyba nevzniká až vo finálnom texte. Vzniká už pri routingu. Pri modulárnej architektúre možno tento routing testovať samostatne, oddeliť ho od retrieval vrstvy a syntézy a zistiť, či problém nie je v tom, že agent siahol po nesprávnych dokumentoch, nie v tom, že nevie pekne formulovať odpoveď.

AI21 tým ide proti veľmi rozšírenému pokušeniu hodnotiť agentov iba cez dojem z koncového výstupu. Plynulý text totiž môže zakryť nekvalitné retrieval rozhodnutie, prácu so zastaraným dokumentom alebo syntézu, ktorá znie dobre, ale nie je verná získaným dôkazom. Modulárna skladba má tento problém riešiť tým, že každému komponentu priradí vlastný subcieľ a vlastnú metriku. Routing sa dá merať ako klasifikačná presnosť, retrieval ako precision a recall voči referenčným dokumentom a syntézu možno hodnotiť cez faithfulness a coverage. V dôsledku toho sa zlepšuje nielen diagnostika chýb, ale aj ekonomika zlepšovania systému: netreba prestavovať celý stack, keď zlyháva len jedna vrstva.

Praktický význam tejto debaty rastie spolu s tým, ako firmy skúšajú agentov na interné znalostné workflow, compliance, podporné tímy či analytiku. V týchto prípadoch nie je cieľom vyrobiť „najkrajšiu odpoveď“, ale stabilne sa dostať ku korektnému výsledku pod obmedzeniami dátových prístupov, politiky a latencie. AI21 sa snaží presvedčiť trh, že modularita nie je akademický luxus, ale predpoklad auditovateľnosti. To je dôležitý odkaz aj pre zákazníkov, ktorí dnes porovnávajú produkty najmä cez názov modelu. V enterprise praxi môže byť oveľa podstatnejšie, akú štruktúru má celý agentický workflow a či sa dá rozumne ladiť.

Súčasne ide o trend, ktorý zapadá do širšieho posunu od „jedného veľkého modelu“ k systémom zloženým z viacerých špecializovaných častí. AI21 tým vlastne hovorí, že ďalšou konkurenčnou výhodou nebude iba veľkosť alebo latentná schopnosť modelu, ale aj kvalita orchestrácie medzi vrstvami. To sa dotýka vývojárskych tímov, ktoré dnes stavajú na MCP, retrieval nástrojoch, verifikátoroch a externých akciách. Keď systém zlyhá, potrebujú vidieť, či sa pomýlil plánovač, nástroj, alebo samotná odpoveď. Bez tohto rozdelenia sa ladenie agentov rýchlo mení na hľadanie ihly v kope sena.

Pre AI Feed je zaujímavé, že AI21 túto tému nepredáva iba ako vlastnú platformovú funkcionalitu, ale ako návrh na to, ako by sa mali agenti vo firmách vôbec navrhovať. Ak sa tento pohľad presadí, bude to znamenať tlak na nové evaluačné rámce, lepšie tracing nástroje a dôraz na verifikáciu medzi-krokov. Inými slovami: trh sa môže posunúť od obdivu k plynulosti smerom k štrukturálnej transparentnosti. A práve to bude pravdepodobne deliaca línia medzi efektnými demami a systémami, ktoré si firmy pustia k reálnym procesom.

Zdroje

AI21 skladá agentov modulárne: orchestrace má byť auditovateľná, nie len plynulá

Ďalšie články k téme

ABot-Earth 0.5 skúša generovať rozsiahle 3D svety zo satelitných snímok

Snowflake sprístupňuje Claude Fable 5 v Cortex AI ako privátny model pre podnikové dáta

OpenAI ukazuje, ako LSEG škáluje dôveryhodnú AI vo finančných dátach