AI výskum20. apríla 20263 min čítania

PolicyBank chce naučiť AI agentov spresňovať firemné pravidlá ešte pred nasadením

Práca PolicyBank rieši problém, ktorý agentickým systémom hrozí v každej firme: pravidlá v prirodzenom jazyku sú neúplné, nejednoznačné a model ich často chápe „poslušne, ale nesprávne“. Autori preto navrhujú pamäťový mechanizmus, ktorý si cez testovanie a spätnú väzbu spresňuje výklad politiky ešte pred ostrou prevádzkou.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AI Feed

#governance #enterprise AI #AI agenti #arXiv #policy #PolicyBank

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI výskum a opiera sa o 2 zdroje.

Jedným z najväčších slabých miest dnešných AI agentov nie je samotné volanie nástrojov, ale interpretácia pravidiel, podľa ktorých sa majú správať. Firemné politiky, autorizačné obmedzenia a interné procesy bývajú popísané prirodzeným jazykom, čo znamená, že obsahujú medzery, výnimky a nejasnosti. Práca PolicyBank stavia práve na tomto probléme. Autori vychádzajú z pozorovania, že agent sa môže správať „v súlade s textom“, ale pritom stále robiť nesprávne rozhodnutia, pretože pravidlo chápe príliš doslovne alebo naopak priveľmi voľne. Namiesto slepej viery v nemenný policy prompt preto navrhujú mechanizmus, ktorý dokáže výklad pravidiel postupne spresňovať.

PolicyBank funguje ako štruktúrovaná pamäť politiky na úrovni nástrojov a akcií. Agent počas predprodukčného testovania dostáva korektívnu spätnú väzbu, z ktorej si neukladá iba výsledok, ale aj konkrétne poznatky o tom, ako sa má pravidlo interpretovať v praxi. To je zásadný rozdiel oproti mnohým dnešným memory prístupom, ktoré policy text berú ako nemennú pravdu a následne len zosilňujú chybný výklad. PolicyBank teda nepridáva iba ďalší buffer spomienok, ale mení samotný vzťah medzi agentom a pravidlami: z pasívneho vykonávateľa sa má stať systém, ktorý sa vie poučiť z konfliktov medzi textom a skutočným zámerom organizácie.

Autori navyše pripravili aj testbed s kontrolovanými „policy gaps“, teda so zámerne vloženými medzerami medzi doslovným znením pravidla a tým, čo sa od agenta naozaj očakáva. To je veľmi cenné, pretože v agentickom hype sa často miešajú dva odlišné problémy: model nevie vykonať nástroj, alebo síce nástroj vykonať vie, ale nesprávne chápe hranice oprávnení. PolicyBank cieli na druhý problém, ktorý bude v enterprise nasadeniach čoraz dôležitejší. Firmy nepotrebujú agenta, ktorý „vie zavolať API“, ale agenta, ktorý správne rozumie, kedy ho smie zavolať, za akých podmienok a s akým rozsahom oprávnenia.

Na papieri sú výsledky silné: oproti existujúcim memory mechanizmom dosahuje PolicyBank výrazne lepšie správanie v scenároch s medzerami v špecifikácii a podľa autorov uzatvára až 82 percent rozdielu oproti ľudskému orákulu. Samozrejme, takéto číslo treba čítať opatrne. Neznamená to, že problém compliance je vyriešený, ale že systematická spätná väzba a explicitná policy pamäť môžu dramaticky znížiť počet prípadov, keď agent pôsobí sebavedomo a pritom porušuje reálny zámer organizácie.

Praktický dopad je široký. Dnes sa veľa pozornosti venuje guardrailom, klasifikátorom a schvaľovacím workflow na konci procesu. PolicyBank posúva governance skôr na úroveň priebežného učenia sa organizácii. To by mohlo byť obzvlášť dôležité v oblastiach ako interné IT, financie, HR alebo zdravotníctvo, kde pravidlá nebývajú iba technické, ale aj procedurálne a kontextové. Agent, ktorý sa dokáže naučiť jemnejší výklad politiky ešte pred ostrým nasadením, môže znížiť počet drahých incidentov aj potrebu nadmerne rigidných blokácií.

Zároveň však treba vidieť riziko: ak bude „evolúcia policy“ prebiehať nejasne alebo bez silného auditu, môže sa z nej stať ďalšia nepriehľadná vrstva, ktorú nebude nik vedieť vysvetliť. Podniková governance potom nesmie skončiť pri tom, že agent si „nejako“ pravidlá spresnil. Bude potrebné zaznamenávať, z akej spätnej väzby sa učil, kto ju poskytol, aké výnimky sa vytvorili a ako sa táto pamäť prenáša medzi verziami systému. Inak sa compliance problém len presunie z promptu do pamäte.

Pre dodávateľov enterprise AI je však odkaz jasný. Nestačí posielať klientom dlhý policy prompt a tvrdiť, že agent je bezpečný. S rastúcou komplexnosťou firemných workflow budú rozhodovať nástroje, ktoré vedia pracovať s neúplnosťou pravidiel, učiť sa z korekcií a zachovať auditnú stopu. PolicyBank naznačuje, že pamäť agenta nebude konkurenčnou výhodou len pre produktivitu, ale aj pre dodržiavanie pravidiel.

Táto práca preto dobre zapadá do širšieho posunu od „smart assistantov“ k agentom, ktorí musia niesť operačnú zodpovednosť. Čím viac budú AI systémy konať v mene organizácií, tým menej bude stačiť iba dobré jazykové porozumenie. Rozhodovať začne schopnosť premeniť neostrý firemný text na stabilné a korigovateľné správanie. A práve tam môže byť PolicyBank jedným z dôležitých stavebných blokov ďalšej generácie enterprise agentov.

Zdroje

PolicyBank chce naučiť AI agentov spresňovať firemné pravidlá ešte pred nasadením

Ďalšie články k téme

PydanticAI 2.18 prepája agentov s Bedrock Mantle a rozširuje riadenie nástrojov

Claude Opus 5 cieli na dlhé agentické úlohy a prináša miliónový kontext

PydanticAI 2.17 zrýchľuje telemetriu a opravuje spracovanie blokov Model Armor