BAIR mapuje nový smer škálovania uvažovania: model si sám rozdelí úlohu paralelne
Výskumníci z BAIR opisujú posun od dlhého lineárneho reťazca uvažovania k adaptívnemu paralelnému riešeniu, ktoré má znižovať latenciu aj chaos v kontexte.
Tag
Všetky publikované články, v ktorých sa téma agenti objavuje ako dôležitý kontext. Aktuálne 61 textov v archíve.
Výskumníci z BAIR opisujú posun od dlhého lineárneho reťazca uvažovania k adaptívnemu paralelnému riešeniu, ktoré má znižovať latenciu aj chaos v kontexte.
Nové vydanie PydanticAI 1.91.0 prináša podporu volieb pre OpenAI gpt-image-2, nové modely deepseek-v4-flash a deepseek-v4-pro a zároveň opravuje viacero chýb, ktoré zasahovali eval datasety, mapovanie odpovedí aj prehrávanie MCP histórie pri volaní nástrojov.
OpenAI spustil B2B Signals, nový prehľad podnikovej adopcie AI. Prvá sada zistení tvrdí, že rozdiel medzi bežnými firmami a špičkou už netvorí len počet licencií, ale najmä hĺbka používania a presun k delegovanej práci s agentmi a nástrojmi typu Codex.
Anthropic predstavil desať pripravených agentických šablón pre finančné služby a poisťovníctvo. Nové workflow sa prepájajú s Claude Cowork, Claude Code, Managed Agents, Microsoft 365 aj externými dátovými konektormi a mieria priamo na KYC, pitchbooky či mesačné uzávierky.
Projekt llama.cpp vydal zmenu, ktorá pri serverovom štarte overuje argument --tools voči známym názvom nástrojov. Namiesto tichého ignorovania preklepov alebo neplatných položiek teraz server skončí s chybou a vypíše dostupné možnosti, čo znižuje riziko nenápadných produkčných chýb.
Amazon rozširuje SageMaker AI o agentom riadené workflow pre úpravu modelov. Vývojár opíše use case prirodzeným jazykom a systém ho cez pripravené skills prevedie plánovaním, fine-tuningom, evaluáciou aj nasadením.
Amazon Bedrock AgentCore pridáva vrstvu, ktorá z produkčných trás navrhuje úpravy promptov a popisov nástrojov a vie ich overovať dávkovým hodnotením aj A/B testom. Je to dôležitý posun od stavania agentov k ich systematickému dolaďovaniu po nasadení.
Pinecone predstavilo Nexus ako novú vrstvu nad vektorovou databázou: namiesto posielania surových dokumentov modelu chce agentom dodávať pripravený, povolený a sledovateľný kontext.
Apple vo výskumnej práci Reinforced Agent navrhuje, aby druhý model kontroloval plánované volania nástrojov ešte pred ich vykonaním. Cieľom je znížiť počet chýb bez retrénovania hlavného agenta a merať prínos aj riziko takejto spätnej väzby priamo počas inferencie.
Nové vydanie PydanticAI neprináša marketingový rebrand, ale tri praktické zmeny pre agentické aplikácie: stabilnejšie korelovanie behov, dynamické capabilities a jemnejšie prepísanie vstavaných nástrojov pri override agenta.
Apple zverejnil výskum PORTool, ktorý sa snaží zlepšiť tréning agentov pracujúcich s externými nástrojmi. Namiesto odmeňovania len podľa finálneho výsledku rozdeľuje zásluhu aj po jednotlivých krokoch, aby model lepšie pochopil, ktoré volania nástrojov boli skutočne užitočné.
Cloudflare spolu so Stripe predstavil tok, v ktorom môže AI agent založiť účet, aktivovať platený plán, zaregistrovať doménu a hneď nasadiť aplikáciu bez ručného kopírovania tokenov či práce v dashboarde.