Hugging Face a partneri otvárajú OpenEnv pre tréning agentov
OpenEnv sa presúva pod otvorenejší koordinačný model. Cieľom je spoločné prostredie, v ktorom sa budú dať trénovať a hodnotiť agentické modely pracujúce s nástrojmi.
Tag
Všetky publikované články, v ktorých sa téma agenti objavuje ako dôležitý kontext. Aktuálne 61 textov v archíve.
OpenEnv sa presúva pod otvorenejší koordinačný model. Cieľom je spoločné prostredie, v ktorom sa budú dať trénovať a hodnotiť agentické modely pracujúce s nástrojmi.
PydanticAI zverejnil v2.0.0b6 aj stabilné vydanie v1.106.0. Nejde o veľký prelomový release, ale o praktickú údržbu agentického frameworku: pribudli nastavenia pre xAI a opravy okolo streamovania či dátových URI.
Prvá beta PydanticAI 2.0 prináša návrh orientovaný na capabilities: opakovateľné balíky nástrojov, inštrukcií a životného cyklu agentov.
Mastra pridala natívnu podporu pre Agent-to-Agent protokol. Vývojári tak môžu pripájať vzdialených agentov z iných frameworkov ako subagentov alebo ich volať cez klientské SDK bez vlastnej integračnej vrstvy.
OpenAI a Databricks tvrdia, že GPT-5.5 sa po zlepšení na internom benchmarku OfficeQA Pro dostáva do podnikových agentických workflow cez AgentBricks a Unity AI Gateway.
Nové vydanie PydanticAI presúva integráciu Model Context Protocolu na nový MCPToolset, stabilizuje grafové workflow mimo beta a začína výraznejšie čistenie API pred pripravovanou verziou 2.
OpenAI presúva Codex z desktopu aj na iPhone a Android, dopĺňa Remote SSH, programové tokeny a produkčné hooks. Výsledkom je model, v ktorom sa dlhé programátorské úlohy dajú priebežne schvaľovať a korigovať aj mimo pracovného stola.
Nový arXiv paper navrhuje tréningový rámec, v ktorom si jazykový model počas posilňovaného učenia pýta cielenú pomoc od troch špecializovaných agentov. Autori tvrdia, že takto vie zlepšiť matematické, vedecké aj programátorské úlohy bez toho, aby po tréningu na pomocníkov ďalej spoliehal.
Nový benchmark ABRA neposudzuje len to, či model vie odpovedať na otázku k obrázku, ale či sa dokáže orientovať v reálnom rádiologickom prostredí, prepínať série, hýbať sa po rezoch a vytvoriť štruktúrovaný výstup, aký by mal zmysel aj mimo laboratória.
AWS sprístupnilo natívny Claude Platform priamo cez AWS účet, IAM a Marketplace billing. Novinka mení spôsob, akým môžu firmy nakupovať a auditovať nástroje Anthropicu, hoci samotné spracovanie dát ostáva mimo bezpečnostnej hranice AWS.
Výskumníci navrhujú model, ktorý z lineárnych záznamov workflow odhaľuje skryté závislosti medzi krokmi. Namiesto predstavy, že každý krok musí nasledovať presne po inom, hľadajú latentné čiastočné poradie vhodnejšie pre agentov aj automatizované procesy.
OpenAI prvýkrát detailnejšie opisuje, ako interne riadi kódujúceho agenta Codex. Namiesto voľného prístupu stavia na sandboxe, jemnom dávkovaní oprávnení, obmedzenej sieti a auditných stopách priamo na úrovni agentických akcií.