AWS ukazuje SFT a DPO pre presnejšie volanie nástrojov agentmi
AWS zverejnil praktický postup, ako na SageMaker AI dolaďovať malý jazykový model na tool-calling pomocou SFT a DPO a merať výsledok na datasete When2Call.
Hlavný výber redakcie
AWS oznámil dostupnosť modelu NEXUS od Fundamental na SageMaker JumpStart. Ide o špecializovaný foundation model pre predikcie zo štruktúrovaných podnikových dát.
Najnovšie
Kurátorované AI správy v tempe redakčného magazínu: nové modely, produktové vydania, výskum aj trhové pohyby.
AWS zverejnil praktický postup, ako na SageMaker AI dolaďovať malý jazykový model na tool-calling pomocou SFT a DPO a merať výsledok na datasete When2Call.
Dharma-AI opisuje, ako sa dá Direct Preference Optimization použiť na potláčanie opakovacích slučiek v OCR modeloch, nie iba na ladenie chatbotových odpovedí.
OpenAI zverejnila návrh, ako má USA riadiť najvýkonnejšie AI systémy: opiera sa o federálny rámec, hodnotenia rizík, incident reporting a posilnenie inštitúcie CAISI.
Snowflake na Summite 2026 predstavil bezpečnostné funkcie pre agentickú AI: identitu agentov, ochranu pred prompt injection, sandbox pre nástroje, detekciu exfiltrácie dát a nové riadenie bezpečnostnej pozície v Trust Center.
Baz postavil nad Amazon Bedrock AgentCore agenta, ktorý porovnáva pull request s požiadavkami z Figma a Jira a testuje dočasné prostredie v prehliadači. Prípadová štúdia ukazuje, kam sa posúva code review: od syntaxe k overovaniu produktu.
Preprint na arXiv skúma chain-of-thought ako iteratívne spresňovanie odhadu v zjednodušenom modeli in-context učenia. Autori opisujú prechody medzi rýchlym zlepšovaním, saturáciou a overthinkingom.
AI sprievodca
Sprievodca pracuje s poslednými publikovanými textami AIFeed.sk a pripraví rýchle zhrnutie, odporúčané čítanie alebo prehľad trendov.
Tematické sekcie
Každá sekcia sa plní automaticky z publikovaného obsahu. Dôraz je na čitateľnosť, obrazový rytmus a jasné rozdelenie tém.
Novinky
Prehľad kľúčových oznámení, partnerstiev, regulačných posunov a trhových signálov.
OpenAI zverejnila návrh, ako má USA riadiť najvýkonnejšie AI systémy: opiera sa o federálny rámec, hodnotenia rizík, incident reporting a posilnenie inštitúcie CAISI.
Dve nové technické novinky okolo Amazon Bedrock AgentCore ukazujú, že produkční agenti potrebujú samostatnú bezpečnostnú vrstvu. AWS pridáva prácu s vlastnými Secrets Manager tajomstvami a návod na OAuth tok pre MCP klientov.
OpenAI pred summitom G7 vyzýva na trvalejšiu koordináciu pravidiel pre mladých používateľov AI. Firma chce inštitút, ktorý by zbieral dôkazy, vydával praktické odporúčania a pomáhal nastaviť vekovo primerané ochrany.
SoftBank oznámil zámer vybudovať vo Francúzsku AI dátové centrá s kapacitou do 5 GW a investíciou až 75 miliárd eur. Prvá fáza má priniesť 3,1 GW do roku 2031 a posilniť európsku výpočtovú infraštruktúru pre umelú inteligenciu.
Modely
Nové foundation modely, benchmarky, multimodálne schopnosti a vývoj inferencie.
H Company vydala Holo3.1 na Hugging Face. Rodina modelov cieli na počítačových agentov naprieč webom, desktopom a mobilom, vrátane kvantovaných checkpointov pre lokálnu inferenciu.
Mellum2 má 12 miliárd parametrov, ale pri každom tokene aktivuje približne 2,5 miliardy. JetBrains ho cez Hugging Face ponúka ako otvorený model pre routovanie, RAG, subagentov a nízkolatenčné kódové workflow.
NVIDIA a Hugging Face sprístupnili Cosmos 3 ako jednotný model pre generovanie svetov, fyzikálne uvažovanie a akcie. Pre robotiku a autonómne systémy je dôležité najmä to, že časť modelov, dát a nástrojov je dostupná otvorene.
xAI otvorilo model grok-build-0.1 v API. Cieli na agentické kódovanie, debugovanie a prácu s MCP, pričom má bežať rýchlosťou nad 100 tokenov za sekundu.
Produkty
Produktové vydania, integrácie, podnikové nástroje a praktické AI funkcie v aplikáciách.
AWS zverejnil praktický postup, ako na SageMaker AI dolaďovať malý jazykový model na tool-calling pomocou SFT a DPO a merať výsledok na datasete When2Call.
Snowflake na Summite 2026 predstavil bezpečnostné funkcie pre agentickú AI: identitu agentov, ochranu pred prompt injection, sandbox pre nástroje, detekciu exfiltrácie dát a nové riadenie bezpečnostnej pozície v Trust Center.
Baz postavil nad Amazon Bedrock AgentCore agenta, ktorý porovnáva pull request s požiadavkami z Figma a Jira a testuje dočasné prostredie v prehliadači. Prípadová štúdia ukazuje, kam sa posúva code review: od syntaxe k overovaniu produktu.
Mayo Clinic a Microsoft oznámili spoluprácu na zdravotníckom frontier modeli, ktorý má spojiť klinické dáta, expertízu nemocničného systému a cloudové AI kapacity Microsoftu. Model bude vlastniť Mayo Clinic a dostupnosť sa plánuje cez Azure Foundry API.
Výskum
Výskumné práce, metódy, reprodukovateľné výsledky a posuny v bezpečnosti modelov.
Dharma-AI opisuje, ako sa dá Direct Preference Optimization použiť na potláčanie opakovacích slučiek v OCR modeloch, nie iba na ladenie chatbotových odpovedí.
Preprint na arXiv skúma chain-of-thought ako iteratívne spresňovanie odhadu v zjednodušenom modeli in-context učenia. Autori opisujú prechody medzi rýchlym zlepšovaním, saturáciou a overthinkingom.
Nový arXiv preprint opisuje V-os: jednorozmerný smer emočnej valencie odvodený z LLM iba z deviatich viet. Smer sa prenáša medzi 14 modelmi, koreluje s EEG 123 ľudí sledujúcich afektívne videá, no pokročilé zarovnávacie stratégie dekódovanie nezlepšili.
Nový arXiv preprint predstavuje AbaqusAgent, viacagentový rámec pre konečno-prvkovú analýzu v mechanike pevných látok. Cieľom je pomôcť používateľom správne pripraviť simulácie v Abaquse a znížiť riziko chýb v okrajových podmienkach či záťažiach.
Trendujúce tagy
Frekvencia vychádza z nedávno publikovaných článkov a pomáha rýchlo zachytiť, čo sa v odvetví práve prepája.
Archív
Chronologický archív v štýle spravodajského toku, aby staršie texty nezapadli po prvom dni.
Pinecone predstavilo Nexus ako novú vrstvu nad vektorovou databázou: namiesto posielania surových dokumentov modelu chce agentom dodávať pripravený, povolený a sledovateľný kontext.
Notion zverejnil skúsenosti z bety Custom Agents a popisuje, ktoré typy úloh fungovali najlepšie, kde sa ukázala potreba bezpečnostných hraníc a prečo agenti nedávajú zmysel ako univerzálna náhrada práce v workspace. Pre trh je to cennejší signál než ďalší generický launch agentov.
Anthropic nevstupuje len do ďalšieho partnerstva, ale do spoločnej firmy, ktorá má priniesť Claude do jadra prevádzky stredne veľkých podnikov. Je to signál, že pri enterprise AI sa začína obchodný boj presúvať od licencií k dlhodobým implementačným službám.
OpenAI po prvý raz detailne rozobralo infraštruktúru za hlasovým rozhraním ChatGPT a Realtime API. Nejde o nový model, ale o dôležitý technický signál: pri hlasových agentoch sa začína rozhodovať viac v sieti a mediálnej vrstve než len v samotnom modeli.
Americká filmová akadémia schválila nové pravidlá pre 99. ročník Oscarov a prvýkrát ich explicitne naviazala na ľudské autorstvo pri generatívnej AI. Výkony musia byť preukázateľne odohrané ľuďmi s ich súhlasom a scenáre musia zostať ľudsky napísané, čo z AI robí skôr produkčný nástroj než cestu k samostatne oceniteľnému dielu.
Štúdia z Harvard Medical School a Beth Israel Deaconess naznačuje, že model o1 vedel pri prvom triážnom rozhodovaní trafiť presnú alebo veľmi blízku diagnózu častejšie než dvojica internistov. Autori však zároveň varujú, že zaujímavý benchmark ešte nie je dôkaz pripravenosti nasadiť AI na reálne život-ohrozujúce rozhodnutia.
Snowflake spustil verejný preview Datometry for Snowflake, ktorý má podnikom umožniť presun workloadov z Teradaty bez masívneho prepisu SQL a bez odstávky. Oznámenie je zaujímavé najmä tým, že migráciu prepája s tlakom na modernizáciu dátovej vrstvy pre analytiku, agentov a enterprise AI.
Britský AI Security Institute a Google DeepMind podpísali nové výskumné memorandum, ktoré posúva spoluprácu od samotného testovania frontier modelov k spoločnému výskumu monitorovania uvažovania modelov, socio-afektívneho zosúladenia a ekonomických dopadov AI.
AWS popisuje, ako pri reinforcement fine-tuningu modelov Amazon Nova nahradiť časť ručne písaných reward funkcií hodnotiacim modelom. Tvrdí, že prístup LLM-as-a-judge je vhodnejší tam, kde treba naraz sledovať presnosť, tón, bezpečnosť aj formát výstupu.
Apple vo výskumnej práci Reinforced Agent navrhuje, aby druhý model kontroloval plánované volania nástrojov ešte pred ich vykonaním. Cieľom je znížiť počet chýb bez retrénovania hlavného agenta a merať prínos aj riziko takejto spätnej väzby priamo počas inferencie.
Výskumníci navrhli dual-stream transformer pre detekciu vzájomného pohľadu a spoločnej pozornosti v dvojkamerových videách. Na dátach interakcií medzi opatrovateľom a dieťaťom prekonal konvolučný baseline aj multimodálne LLM.
Nové vydanie PydanticAI neprináša marketingový rebrand, ale tri praktické zmeny pre agentické aplikácie: stabilnejšie korelovanie behov, dynamické capabilities a jemnejšie prepísanie vstavaných nástrojov pri override agenta.
Vyhľadávanie
Rýchla interná navigácia cez plnotextové vyhľadávanie nad publikovaným archívom.