AI produkty17. júna 20263 min čítania

Databricks rozširuje AI Platform o agenta pre ML inžinierstvo a serverless tréning

Databricks na Data + AI Summit 2026 oznámil Genie Code pre celý ML životný cyklus, verejný náhľad AI Runtime a nové schopnosti pre nízkolatenčné modelové nasadenia.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: Databricks

#Databricks #MLflow #MLOps #Genie Code #serverless GPU

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI produkty a opiera sa o 3 zdroje.

Databricks predstavil nový balík schopností pre svoju AI Platform, ktorý cieli na praktickú prácu tímov stavajúcich vlastné modely a produkčné AI systémy. Oznámenie z Data + AI Summit 2026 zahŕňa Genie Code pre strojové učenie, verejný náhľad AI Runtime a rozšírenie podpory pre real-time ML cez Feature Store a Model Serving. Spoločný menovateľ je jasný: Databricks chce zmenšiť medzeru medzi experimentom v notebooku a spoľahlivým modelom v produkcii.

Genie Code pre ML je najvýraznejšia novinka, pretože prenáša agentický prístup do celého životného cyklu strojového učenia. Databricks tvrdí, že všeobecný coding agent nestačí, keď treba rozhodovať o kvalite dát, úniku budúcich informácií do tréningu, výbere infraštruktúry, driftovaní modelu alebo monitorovaní obchodných metrík. Agent pre ML preto musí rozumieť nielen kódu, ale aj dátam, feature pipeline, experimentom, registru modelov, serving endpointom a produkčnej histórii.

Kľúčom má byť integrácia s Unity Catalog a MLflow. Cez Unity Catalog má Genie Code poznať obchodnú sémantiku, lineage, kvalitu tabuliek, prístupové pravidlá a existujúce feature transformácie. Cez MLflow má chápať experimenty, vyhodnocovanie, nasadzovanie a monitorovanie. To umožňuje agentovi robiť úlohy, ktoré sú bližšie práci seniorného ML inžiniera: pripraviť konzistentné features, zvoliť infraštruktúru, spustiť tréning, zaznamenať experiment, registrovať model a sledovať, či sa po nasadení nezhoršuje výkon.

Druhou veľkou časťou oznámenia je AI Runtime vo verejnom náhľade. Databricks ho opisuje ako serverless GPU tréningové prostredie pre výskumovo náročné hlboké učenie a dolaďovanie bez zložitej správy infraštruktúry. Pre firmy, ktoré nechcú budovať vlastnú tréningovú platformu, je to praktická ponuka: získať pružné GPU prostredie, ale stále zostať v dátovej a governance vrstve Databricks. Hodnota tak nie je iba v samotnom výpočte, ale v spojení tréningu s dátami, experimentmi a produkčným nasadením.

Tretia oblasť sa týka real-time ML. Databricks sľubuje nízku latenciu a vysoký počet požiadaviek pre Feature Store a Model Serving. To je dôležité pre prípady ako odporúčacie systémy, personalizácia, detekcia podvodov alebo dynamické vyhľadávanie, kde model potrebuje čerstvé features a odpoveď v milisekundách až nízkych sekundách. V mnohých firmách je práve toto prechodové miesto medzi dávkovou analytikou a produkčnou aplikáciou najťažšie: dáta existujú, model funguje v experimente, ale serving pipeline nie je dostatočne rýchla alebo spoľahlivá.

Z praktického hľadiska Databricks stavia proti fragmentácii ML nástrojov. V typickej organizácii sa feature engineering, tréning, registrácia modelov, monitoring a incidenty často riešia v oddelených systémoch. Agent, ktorý má kontext naprieč celou platformou, môže skrátiť čas potrebný na rutinné úlohy a zároveň znížiť riziko, že tím prehliadne policy pravidlo alebo nekonzistentnú feature definíciu. Silná integrácia však znamená aj závislosť od platformy: najväčšiu hodnotu získajú tí, ktorí už majú dáta a ML procesy hlboko v Databricks ekosystéme.

Oznámenie je súčasťou širšieho trendu, v ktorom sa AI agenti presúvajú zo všeobecného programovania do špecializovaných profesionálnych workflow. Pri ML inžinierstve je to logický cieľ, pretože veľká časť práce je opakovaná, ale zároveň vyžaduje doménový kontext. Agent, ktorý iba napíše tréningový skript, nestačí; užitočný agent musí vedieť, prečo je určitá feature problematická, či model driftuje a aké metriky sú dôležité pre konkrétny biznis proces.

Pre zákazníkov bude rozhodujúce, ako dobre Databricks zvládne hranicu medzi automatizáciou a kontrolou. ML systémy ovplyvňujú odporúčania, ceny, rizikové skóre aj rozhodovanie v citlivých procesoch. Agentické zrýchlenie je užitočné iba vtedy, ak sú kroky auditovateľné, experimenty reprodukovateľné a nasadenie podlieha schváleniu. Ak sa Genie Code a AI Runtime ukážu ako spoľahlivé v produkčných tímoch, Databricks môže posilniť pozíciu platformy, ktorá nielen ukladá a spravuje dáta, ale aktívne riadi celý cyklus tvorby a prevádzky modelov.

Zdroje

Databricks rozširuje AI Platform o agenta pre ML inžinierstvo a serverless tréning

Ďalšie články k téme

AWS pripravuje Context, zdieľanú vrstvu znalostí pre podnikových AI agentov

Hugging Face a Amazon ukazujú cestu od dát k fyzickému robotovi cez LeRobot

Databricks ukazuje AI Companion pre zákaznícky úspech v reklamných tímoch