AI novinky25. júna 20263 min čítania

OpenAI a Broadcom ukázali čip Jalapeño pre rýchlejšiu inferenciu LLM

OpenAI vstupuje hlbšie do výpočtovej infraštruktúry: s Broadcomom predstavila akcelerátor Jalapeño, navrhnutý špeciálne pre nasadzovanie veľkých jazykových modelov vo veľkom rozsahu.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AI Feed

#OpenAI #Broadcom #AI čipy #inferencia #dátové centrá

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI novinky a opiera sa o 2 zdroje.

OpenAI a Broadcom predstavili Jalapeño, prvý akcelerátor, ktorý OpenAI označuje ako svoj „Intelligence Processor“. Nejde o všeobecnú správu o ďalšom dátovom centre, ale o posun v tom, kto bude kontrolovať najdrahšiu časť generatívnej AI: inferenciu, teda samotné spúšťanie modelov pre používateľov, firmy a agentické aplikácie. Podľa oznámenia má byť čip postavený od začiatku pre potreby súčasných aj budúcich veľkých jazykových modelov a prvé testy majú ukazovať výrazne lepší pomer výkonu na watt než pri dnešných riešeniach.

Dôležité je najmä to, že OpenAI sa tým neposúva iba k nákupu kapacity od cloudových partnerov. Firma sa snaží skladať vlastný vertikálny reťazec: produkty, modely, bezpečnostné vrstvy, obslužné systémy a teraz aj časť hardvéru. Jalapeño má byť prvým prvkom viacgeneračnej platformy, ktorú OpenAI a Broadcom chcú nasadzovať vo veľkom meradle s partnermi pre dátové centrá. Oznámenie hovorí až o gigawattovej škále, čo naznačuje, že cieľom nie je experimentálny čip pre laboratórium, ale infraštruktúrna vrstva pre každodennú prevádzku modelov.

Broadcom v projekte neprináša iba výrobnú alebo návrhovú kapacitu. Podľa oboch firiem sa podieľa na implementácii čipu, doskách, rackových systémoch, sieťovaní s vysokou priepustnosťou a škálovateľnej produkcii. OpenAI zase tvrdí, že návrh vychádzal z jej poznania modelových plánov, jadier, servovacích systémov a potrieb produktov. V praxi to znamená, že hardvér má byť optimalizovaný podľa toho, ako sa reálne správajú LLM pri generovaní odpovedí, práci s dlhším kontextom, nástrojmi a mnohými súbežnými požiadavkami.

Takýto krok zapadá do širšej zmeny trhu. Počas prvej vlny generatívnej AI sa pozornosť sústredila na trénovanie modelov a nedostatok GPU. S rastúcim počtom používateľov sa však čoraz viac nákladov presúva do inferencie. Každý chat, každé doplnenie kódu, každá hlasová interakcia a každý agentický workflow spotrebúva výpočty znova a znova. Ak má AI fungovať ako bežná vrstva softvéru, nestačí mať najväčší tréningový klaster; prevádzka musí byť lacnejšia, predvídateľnejšia a energeticky efektívnejšia.

Pre zákazníkov sa zmena nemusí prejaviť okamžite ako nový produkt v rozhraní ChatGPT. Praktický význam je skôr v tom, či OpenAI dokáže znížiť jednotkové náklady, zrýchliť odpovede a udržať dostupnosť modelov pri rastúcom dopyte. Ak sa akcelerátor osvedčí, môže firme umožniť agresívnejšie nasadzovanie dlhších kontextov, multimodálnych funkcií alebo agentov, ktorí bežia dlhšie než jednoduchá jednorazová odpoveď. Pri takýchto scenároch je výkon na watt kritickejší než marketingové skóre v benchmarku.

Zároveň ide o signál pre celý dodávateľský reťazec. NVIDIA zostáva dominantná v tréningu aj inferencii, no veľkí odberatelia výpočtov čoraz viac skúšajú vlastné alebo spolunavrhnuté čipy. Google má TPU, Amazon Trainium a Inferentia, Microsoft vyvíja vlastné čipy a teraz sa OpenAI otvorene hlási k vlastnej hardvérovej stope. Neznamená to automaticky koniec univerzálnych GPU, skôr ďalšiu segmentáciu: časť prevádzky zostane na flexibilných akcelerátoroch a časť sa presunie na špecializované systémy pre opakujúce sa vzory LLM inferencie.

Otvorené zostáva, koľko technických detailov firmy zverejnia a ako bude Jalapeño porovnateľné s alternatívami mimo vlastného ekosystému OpenAI. Oznámenie hovorí o skorých testoch a výkone na watt, ale neposkytuje nezávislé benchmarky, dostupnosť pre externých vývojárov ani konkrétnu cenu inferencie. Preto je rozumné brať dnešnú správu ako strategický míľnik, nie ako uzavretý dôkaz trhovej prevahy.

Najväčší dopad môže byť dlhodobý. Ak sa AI presúva z aplikácie do infraštruktúry, potom sa konkurenčný boj bude viesť nielen o najlepší model, ale aj o to, kto dokáže modely obsluhovať najlacnejšie a najspoľahlivejšie. Jalapeño ukazuje, že OpenAI nechce zostať len zákazníkom cudzej výpočtovej vrstvy. Chce sa podieľať na jej návrhu, optimalizácii aj priemyselnom škálovaní.

Zdroje

OpenAI a Broadcom ukázali čip Jalapeño pre rýchlejšiu inferenciu LLM

Ďalšie články k téme

Cerebras varuje: autonómne slučky agentov potrebujú overovače, nie iba rýchlosť

Huntington ukazuje, ako redigovať citlivé údaje v stovkách miliónov dokumentov cez AWS

OpenAI podporuje Appia Foundation pre spoločné štandardy pokročilej AI