AI novinky2. júla 20263 min čítania

AWS prináša OpenAI GPT OSS a NVIDIA Nemotron do GovCloudu

Amazon Bedrock v prostredí AWS GovCloud (US) sprístupňuje open-weight modely OpenAI GPT OSS a NVIDIA Nemotron. Pre regulované organizácie je dôležité najmä to, že výkonnejšie modely môžu volať bez presunu citlivých dát mimo vládneho cloudového perimetra.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: AWS Machine Learning Blog

#AI infraštruktúra #AWS #Amazon Bedrock #GovCloud #OpenAI GPT OSS #NVIDIA Nemotron

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI novinky a opiera sa o 3 zdroje.

Amazon Web Services rozširuje Amazon Bedrock v prostredí AWS GovCloud (US) o dve rodiny otvorených váh: OpenAI GPT OSS a NVIDIA Nemotron. Na prvý pohľad ide o ďalšie rozšírenie katalógu modelov, no praktický význam je užší a dôležitejší. AWS cieli na americké vládne agentúry, obranný a spravodajský sektor a dodávateľov, ktorí potrebujú moderné jazykové modely, ale zároveň nesmú posielať citlivé dáta do bežných komerčných regiónov alebo mimo presne definovaný regulačný rámec.

GovCloud je oddelená sada regiónov AWS navrhnutá pre citlivé a regulované pracovné záťaže. AWS v oznámení zdôrazňuje fyzické umiestnenie v Spojených štátoch, správu občanmi USA a súlad s režimami ako FedRAMP High, DoD SRG, ITAR či CJIS. Pre organizácie, ktoré dnes skúšajú generatívnu AI na dokumentoch, bezpečnostných záznamoch, obstarávaní alebo misijnom plánovaní, tak nejde len o pohodlie. Výber modelu je priamo previazaný s tým, či vôbec môžu daný systém zaradiť do produkcie.

Nová ponuka zahŕňa OpenAI GPT OSS vo variantoch 120B a 20B. AWS ich opisuje ako textové open-weight modely pre uvažovanie, agentické úlohy a vývojárske scenáre, s nastaviteľnou mierou reasoning úsilia a podporou integrácie externých nástrojov. Väčší model GPT OSS 120B je určený na produkčné a náročnejšie všeobecné použitie, kým menší GPT OSS 20B má zmysel tam, kde je dôležitejšia latencia, špecializácia alebo lokálnejšia prevádzka. Oba majú kontextové okno 128 tisíc tokenov a výstup do 16 tisíc tokenov.

Druhou rodinou sú modely NVIDIA Nemotron. AWS uvádza varianty Nano 9B v2, Nano 12B v2, Nano 30B a Super 120B. Pri Nemotron 3 Super zdôrazňuje hybridnú mixture-of-experts architektúru: model má 120 miliárd parametrov, no pri jednom tokene aktivuje iba časť z nich. Zmyslom je zlepšiť pomer ceny a výkonu pri zložitejších agentických alebo viacagentových úlohách. Pri Nemotron 3 Nano AWS vyzdvihuje menšie aktivované jadro, vyššiu priepustnosť oproti predchádzajúcej generácii a až miliónové kontextové okno, čo je relevantné pre dlhé pracovné postupy nad veľkými spismi alebo technickými záznamami.

Zaujímavá je aj vrstva, cez ktorú sa majú modely volať. AWS hovorí o ďalšej generácii inferenčného enginu v Bedrocku a o endpointoch kompatibilných s OpenAI API. Pre vývojárov to znamená, že časť aplikácií môže používať známy spôsob volania modelov bez kompletnej prestavby klienta. Pre bezpečnostné tímy je dôležitejšia iná časť: AWS opisuje izoláciu účtu, nulový prístup operátorov k nasadeniu modelu a prevádzku v rámci GovCloud hranice. Tým sa znižuje množstvo vlastnej infraštruktúry, ktorú by agentúra musela certifikovať, monitorovať a škálovať.

Praktický dopad môže byť najväčší v projektoch, ktoré doteraz uviazli medzi dvoma nevýhodnými možnosťami. Jednou bolo použiť slabší alebo starší model, ktorý už spĺňa interné pravidlá. Druhou bolo postaviť vlastný GPU klaster a prevziať na seba správu modelov, výkonu, aktualizácií a bezpečnostných kontrol. Bedrock v GovCloude ponúka strednú cestu: spravovanú službu s jednotným API, no v prostredí, ktoré je bližšie požiadavkám verejného sektora.

Treba však rozlišovať medzi dostupnosťou modelu a pripravenosťou celej aplikácie. Otvorené váhy samy osebe neriešia audit promptov, ochranu citlivých vstupov, kontrolu výstupov ani otázku, kto môže vyberať konkrétny model pre konkrétnu úlohu. AWS preto v zdroji uvádza aj príklady riadenia oprávnení, používania Bedrock API kľúčov a servisných politík, ktorými možno obmedziť dostupné modely. Pre veľké organizácie bude práve táto prevádzková vrstva často dôležitejšia než samotný marketingový názov modelu.

Oznámenie je zároveň signálom, že open-weight modely sa presúvajú z experimentálnych repozitárov do regulovaných cloudových produktov. V praxi to môže urýchliť obstarávanie a pilotné projekty v oblastiach, kde bolo používanie externých API citlivé alebo nepriechodné. Ak sa modely dajú volať cez existujúce rozhranie Bedrocku, tímy môžu porovnávať OpenAI GPT OSS, NVIDIA Nemotron a ďalšie modely na rovnakých dátových tokoch, politikách a monitoringu.

Pre európskych čitateľov je táto správa užitočná aj ako ukážka smerovania trhu. Hoci GovCloud je americká vládna infraštruktúra, rovnaký tlak existuje aj v Európe: organizácie chcú výkon frontier modelov, ale s jasnou dátovou suverenitou, auditovateľnosťou a možnosťou nasadzovať modely v regulovanom prostredí. AWS tým ukazuje, že boj o AI infraštruktúru sa nebude viesť iba na parametroch a benchmarkoch, ale aj na tom, kde inferencia beží, kto k nej môže pristupovať a ako ľahko ju možno zapojiť do existujúcich kontrol.

Zdroje

AWS prináša OpenAI GPT OSS a NVIDIA Nemotron do GovCloudu

Ďalšie články k téme

AWS ukazuje HippoRAG nad Bedrockom, Neptune a personalizovaným PageRankom

Inscribe používa Bedrock na agentickú kontrolu podvodných dokumentov

Claude Sonnet 5 prichádza na AWS ako lacnejšia chrbtica pre agentov a kódovanie