AI novinky5. mája 20263 min čítania

Americký CAISI rozširuje testovanie frontier AI s Google DeepMind, Microsoftom a xAI

NIST oznámil nové dohody centra CAISI s Google DeepMind, Microsoftom a xAI. Štát tak získava širší prístup k predbežnému aj následnému hodnoteniu najsilnejších modelov ešte pred ich nasadením aj po ňom.

Autor: Redakcia AI Feed

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: NIST

#Microsoft #Google DeepMind #AI bezpečnosť #NIST #CAISI #xAI

Americký National Institute of Standards and Technology dnes oznámil nové dohody centra CAISI s Google DeepMind, Microsoftom a xAI. Na papieri to vyzerá ako ďalšia séria memoránd, no v praxi ide o dôležitý posun v tom, ako sa bude v Spojených štátoch testovať frontier AI z pohľadu bezpečnosti a národno-bezpečnostných rizík. Namiesto čisto akademických debát alebo dobrovoľných verejných sľubov sa čoraz viac presadzuje model, v ktorom dostane vládna technická autorita prístup k modelom ešte pred ich širokým uvoľnením a môže ich skúšať aj v citlivejších scenároch, než aké bývajú dostupné bežným externým testerom.

Podľa NIST majú nové dohody pokrývať predbežné hodnotenia pred nasadením, cielený výskum a aj následné posudzovanie po uvedení modelov do praxe. CAISI zároveň vystupuje ako hlavný kontaktný bod federálnej vlády pre testovanie komerčných AI systémov, výskumnú spoluprácu a tvorbu osvedčených postupov. To je dôležité najmä preto, že pri najvýkonnejších modeloch už nejde len o bežné red-teamovanie chatbotov, ale aj o skúmanie schopností, ktoré môžu zasahovať do kybernetiky, spracovania citlivých informácií, autonómneho používania nástrojov či do strategických oblastí obrany a spravodajstva.

NIST v oznámení priamo uvádza, že CAISI už vykonalo viac než štyridsať hodnotení vrátane modelov, ktoré ešte neboli verejne vydané. To je asi najsilnejší praktický signál celej správy. Ak má regulácia alebo bezpečnostný dohľad fungovať aj pri generatívnej AI, potrebuje sa dostať bližšie k reálnym systémom, nie iba k marketingovým demám a oneskoreným technickým reportom. Skutočnosť, že štátne hodnotenia prebiehajú aj na neverejných verziách modelov, posúva diskusiu od princípov k operatívnemu režimu.

Zaujímavý je aj tón okolo bezpečnostných obmedzení. NIST otvorene píše, že vývojári pri niektorých testoch poskytujú modely so zníženými alebo odstránenými safeguardmi, aby bolo možné lepšie pochopiť ich reálne schopnosti a limity. Presne tu sa láme spor medzi PR bezpečnosťou a technickou bezpečnosťou. Model, ktorý navonok pôsobí poslušne, sa môže správať inak po odobratí aplikačných bariér alebo pri použití v nástrojových reťazcoch. Pre hodnotiteľov je preto dôležité testovať základné schopnosti systému, nie iba to, ako dobre funguje jeho spotrebiteľské rozhranie.

Nové dohody nadväzujú na staršie partnerstvá, ktoré americký AI Safety Institute oznámil minulý rok s Anthropic a OpenAI. Z dnešného pohľadu je vidieť, že Washington nestavia iba jednorazový bezpečnostný audit, ale dlhšiu inštitucionálnu vrstvu. Do obrazu zapadá aj medziagentúrna skupina TRAINS Taskforce, cez ktorú majú do hodnotení vstupovať experti z rôznych častí vlády. Zámer testovať aj v klasifikovaných prostrediach zase naznačuje, že časť rizikových scenárov sa už nebude riešiť na úrovni verejných benchmarkov, ale v citlivejšom režime bližšom štátnym kapacitám.

Pre samotné laboratóriá to znamená, že vzťah so štátom sa mení z občasnej konzultácie na priebežný proces. Google DeepMind, Microsoft aj xAI tým síce získavajú možnosť formovať spoločné štandardy a mať pri stole technického partnera, zároveň si však dobrovoľne otvárajú dvere k podrobnejšiemu externému preskúmaniu. To môže byť dôležité aj obchodne. Veľké podniky, obranný sektor či regulované odvetvia budú pri adopcii čoraz viac žiadať dôkaz, že modely prešli niečím viac než interným testovaním výrobcu.

Z európskeho pohľadu je dôležité sledovať, že sa americký prístup opiera menej o okamžité tvrdé pravidlá a viac o technické dohody, merania a zdieľanie signálov medzi štátom a firmami. Nie je to náhrada zákonov ani certifikácie, ale skôr prevádzková vrstva, bez ktorej zostáva aj najlepšie napísaná regulácia prázdna. Ak majú vlády rozumieť tomu, čo moderné modely skutočne dokážu, musia mať ľudí, prostredia aj procesy na opakovateľné hodnotenie. Dnešné oznámenie ukazuje, že CAISI sa snaží presne o toto.

Praktický význam správy preto nespočíva v jednej novej funkcii alebo jednom benchmarku, ale v posune infraštruktúry okolo AI bezpečnosti. Frontier modely sa dostávajú do fázy, kde ich nestačí iba porovnávať v leaderbordoch a potom rýchlo nasadzovať do produktov. Čoraz dôležitejšie bude, kto ich vie overovať pred vydaním, kto rozumie ich správaniu po odstránení povrchových obmedzení a kto dokáže výsledky týchto testov pretaviť do konkrétnych odporúčaní. Práve týmto smerom sa americký režim dnes posunul.

Zdroje

Americký CAISI rozširuje testovanie frontier AI s Google DeepMind, Microsoftom a xAI

Ďalšie články k téme

Oscary 2027 sprísňujú hranice pre generatívnu AI: herecké výkony aj scenáre musia zostať ľudské

Britský AISI a Google DeepMind rozširujú spoločný výskum bezpečnosti AI

Apple presúva kontrolu agentov do behu: Reinforced Agent opravuje tool-cally ešte pred spustením