aifeed.skAI Feed
AI modely4 min čítania

Apple ukázal tretiu generáciu Foundation Models pre Siri aj Private Cloud Compute

Apple opisuje novú rodinu AFM 3 pre Apple Intelligence: dva modely majú bežať priamo na zariadeniach a tri serverové varianty na Private Cloud Compute, vrátane výkonnejšej konfigurácie s Google Cloud a GPU od NVIDIA.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja
Kurátorovaný súhrn
Zdroj / autorita
Apple Machine Learning Research

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI modely a opiera sa o 2 zdroje.

Apple po WWDC detailnejšie odkryl, na čom má stáť ďalšia generácia Apple Intelligence. V technickom texte na Apple Machine Learning Research predstavuje tretiu generáciu Apple Foundation Models, skrátene AFM 3. Nejde o jeden univerzálny model, ale o rodinu piatich modelov: dva sú určené na beh priamo v zariadení a tri na serverové úlohy v prostredí Private Cloud Compute. Pre používateľov je dôležité najmä to, že Apple tým vysvetľuje, ako chce spojiť nový Siri, prácu s aplikáciami, multimodálne vstupy a ochranu súkromia bez toho, aby všetku inteligenciu presunul do bežného cloudu.

Najzaujímavejšia je architektúra pre zariadenia. Apple uvádza AFM 3 Core ako novú generáciu približne trojmiliardového hustého modelu a AFM 3 Core Advanced ako výkonnejší model pre náročnejšie lokálne úlohy. Druhý z nich používa riedko aktivovanú architektúru postavenú okolo techniky Instruction-Following Pruning. Prakticky to znamená, že celý model nemusí byť naraz v operačnej pamäti. Váhy môžu zostať vo flash pamäti a systém si podľa požiadavky vyberá iba časť expertov, ktoré potrebuje na konkrétnu úlohu. Apple tým rieši obmedzenie, ktoré je pre telefóny, tablety a notebooky zásadné: veľké modely sú užitočné, ale pamäť, spotreba a latencia majú na koncovom zariadení oveľa tvrdšie limity než v dátovom centre.

Serverová časť rodiny má pokryť úlohy, ktoré sa lokálne nezmestia alebo potrebujú vyššiu kvalitu. Apple pomenúva AFM 3 Cloud, AFM 3 Cloud Pro a obrazový model ADM 3 Cloud. Tie majú bežať v Private Cloud Compute, teda v architektúre, kde Apple tvrdí, že používateľské dáta sa neukladajú a nezdieľajú ani s Applom. Pre výkonnejší AFM 3 Cloud Pro firma uvádza spoluprácu s Google a NVIDIA: Private Cloud Compute rozširuje na GPU od NVIDIA v Google Cloud, pričom má zachovať rovnaké súkromné garancie. Toto je dôležitý posun, pretože Apple doteraz najviac zdôrazňoval vlastný hardvér a vlastnú infraštruktúru; teraz otvorene priznáva, že pre najväčšie cloudové modely potrebuje aj externú výpočtovú vrstvu.

Technicky je AFM 3 aj odpoveďou na kritiku, že Apple zaostával za laboratóriami orientovanými na veľké jazykové modely. Firma sa nesnaží kopírovať čistý chatbotový model konkurencie. Skôr skladá systém, v ktorom sa menšie lokálne modely starajú o okamžité a osobné úlohy, kým serverové modely dopĺňajú multimodálne uvažovanie, prácu s dlhším kontextom, generovanie obrázkov a zložitejšie rozhodovanie. V texte Apple opisuje aj ADM 3 Cloud pre tvorbu a úpravu obrázkov, vrátane Genmoji. Tento model má lepšie zvládať rôzne pomery strán a rozlíšenia a využívať širšiu rodinu Apple Foundation Models na riadenie generovania.

Pre vývojárov a firmy je podstatné, že Apple sa postupne približuje k modelu platformy. Ak nové Siri a systémové nástroje budú skutočne postavené na AFM 3, schopnosti Apple Intelligence sa nebudú obmedzovať iba na jednu aplikáciu. Môžu sa stať vrstvou operačného systému, ktorá rozumie obrazovke, lokálnym dátam a kontextu používateľa. To je zároveň dôvod, prečo Apple tak tvrdo opakuje súkromie: bez prístupu k osobnému kontextu je systémová AI slabšia, no pri prenose citlivých dát do cloudu by firma riskovala dôveru používateľov aj regulačné problémy.

Dôležitá je aj dátová politika. Apple píše, že modely trénuje na zmesi verejne dostupných dát, licencovaných alebo kúpených dát, otvorených datasetov, dát zo špecializovaných štúdií a syntetických dát. Zároveň tvrdí, že na trénovanie foundation modelov nepoužíva súkromné osobné dáta používateľov ani ich interakcie. Pri súčasných sporoch o tréningové dáta je to nevyhnutná časť príbehu. Apple tým odlišuje svoje modely od všeobecných webových chatbotov a zároveň sa snaží dať vydavateľom a regulátorom signál, že počíta s právom odmietnuť použitie obsahu pri tréningu.

Čo z toho vyplýva v praxi? Apple Intelligence bude pravdepodobne menej viditeľná ako jeden veľký produkt a viac ako súbor systémových funkcií. Ak sa podarí lokálne spúšťať väčšiu časť úloh, používateľ získa nižšiu latenciu a lepšiu dostupnosť. Ak sa pri náročných požiadavkách bezpečne zapojí Private Cloud Compute, Apple môže dobehnúť kvalitu, ktorá si dnes vyžaduje veľký serverový model. Riziko je však v koordinácii: modely musia plynulo prepínať medzi zariadením a cloudom, Siri musí správne vyhodnotiť kontext a vývojári musia dostať dostatočne stabilné rozhrania, nie iba marketingový prísľub.

Pre trh s AI je správa zaujímavá ešte jedným spôsobom. Apple nevsádza iba na veľkosť modelu, ale na distribúciu výpočtu medzi zariadenie, vlastnú infraštruktúru a partnerský cloud. To môže byť vzor pre firmy, ktoré nechcú všetko posielať do jedného externého API. Zároveň to ukazuje, že „on-device AI“ nebude znamenať koniec cloudových modelov. Skôr pôjde o hybrid, v ktorom sa osobné a rýchle úlohy riešia lokálne a špičková kvalita alebo multimodálne spracovanie sa zapína cez kontrolovanú serverovú vrstvu.

Tretiu generáciu AFM preto treba čítať menej ako samostatný modelový release a viac ako architektonické priznanie stratégie Applu. Firma potrebuje presvedčiť, že vie priniesť citeľne lepšie Siri a inteligentnejšie aplikácie, no zároveň nechce opustiť svoj príbeh o súkromí. AFM 3, Private Cloud Compute a spolupráca s Google Cloud a NVIDIA sú tri časti toho istého plánu. Úspech sa nebude merať iba benchmarkmi, ale tým, či sa AI funkcie v iPhone, iPade a Macu stanú spoľahlivými každodennými nástrojmi namiesto izolovaných ukážok z keynote.

Zdroje

Súvisiace čítanie

Ďalšie články k téme

Viac z kategórie
Cerebras porovnáva Kimi K2.6 s Gemini 3.5 Flash na rýchlej inferencii
Modely

Cerebras porovnáva Kimi K2.6 s Gemini 3.5 Flash na rýchlej inferencii

Cerebras tvrdí, že otvorenejší model Kimi K2.6 na jeho infraštruktúre dosahuje podobnú inteligenciu ako Gemini 3.5 Flash, ale výrazne vyššiu rýchlosť výstupu. Porovnanie ukazuje, ako sa pri agentoch čoraz viac hodnotí latencia a počet tokenov za sekundu, nielen skóre benchmarkov.