Tag

#LLM

Všetky publikované články, v ktorých sa téma LLM objavuje ako dôležitý kontext. Aktuálne 39 textov v archíve.

Výskum30. apríla 2026

Apple navrhuje DSO, ktoré tlmí bias modelov bez pevnej obete výkonu

Apple Machine Learning Research predstavilo metódu Direct Steering Optimization, ktorá má počas inferencie cielene obmedzovať demografické skreslenie vo VLM a LLM. Dôležité je, že nejde o jednorazové ‚vypnutie‘ biasu, ale o nastaviteľný kompromis medzi férovosťou a schopnosťami modelu.

Modely29. apríla 2026

IBM Granite 4.1 stavia na 15 biliónoch tokenov a kontexte do 512-tisíc

IBM detailne rozpisuje, ako vznikla rodina Granite 4.1. Nové dense modely s veľkosťou 3B, 8B a 30B kombinujú päťfázový tréning, dlhý kontext a Apache 2.0 licenciu, aby boli zrozumiteľnou open alternatívou pre firmy aj vývojárov.

Výskum29. apríla 2026

Apple ukazuje, že AI nemá rozmýšľať rovnako dlho pri každej otázke

Apple navrhuje spôsob, ako model ešte pred generovaním odpovede odhadne náročnosť otázky a pridelí jej primeraný rozpočet na uvažovanie. Cieľom je ušetriť tokeny bez citeľnej straty presnosti.

Výskum28. apríla 2026

Výskum navrhuje systematické ladenie LLM namiesto intuitívneho pokus-omylu

Nový preprint na arXive opisuje ladenie veľkých jazykových modelov ako pozorovateľný systémový problém. Namiesto izolovaných promptových úprav skladá postup od záchytu chyby cez evaluáciu a interpretáciu až po úpravy dát, parametrov a následné dolaďovanie.

Výskum28. apríla 2026

Apple skúša difúzne uvažovanie nad LLM: LaDiR vracia revíziu do reťazca myslenia

Apple zverejnil výskum LaDiR, ktorý skúša nahradiť striktne sekvenčné generovanie uvažovania latentným difúznym procesom. Cieľom je, aby model vedel rozpracované kroky spätne upravovať, paralelne skúmať viac ciest a lepšie hospodáriť s výpočtom pri dlhších úlohách.

Výskum24. apríla 2026

IBM: mid-training rozhoduje o tom, či sa model naučí naozaj uvažovať

IBM tvrdí, že medzistupeň medzi pretréningom a post-tréningom nie je kozmetická optimalizácia. V stovkách experimentov mal zásadne pomôcť pri reasoning úlohách.

Výskum24. apríla 2026

Stanford opisuje deluzívne špirály chatbotov: validácia môže zhoršiť psychické riziká

Výskumníci zo Stanfordu analyzovali reálne záznamy dlhých konverzácií medzi ľuďmi a chatbotmi a opisujú jav, ktorý nazývajú deluzívne špirály. Riziko podľa nich nevzniká iba z halucinácií, ale aj zo sklonu modelov používateľa povzbudzovať, validovať a posúvať rozhovor ďalej aj vtedy, keď by mali brzdiť.

Modely24. apríla 2026

DeepSeek-V4 tlačí milión tokenov do praxe: open model mieri na dlhé agentické úlohy

DeepSeek predstavil radu V4 s miliónovým kontextom, no podstatnejší je iný posun: firma tvrdí, že nové modely výrazne znižujú priebežné výpočtové náklady aj pamäťové nároky pri veľmi dlhých behoch. To je dôležité najmä pre agentov, ktorí si do kontextu nesú históriu nástrojov, logov a medzikrokov.

Modely23. apríla 2026

GPT-5.5 mieri na dlhšie úlohy: OpenAI pridáva výkon bez vyššej latencie

OpenAI uviedlo GPT-5.5 ako nový vlajkový model pre kódovanie, prácu s nástrojmi a dlhšie agentické workflow. Firma tvrdí, že novinka posúva kvalitu práce v Codexe aj ChatGPT, no pritom drží latenciu na úrovni GPT-5.4 a pridáva prísnejšie bezpečnostné testovanie.

Výskum23. apríla 2026

Apple vracia do hry RNN: ParaRNN sľubuje paralelný tréning a 7B modely

Apple predstavilo ParaRNN, framework, ktorý má odstrániť kľúčové úzke miesto klasických rekurentných sietí. Firma tvrdí, že pri tréningu nelineárnych RNN dosiahla zrýchlenie až 665-krát a otvorila cestu k sedemmiliardovým modelom s konkurencieschopnou perplexitou.

Výskum22. apríla 2026

Transliterácia sa vracia do hry: nový prehľad tvrdí, že LLM stále narážajú na bariéru písma

Survey o transliterácii v NLP pripomína, že rozdielne písma zostávajú praktickou brzdou cross-lingual prenosu. Aj v ére veľkých modelov môže prepis medzi skriptami zlepšiť pokrytie, efektivitu aj prácu s code-mixom.

Výskum22. apríla 2026

Compile to Compress tlačí formálne dokazovanie bližšie k lacnejšej prevádzke

Nová práca o theorem proving ukazuje, že kompilátorové chybové režimy môžu slúžiť ako kompresia spätnoväzbového signálu. Výsledkom má byť výkonnejšie dokazovanie bez extrémne drahého test-time compute.