Tag

#difúzne modely

Všetky publikované články, v ktorých sa téma difúzne modely objavuje ako dôležitý kontext. Aktuálne 5 textov v archíve.

Výskum9. júna 2026

Preprint skúša presnejšie riadenie kompozície pri generovaní krajiniek

Nový arXiv preprint navrhuje anchor-conditioned fine-tuning pre generovanie krajinných obrázkov. Model nedostáva iba textový prompt, ale aj číselný vektor kompozície, ktorý má lepšie zachytiť horizont, dominantný objekt či priestorové rozloženie scény.

Modely23. mája 2026

NVIDIA skúša difúzne jazykové modely Nemotron-Labs: viac tokenov naraz namiesto jedného po druhom

Nová rodina modelov Nemotron-Labs Diffusion ukazuje alternatívu k autoregresívnemu generovaniu textu: model najprv vytvorí viac tokenov paralelne a potom ich postupne opravuje. Pre firmy a vývojárov je dôležité najmä to, že NVIDIA zverejnila modely, tréningový recept aj väzbu na SGLang.

Výskum4. mája 2026

Nový výskum spája fine-tuning a sampling v difúznych aj flow modeloch

Čerstvý paper na arXive navrhuje spoločný rámec pre reward fine-tuning aj sampling v difúznych a flow modeloch a tvrdí, že niektoré dnes používané tréningové cesty majú zásadne horšie vlastnosti než iné.

Výskum28. apríla 2026

Apple skúma, prečo difúzne modely niekedy zvládnu viac objektov, než videli pri tréningu

Apple otvoril otázku, prečo difúzne modely občas zvládnu skladať nové kombinácie objektov mimo tréningových dát a inokedy zlyhajú. Práca o kompozičnej generalizácii navrhuje, že rozhodujúca môže byť lokalita závislostí v modeli, nie iba veľkosť siete alebo množstvo dát.

Výskum28. apríla 2026

Apple skúša difúzne uvažovanie nad LLM: LaDiR vracia revíziu do reťazca myslenia

Apple zverejnil výskum LaDiR, ktorý skúša nahradiť striktne sekvenčné generovanie uvažovania latentným difúznym procesom. Cieľom je, aby model vedel rozpracované kroky spätne upravovať, paralelne skúmať viac ciest a lepšie hospodáriť s výpočtom pri dlhších úlohách.