Autor: Redakcia AI Feed
Nový výskum spája fine-tuning a sampling v difúznych aj flow modeloch
Čerstvý paper na arXive navrhuje spoločný rámec pre reward fine-tuning aj sampling v difúznych a flow modeloch a tvrdí, že niektoré dnes používané tréningové cesty majú zásadne horšie vlastnosti než iné.