Výskum
Autor: Redakcia AI Feed
IBM vysvetľuje, prečo reasoning modely potrebujú mid-training medzi pretrainingom a post-trainingom
Nový text IBM Research tvrdí, že rozhodujúci skok v reasoningu neprichádza iba z RL alebo inštrukčného ladenia, ale z medzifázy mid-trainingu zameranej na matematiku, kód a vedu.