Nový preprint modeluje, kedy hlbší chain-of-thought pomáha a kedy už škodí
Preprint na arXiv skúma chain-of-thought ako iteratívne spresňovanie odhadu v zjednodušenom modeli in-context učenia. Autori opisujú prechody medzi rýchlym zlepšovaním, saturáciou a overthinkingom.