Nový preprint zrýchľuje adaptívne učenie vo FTPL bez presného výpočtu pravdepodobností
Výskumníci navrhujú adaptívne learning rates pre metódu follow-the-perturbed-leader pomocou zástupných pravdepodobností. Práca je teoretická, ale mieri na efektívnejšie online učenie a banditové algoritmy.