Nový preprint zjednodušuje skladanie úloh v reinforcement learningu
Práca o Boolean Task Algebra tvrdí, že v deterministických prostrediach stačia na skladanie cieľových úloh univerzálna a prázdna úloha. Ak sa výsledok potvrdí, môže znížiť tréningové náklady pri logickom skladaní správania agentov.