E3-Agent navrhuje adaptívne riadenie generatívnej inferencie na edge zariadeniach
Nový arXiv preprint opisuje agenta, ktorý kombinuje rýchly router a pomalší LLM meta-kontrolér pre meniace sa edge prostredie. V simuláciách znižuje latenciu oproti statickým stratégiám o 65 až 73 percent.