AI2 ukazuje EMO: sparse model vie bežať len s malou časťou expertov a nestratiť výkon
AllenAI zverejnilo EMO, mixture-of-experts model navrhnutý tak, aby sa jeho experti prirodzene usporiadali do využiteľných skupín. Cieľom nie je len vyšší výkon, ale aj to, aby bolo možné spúšťať menší výsek expertov bez dramatického prepadu kvality.