Hugging Face a NVIDIA zrýchľujú dolaďovanie MoE modelov cez NeMo AutoModel
Nový technický článok ukazuje, ako NeMo AutoModel využíva Transformers v5 na rýchlejšie a úspornejšie dolaďovanie zmesí expertov bez prepisovania tréningového kódu.
Tag
Všetky publikované články, v ktorých sa téma MoE objavuje ako dôležitý kontext. Aktuálne 3 textov v archíve.
Nový technický článok ukazuje, ako NeMo AutoModel využíva Transformers v5 na rýchlejšie a úspornejšie dolaďovanie zmesí expertov bez prepisovania tréningového kódu.
Mellum2 má 12 miliárd parametrov, ale pri každom tokene aktivuje približne 2,5 miliardy. JetBrains ho cez Hugging Face ponúka ako otvorený model pre routovanie, RAG, subagentov a nízkolatenčné kódové workflow.
AllenAI zverejnilo EMO, mixture-of-experts model navrhnutý tak, aby sa jeho experti prirodzene usporiadali do využiteľných skupín. Cieľom nie je len vyšší výkon, ale aj to, aby bolo možné spúšťať menší výsek expertov bez dramatického prepadu kvality.