Hybridné modely Olmo lepšie zvládajú význam, nie jednoduché kopírovanie
Nový rozbor Ai2 a Hugging Face porovnáva Olmo 3 s Olmo Hybrid na úrovni jednotlivých tokenov. Ukazuje, že hybridná architektúra má najväčší náskok pri slovách nesúcich význam a pri sledovaní entít, zatiaľ čo čistý transformer zostáva silný pri doslovnom opakovaní textu.