AllenAI otvára olmo-eval, pracovný stôl na priebežné hodnotenie modelov
Nový open-source balík olmo-eval cieli na hodnotenie modelov počas ich vývoja, nie až po finálnom vydaní. Pre tímy okolo otvorených modelov je to signál, že evals sa posúvajú bližšie k samotnému tréningu.