Výskum
Autor: Redakcia AI Feed
QIMMA chce opraviť arabské leaderboardy skôr, než budú merať modely
Projekt QIMMA od Technology Innovation Institute tvrdí, že arabské benchmarky sú plné systematických chýb a že bez predbežnej validácie môžu leaderboardy skôr mýliť než presne merať kvalitu modelov.