#Item Response Theory

Všetky publikované články, v ktorých sa téma Item Response Theory objavuje ako dôležitý kontext. Aktuálne 1 textov v archíve.

Výskum1. júna 2026

Nová štúdia audituje benchmarky LLM pomocou teórie odpovedí na položky

Čerstvý preprint ukazuje, že benchmarky pre jazykové modely môžu prenášať chybné alebo nejednoznačné štítky do ďalších testov. Autori používajú štatistickú metódu IRT a odpovede 114 modelov na odhad, kde sú položky pravdepodobne nesprávne označené.