AURA navrhuje audit LLM sudcov podľa neistoty namiesto pevnej vzorky
Nový preprint predstavuje AURA, metódu na auditovanie hodnotení typu LLM-as-a-judge. Namiesto spoliehania sa na vopred čistú validačnú vzorku adaptívne hľadá skupiny, kde je sudca neistý alebo systematicky skreslený.