Tag

#LLM-as-a-judge

Všetky publikované články, v ktorých sa téma LLM-as-a-judge objavuje ako dôležitý kontext. Aktuálne 2 textov v archíve.

Výskum19. júna 2026

AURA navrhuje audit LLM sudcov podľa neistoty namiesto pevnej vzorky

Nový preprint predstavuje AURA, metódu na auditovanie hodnotení typu LLM-as-a-judge. Namiesto spoliehania sa na vopred čistú validačnú vzorku adaptívne hľadá skupiny, kde je sudca neistý alebo systematicky skreslený.

Modely1. mája 2026

AWS ukazuje, ako ladiť Amazon Nova cez LLM-judge namiesto ručne písaných rewardov

AWS popisuje, ako pri reinforcement fine-tuningu modelov Amazon Nova nahradiť časť ručne písaných reward funkcií hodnotiacim modelom. Tvrdí, že prístup LLM-as-a-judge je vhodnejší tam, kde treba naraz sledovať presnosť, tón, bezpečnosť aj formát výstupu.