Nový red-teaming pre medicínske LLM ukazuje, že priemer maskuje kritické zlyhania
Čerstvý arXiv preprint navrhuje viacdoménový red-teaming medicínskych veľkých jazykových modelov. Autori testovali 11 systémov na 690 klinicky motivovaných scenároch a upozorňujú, že vysoké priemerné skóre nemusí znamenať bezpečnosť v konkrétnych rizikových prípadoch.