Sem-ECE chce lepšie zmerať, či si jazykové modely veria primerane pri otvorených odpovediach
Nový paper navrhuje Sem-ECE, spôsob merania kalibrácie pri otvorenom otázkovaní. Namiesto sebahodnotenia modelu sleduje, ako často sa pri vzorkovaní vracia k rovnakému významu odpovede.