OpenAI skúša predpovedať správanie modelov simulovaným nasadením
OpenAI opisuje metódu Deployment Simulation, pri ktorej pred vydaním nového modelu prehráva staršie anonymizované konverzácie s kandidátskym modelom. Cieľom je odhadnúť reálne miery neželaného správania skôr, než sa model dostane k používateľom.