Nová práca vysvetľuje, prečo riedke vlastnosti môžu meniť škálovacie zákony modelov
Preprint Asymmetric Scaling Laws from Sparse Features opisuje model, v ktorom testovaciu chybu určujú zriedkavé vlastnosti nevidené v trénovacích dátach. Výsledkom sú odlišné škálovacie exponenty pred a po prahu interpolácie.