AdaMerge zrýchľuje Vision Transformery bez tréningu cez pozornejšie spájanie tokenov
Nový preprint AdaMerge rieši slabinu bežného spájania tokenov vo Vision Transformeroch: nie všetky obrazové tokeny sú rovnako dôležité. Metóda pridáva salienciu a adaptívnu intenzitu kompresie bez ďalšieho tréningu modelu.