Výskum
Autor: Redakcia AI Feed
Apple skúša spojiť obraz a text v tréningu: TC-JEPA má zlepšiť vizuálne porozumenie
Apple zverejnilo výskum TC-JEPA, ktorý do samoučiaceho tréningu vizuálnych reprezentácií pridáva textové titulky, aby znížil neistotu pri predikcii zakrytých častí obrazu a zlepšil sémantické porozumenie.