#KV cache

Všetky publikované články, v ktorých sa téma KV cache objavuje ako dôležitý kontext. Aktuálne 1 textov v archíve.

Výskum6. mája 2026

Apple chce zlacniť prevádzku LLM cez zdieľanie KV cache medzi vrstvami

Apple Machine Learning Research ukazuje, že tlak na lacnejší serving nemusí ísť len cez kvantizáciu či skracovanie kontextu. Nová práca skúša zmenšiť KV cache po hĺbke siete a zachovať pritom výkon aj priepustnosť.

KV cache | AI téma na AI Feed