#transformers

Všetky publikované články, v ktorých sa téma transformers objavuje ako dôležitý kontext. Aktuálne 1 textov v archíve.

Produkty14. mája 2026

Hugging Face ukazuje, ako asynchrónne dávkovanie skracuje inferenciu LLM bez zmeny modelu

Nový technický rozbor od Hugging Face ukazuje, že pri kontinuálnom dávkovaní LLM býva úzke hrdlo často mimo samotného modelu: ak sa príprava batchov na CPU oddelí od výpočtu na GPU, latencia a využitie akcelerátora sa môžu citeľne zlepšiť bez nových kernelov aj bez pretrénovania modelu.

transformers | AI téma na AI Feed