Výskum
Autor: Redakcia AI Feed
Porovnanie vysvetliteľnosti pre LLM naznačuje, že gradientové metódy sú zatiaľ najpraktickejšie
Štúdia porovnávajúca Integrated Gradients, Attention Rollout a SHAP upozorňuje, že pri diagnostike jazykových modelov neexistuje univerzálne vysvetlenie. Najstabilnejšie sa podľa autorov ukazujú gradientové atribúcie, kým attention a model-agnostic prístupy majú vlastné kompromisy.