aifeed.skAI Feed

Kategória

AI výskum

Výskumné práce, metódy, reprodukovateľné výsledky a posuny v bezpečnosti modelov.

LLM majú slabšie chápanie abstraktných významov, než sa čakalo
Výskum

LLM majú slabšie chápanie abstraktných významov, než sa čakalo

Nová práca ukazuje, že veľké jazykové modely zaostávajú pri chápaní abstraktných slov a významov viac, než naznačujú bežné dojmy z používania. Pre prax je to dôležitý signál: fluentný text ešte neznamená hlbšie porozumenie a pri zložitejších mentálnych pojmoch môžu byť staršie fine-tuned prístupy spoľahlivejšie než moderné generatívne LLM.

VAKRA ukazuje, kde sa enterprise AI agenti lámu medzi API a dokumentmi
Výskum

VAKRA ukazuje, kde sa enterprise AI agenti lámu medzi API a dokumentmi

IBM Research a Hugging Face rozobrali benchmark VAKRA, ktorý preveruje agentov v prostrediach bližších podnikovým workflowom než klasickým demo úlohám. Výsledok je nepríjemný: aj silné modely často zlyhávajú práve v reťazení nástrojov, mapovaní schém a práci s viacerými zdrojmi naraz.

GoodPoint chce z AI urobiť lepšieho recenzenta vedeckých článkov
Výskum

GoodPoint chce z AI urobiť lepšieho recenzenta vedeckých článkov

Výskumníci predstavili GoodPoint, prístup na generovanie konštruktívnej spätnej väzby k vedeckým článkom trénovaný aj na reakciách autorov. Je to zaujímavý posun od AI, ktorá iba hodnotí text, k AI, ktorá má pomáhať zlepšovať výskum spôsobom, ktorý autori naozaj považujú za užitočný.

AI výskum | AI Feed