Výskum
Autor: Redakcia AI Feed
Databricks otvára OfficeQA: benchmark pre grounded reasoning na podnikových dokumentoch
Databricks zverejnilo OfficeQA, benchmark zameraný na grounded reasoning nad veľkými podnikovými korpusmi PDF a tabuliek. Firma tvrdí, že práve tu dnešné agenty zlyhávajú výraznejšie než na populárnych olympiádových či kódovacích testoch.