AI výskum23. apríla 20263 min čítania

ZeroFolio ukazuje, že výber algoritmu sa dá robiť aj bez ručne navrhnutých príznakov

Výskumníci navrhujú prístup ZeroFolio, ktorý pri výbere algoritmu nahrádza ručne tvorené príznaky textovými embeddingmi zo surového vstupu. Ak sa výsledky potvrdia aj mimo benchmarkov, môže to zjednodušiť oblasť, kde sa doteraz rátalo s pomerne vysokou doménovou expertízou a nákladnou prípravou reprezentácií problému.

Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.

Typ zdroja: Kurátorovaný súhrn
Zdroj / autorita: arXiv

#arXiv #výskum AI #embeddingy #ZeroFolio #AutoML #algorithm selection

Redakčný kontext

Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.

Článok je zaradený v sekcii AI výskum a opiera sa o 2 zdroje.

Jedna z nových prác na arXive sa venuje klasickému, no stále praktickému problému v oblasti optimalizácie a AutoML: ako zvoliť správny algoritmus pre konkrétnu úlohu bez toho, aby bolo nutné pre každý typ problému ručne navrhovať sadu špecializovaných príznakov. Autori prichádzajú s metódou ZeroFolio, ktorá namiesto doménovo vytvorených charakteristík pracuje so surovým textovým zápisom inštancie, z neho vytvorí embedding a následne podľa podobnosti vyberá algoritmus cez vážených najbližších susedov.

Na prvý pohľad ide o technický detail pre úzky okruh výskumníkov. V skutočnosti je v tom širšia ambícia, ktorá je pre dnešnú AI dôležitá: preniesť silu univerzálnych reprezentácií aj do oblastí, kde sa doteraz spoliehalo na ručnú expertízu. Výber algoritmu bol dlhé roky postavený na tom, že výskumník alebo inžinier musí vedieť, ktoré vlastnosti problému sú rozhodujúce, a potom ich prepočítať do príznakov. ZeroFolio tvrdí, že pri textovo serializovaných vstupoch sa dá tento krok výrazne zjednodušiť a časť doménového know-how nahradiť všeobecnejšou embeddingovou reprezentáciou.

Navrhnutý pipeline je jednoduchý v troch krokoch: inštancia sa zapíše ako text, následne sa prevedie do embeddingu a potom sa pomocou váženého k-nearest neighbors určí, ktorý algoritmus sa má použiť. Táto jednoduchosť je dôležitá sama osebe. Ak chce byť podobná metóda praktická, nemôže byť zložitejšia než problém, ktorý rieši. Autori práve preto zdôrazňujú, že cieľom je univerzálny postup použiteľný naprieč rôznymi doménami bez potreby zakaždým navrhovať nové feature engineeringové pravidlá.

Podľa výsledkov na 11 scenároch z benchmarku ASlib a v siedmich doménach metóda prekonala random forest nad ručne vytvorenými príznakmi v 10 z 11 scenárov pri jedinom pevnom nastavení. Keď autori pridali dvojseedové hlasovanie, vyšli lepšie vo všetkých 11 scenároch. To je silný výsledok najmä preto, že nejde o jeden úzko naladený experiment. Práve porovnanie s etablovaným feature-based prístupom naznačuje, že textové embeddingy môžu byť použiteľné aj v úlohách, kde by ich mnohí intuitívne nečakali.

Práca zároveň ponúka zaujímavý ablačný pohľad. Za dôležité rozhodnutia autori označujú inverzné váženie vzdialenosti, premiešanie riadkov vstupu a Manhattanovu vzdialenosť. To je cenné, lebo podobné metódy bývajú niekedy prezentované ako magické víťazstvo embeddingov, bez vysvetlenia, ktoré voľby skutočne rozhodli o výsledku. Tu je naopak vidieť, že aj pri „general purpose“ reprezentácii zostáva dôležité, ako sa definuje podobnosť a ako sa stabilizuje práca s textovým vstupom.

Praktická hodnota ZeroFolia môže byť najväčšia v prostrediach, kde je príliš drahé alebo pomalé pripravovať špecializované príznaky pre každý nový typ dát. To sa týka nielen akademických benchmarkov, ale aj interných firemných optimalizačných problémov, pri ktorých sa formát vstupov mení a tím nechce zakaždým budovať celý feature engineeringový aparát od nuly. Ak stačí serializovať vstup, vyrobiť embedding a spustiť relatívne jednoduchý selektor, znižuje sa bariéra pre automatizované rozhodovanie o tom, ktorý solver alebo algoritmus nasadiť.

Treba však dodať aj opatrnosť. Výsledky sú zatiaľ akademické a do veľkej miery viazané na benchmarkové scenáre, kde má serializácia vstupu prirodzený zmysel. Nie je isté, že rovnaký prístup bude rovnako dobre fungovať v každom priemyselnom prostredí, kde sa inštancie problémov neprepisujú do textu tak čisto alebo kde je kritická interpretovateľnosť výberu. Navyše sa otvára otázka, nakoľko sú výsledky citlivé na voľbu embeddingového modelu a do akej miery by sa výkon zmenil pri novších alebo doménovo špecializovaných reprezentáciách.

Aj napriek týmto otázkam je ZeroFolio zaujímavým signálom širšieho trendu. Embeddingy už dávno neslúžia len na vyhľadávanie dokumentov či RAG. Postupne sa tlačia aj do metaproblémov okolo samotného navrhovania výpočtových systémov a riešiteľov. Ak sa tento smer potvrdí, časť klasických pipeline založených na ručne navrhovaných príznakoch môže ustúpiť univerzálnejším reprezentáciám, ktoré sa ľahšie prenášajú medzi doménami. Pre prax by to znamenalo menej špecializovaného nastavovania a rýchlejšie nasadenie na nové triedy problémov.

Zdroje

ZeroFolio ukazuje, že výber algoritmu sa dá robiť aj bez ručne navrhnutých príznakov

Ďalšie články k téme

Apple navrhuje LEAD, aby sa dlhé uvažovanie modelov vedelo zotaviť z chýb

3D-GIMP odstraňuje objekty z 3D scén jedným generatívnym zásahom a prenášaním textúr

Nový preprint hľadá štruktúru v pravdepodobnostných tenzoroch cez algebraické podpisy