Kategória

AI výskum

Výskumné práce, metódy, reprodukovateľné výsledky a posuny v bezpečnosti modelov.

Filter podľa tagov

Všetko #arXiv 145 #výskum 93 #benchmarky 48 #Apple 46 #LLM 44 #AI agenti 26 #počítačové videnie 26 #agenti 19 #Hugging Face 19 #strojové učenie 18 #multimodálne modely 14 #reasoning 13 #reinforcement learning 13 #bezpečnosť AI 12

Výskum10. júna 2026

Audit medicínskych VLM benchmarkov našiel stopy kontaminácie v tréningových dátach

Preprint preveruje verejné medicínske vision-language benchmarky a varuje, že časť výsledkov môže byť ovplyvnená prekryvom s dátami dostupnými pri predtréningu.

Výskum10. júna 2026

Preprint varuje, že kvantizácia KV cache môže oslabiť bezpečnostné odmietanie modelov

Autori tvrdia, že nízkobitová kvantizácia pamäte pri inferencii môže poškodiť alignment aj vtedy, keď bežné metriky kvality vyzerajú takmer nezmenené.

Výskum10. júna 2026

ServiceNow testuje, ako hlasoví agenti zvládajú prepínanie jazykov

Benchmark na Hugging Face ukazuje, že rozpoznávanie reči v dvojjazyčných kontaktných centrách zostáva pre hlasových agentov slabým miestom.

Výskum9. júna 2026

Preprint skúša presnejšie riadenie kompozície pri generovaní krajiniek

Nový arXiv preprint navrhuje anchor-conditioned fine-tuning pre generovanie krajinných obrázkov. Model nedostáva iba textový prompt, ale aj číselný vektor kompozície, ktorý má lepšie zachytiť horizont, dominantný objekt či priestorové rozloženie scény.

Výskum9. júna 2026

NIST: matematický dôkaz podporuje priebežné opravy AI bezpečnosti

NIST upozorňuje, že konečný zoznam guardrailov nemôže byť univerzálne odolný voči protivníckym promptom. Práca Apostola Vassileva podporuje prechod k nepretržitému monitorovaniu, red teamingu a prevádzkovej odolnosti.

Výskum9. júna 2026

Preprint rozoberá, čo adversariálne dolaďovanie mení vo vision transformeroch

Nová práca z MIT analyzuje, ako adversariálne fine-tuningové postupy ovplyvňujú vision transformery pri rozmazaní, zaostrení a iných obrazových poruchách. Zlepšenie robustnosti sa podľa autorov neprenáša automaticky na nevidené typy porúch.

Výskum9. júna 2026

Štúdia testuje AI agentov na vedeckom potrubí od dát po objav v neurovede

Nový preprint hodnotí všeobecných kódovacích agentov na optogenetickom výskumnom potrubí s veľkými dátami. Výsledok je triezvy: agenti zvládajú niektoré samostatné kroky, ale zlyhávajú pri end-to-end vedeckom úsudku.

Výskum8. júna 2026

OpenAI spúšťa výskumnú burzu o vplyve AI na prácu a ekonomiku

OpenAI otvorilo Economic Research Exchange, program pre externé empirické projekty o tom, ako AI mení produktivitu, pracovné miesta, firmy a verejné inštitúcie.

Výskum8. júna 2026

Stanford varuje, že náborové AI nástroje môžu škálovať rasové odmietanie uchádzačov

Stanford HAI opisuje veľkú štúdiu algoritmického náboru: pri 4 miliónoch žiadostí mala spoločná závislosť firiem od jedného dodávateľa zvýrazniť rasové rozdiely a systémové odmietanie rovnakých kandidátov.

Výskum8. júna 2026

Preprint o hyperspektrálnych dátach varuje pred únikom v náhodných pixelových testoch

Metóda SGBR-HC vyberá približne dvadsať pásiem pre hyperspektrálnu klasifikáciu a zároveň ukazuje, že náhodné delenie pixelov môže nafúknuť presnosť o desiatky percentuálnych bodov. Dôležitý je preto priestorovo oddelený test.

Výskum8. júna 2026

AFSAT prenáša pseudo-booleovský SAT solver na GPU cez JAX a Fourierove reprezentácie

Preprint predstavuje AFSAT, plnohodnotnejšiu verziu GPU solvera pre pseudo-booleovské SAT úlohy. Autori opisujú, ako JAX, dávkové lokálne hľadanie a upravená diskrétna Fourierova transformácia zlepšujú stabilitu, pamäť aj škálovanie.

Výskum8. júna 2026

Nový preprint rozkladá activation steering na uhol a veľkosť skrytého stavu

Štúdia na siedmich jazykových modeloch ukazuje, že pri riadení správania modelu nestačí sledovať iba smer zásahu. Uhol nesie väčšinu konceptovej informácie, no veľkosť skrytého stavu rozhoduje o stabilite a vedľajších účinkoch.