Kategória

AI výskum

Výskumné práce, metódy, reprodukovateľné výsledky a posuny v bezpečnosti modelov.

Filter podľa tagov

Všetko #arXiv 145 #výskum 93 #benchmarky 48 #Apple 46 #LLM 44 #AI agenti 26 #počítačové videnie 26 #agenti 19 #Hugging Face 19 #strojové učenie 18 #multimodálne modely 14 #reasoning 13 #reinforcement learning 13 #bezpečnosť AI 12

Výskum29. júna 2026

Nový prehľad mapuje AI koučov pre prezentácie, výslovnosť a tempo reči

Preprint na arXive systematicky triedi nástroje na automatizovaný tréning ústnych prezentácií. Namiesto ďalšieho chatbota pre rétoriku ponúka taxonómiu piatich úloh: výslovnosť, slovný prízvuk, prozódiu, tempo a vernosť obsahu.

Výskum27. júna 2026

DD-Elo skúša zrýchliť šachové hodnotenia pomocou kvality jednotlivých ťahov

Nový preprint navrhuje ratingový systém DD-Elo, ktorý dopĺňa klasické výsledky partií o signál z kvality jednotlivých ťahov. Cieľom je rýchlejšie zachytiť zmenu hráčskej formy bez rozbitia kompatibility s tradičným Elo.

Výskum27. júna 2026

AlgoEvolve skúša evolučne generovať obchodné stratégie pomocou LLM

Preprint AlgoEvolve posúva využitie veľkých jazykových modelov ako semantických mutátorov programov do nestabilného prostredia algoritmického obchodovania. Systém generuje stratégie v Pythone, testuje ich a navyše evolučne upravuje aj prompty, ktoré riadia syntézu kódu.

Výskum27. júna 2026

Preprint skúma, kto riadi štandardy pre agentickú infraštruktúru

Nový arXiv preprint používa LLM asistovanú analýzu, tematické modelovanie a sieťové metódy na porovnanie governance okolo ERC-8004 a Google A2A. Výsledky naznačujú, že otvorené aj korporátne štandardy môžu mať nerovnomernú účasť a fragmentované komunity.

Výskum26. júna 2026

Model sleduje laserové zváranie z obrazu a odhaduje hĺbku prieniku

Preprint z oblasti počítačového videnia opisuje viacúlohovú neurónovú sieť pre kontrolu laserového zvárania. Z obrazu zvarového kúpeľa a procesných parametrov má naraz predpovedať stav prieniku, hĺbku aj tvar zvaru, čo je praktický príklad AI pre priemyselnú kvalitu.

Výskum26. júna 2026

GNN skúšajú čítať vlastnosti konečných grúp z Cayleyho grafov

Nový preprint ukazuje všeobecnejší rámec, v ktorom sa grafové neurónové siete učia algebraické vlastnosti konečných grúp priamo z ich Cayleyho grafov. Výsledok je skôr výskumný dôkaz konceptu než hotový nástroj, ale naznačuje zaujímavý most medzi strojovým učením a výpočtovou algebrou.

Výskum26. júna 2026

CHISAO skúša hľadať viac vrcholov funkcie priamo na GPU

Preprint CHISAO opisuje GPU natívny optimalizátor pre multimodálne black-box funkcie. Namiesto sekvenčného reštartovania udržiava populáciu vzoriek, mrazí nájdené módy a zvyšok cielene rozhýbava.

Výskum26. júna 2026

Nová λ-PSD metóda rieši šum pri meraní kvality vzoriek

Čerstvý preprint na arXive skúma slabinu polynomiálnych Steinových diskrepancií a navrhuje kovariančne váženú verziu λ-PSD. Cieľom je lepšie testovať kvalitu vzoriek bez straty lineárnej škálovateľnosti.

Výskum25. júna 2026

Nový preprint navrhuje merať, kedy už few-shot klasifikácii stačí dosť príkladov

ArXiv práca o binárnej few-shot klasifikácii zavádza saturačný index založený na efektívnom rangu kovariančnej matice. Má pomôcť rozhodnúť, či má ďalší zber označených príkladov ešte zmysel.

Výskum25. júna 2026

Preprint skúma, či multimodálne modely stačia na asistívne aplikácie v reálnom svete

Štúdia o MLLM v asistívnej AI upozorňuje, že vizuálne porozumenie, kontext a viacjazyčnosť musia fungovať spoľahlivo naraz, nie iba v izolovaných benchmarkoch.

Výskum25. júna 2026

AgentOdyssey testuje, či sa agenti vedia učiť počas dlhých textových hier

Nový preprint navrhuje benchmark, v ktorom agenti počas testovania skúmajú procedurálne generované textové svety, ukladajú skúsenosti a plánujú dlhé úlohy.

Výskum24. júna 2026

Počítačové videnie z bicykla má automaticky rozpoznávať nebezpečné predbiehanie

Čerstvý preprint opisuje systém, ktorý z bežnej zadnej kamery na bicykli rozpoznáva predbiehajúce vozidlá, odhaduje rizikové situácie a môže uľahčiť veľké dopravno-bezpečnostné štúdie bez ručného prezerania videa.