AWS ukazuje HippoRAG nad Bedrockom, Neptune a personalizovaným PageRankom
Technický návod AWS skladá neurobiologicky inšpirovaný RAG z grafovej databázy, embeddingov a algoritmov na šírenie relevancie. Pointa je lepšia práca so vzťahmi, nie iba ďalší vektorový index.
Pripravil HERMES. Výber tém pomáha robiť BuloSentinel. Redakčná kontrola: Marek Považský.
- Typ zdroja
- Kurátorovaný súhrn
- Zdroj / autorita
- AWS Machine Learning Blog
Redakčný kontext
Tému vybral BuloSentinel ako súčasť monitorovania AI ekosystému. Text pripravil HERMES zo zdrojovo ukotvených podkladov a zodpovednú kontrolu pravidiel robí Marek Považský.
Článok je zaradený v sekcii AI produkty a opiera sa o 2 zdroje.
AWS publikovalo technický postup, ako implementovať HippoRAG na vlastnom cloude pomocou Amazon Bedrock, Amazon Neptune, Neptune Analytics a embeddingov Amazon Titan. HippoRAG patrí do skupiny prístupov, ktoré sa snažia posunúť retrieval-augmented generation za hranice jednoduchého vyhľadania najbližších textových úryvkov vo vektorovej databáze. Namiesto toho kombinuje vektorové reprezentácie s grafom vzťahov a algoritmom Personalized PageRank, aby model pri odpovedi získal širší kontext o tom, ktoré entity a dokumenty spolu súvisia.
Klasický RAG je dnes prakticky štandardom pri firemných asistentochnad internými dokumentmi, no má známe slabiny. Vektorové vyhľadávanie dobre nachádza podobné pasáže, ale často nerozumie tomu, ako spolu súvisia osoby, projekty, zmluvy, udalosti alebo technické komponenty naprieč viacerými dokumentmi. Ak otázka vyžaduje nepriamu väzbu, viac krokov alebo kombináciu rozptýlených faktov, samotná podobnosť textu nemusí stačiť.
HippoRAG sa inšpiruje tým, ako hipokampus pomáha spájať epizodické spomienky. V technickom preklade to znamená, že systém buduje graf znalostí, v ktorom uzly reprezentujú entity alebo dokumentové jednotky a hrany zachytávajú vzťahy medzi nimi. Keď príde otázka, vyhľadanie sa nezačne a neskončí len pri najbližších vektoroch. Relevancia sa šíri cez graf, takže do kandidátneho kontextu sa môžu dostať aj uzly, ktoré nie sú textovo najpodobnejšie, ale sú dôležité pre reťazec súvislostí.
AWS skladá túto architektúru z vlastných spravovaných služieb. Amazon Bedrock dodáva modelovú vrstvu, Amazon Titan Embeddings vytvára vektorové reprezentácie, Neptune slúži ako grafová databáza a Neptune Analytics poskytuje grafové algoritmy vrátane personalizovaného PageRanku. Pre podnikových používateľov je zaujímavé, že nejde o akademickú skicu bez infraštruktúrneho kontextu. Blog ukazuje, ako by sa podobný systém dal postaviť v prostredí, kde už existujú bezpečnostné pravidlá, sieťové hranice, logging a kontrola prístupu.
Praktický význam je najväčší pri znalostných úlohách s viackrokovým uvažovaním. Typickým príkladom je otázka na dopad zmeny v jednom systéme na súvisiace procesy, zákazníkov alebo compliance dokumentáciu. V dokumentoch môžu byť potrebné fakty na rôznych miestach, pričom žiadny jeden odsek neobsahuje celú odpoveď. Grafová vrstva pomáha modelu nájsť cestu medzi súvisiacimi prvkami a vektorová vrstva zas drží jazykovú podobnosť otázky.
Dôležité je aj to, že HippoRAG nemení LLM na databázu. Model stále generuje odpoveď až po získaní relevantného kontextu, no retrieval vrstva mu pripravuje bohatšie podklady. To môže znížiť riziko halucinácií tam, kde má firma dáta, ale nevie ich dobre spojiť. Zároveň to však nezbavuje tím potreby vyhodnocovať presnosť, citácie a správanie na hraničných otázkach. Graf môže priniesť širší kontext, no nesprávne extrahované entity alebo hrany môžu šíriť aj nesprávnu relevanciu.
AWS týmto príspevkom zároveň posúva diskusiu o RAG od otázky „ktorú vektorovú databázu použiť“ k otázke „aký typ pamäti potrebuje aplikácia“. Pri jednoduchom FAQ postačí lacnejší a jednoduchší index. Pri veľkých doménach s množstvom vzťahov, ako sú farmaceutické znalosti, technická dokumentácia, poisťovníctvo alebo zákaznícka podpora nad produktovým portfóliom, môže byť grafová vrstva opodstatnená. Rozhodnutie teda nie je módne, ale architektonické.
Pre slovenské a európske firmy je podstatná aj prevádzková stránka. Ak sú citlivé dáta už v AWS, implementácia nad Bedrockom a Neptune môže byť jednoduchšia než presun dokumentov do samostatného RAG produktu. Na druhej strane, ide o komplexnejší stack: treba riešiť extrakciu entít, kvalitu grafu, náklady na grafové výpočty a meranie toho, či sa odpovede reálne zlepšili.
Najtriezvejšie čítanie novinky je preto také, že HippoRAG nie je univerzálna náhrada vektorového RAG, ale ďalšia trieda architektúry pre náročnejšie znalostné systémy. AWS ukazuje konkrétnu cestu, ako ju nasadiť vo firemnom prostredí. Tímy, ktoré už narazili na limity obyčajného vyhľadávania podľa podobnosti, by mali tento prístup sledovať ako možnú evolúciu produkčných AI asistentov.
Zdroje