RIP płaski RAG ☠️ ByteDance właśnie udostępnił OpenViking jako open-source i ujawnia wszystko, co jest nie tak z tym, jak budujemy pamięć agentów AI. Oto, co każdy framework agenta robi źle: Wspomnienia żyją w jednym miejscu. Zasoby w innym. Umiejętności rozproszone wszędzie. A kiedy potrzebujesz kontekstu, robisz płaskie wyszukiwanie wektorowe i masz nadzieję na najlepsze. To jest problem. OpenViking naprawia to wszystko za pomocą jednego pomysłu: traktuj kontekst agenta jak system plików. Wszystko żyje pod zjednoczonym protokołem viking://. Wspomnienia, zasoby, umiejętności są zorganizowane w katalogach z unikalnymi URI. Agenci mogą ls, znajdować i nawigować kontekst jak programista pracujący w terminalu. Ale prawdziwy przełom to ładowanie warstwowe: → L0: abstrakt w jednym zdaniu do szybkiego przeszukiwania → L1: ~2k tokenów przegląd do podejmowania decyzji → L2: pełne szczegóły ładowane tylko wtedy, gdy są naprawdę potrzebne Większość agentów wrzuca wszystko do kontekstu i modli się. OpenViking ładuje tylko to, co potrzebne, kiedy jest potrzebne. Koszty tokenów spadają. Dokładność rośnie. A wyszukiwanie ma teraz sens. Zamiast jednego płaskiego wyszukiwania semantycznego, najpierw wykonuje pozycjonowanie na poziomie katalogu, a następnie rekurencyjne udoskonalanie wewnątrz katalogów o wysokich wynikach. Możesz dosłownie obserwować trajektorię wyszukiwania, już nie ma czarnej skrzynki. Część samowolnej ewolucji jest również dzika. Na koniec każdej sesji automatycznie wyciąga wnioski i aktualizuje pamięć agenta i użytkownika. Agent staje się coraz mądrzejszy im więcej go używasz. 9K gwiazdek. 13 współtwórców. Zbudowany przez zespół Vikingów ByteDance, który prowadzi infrastrukturę wektorową od 2019 roku. 100% open-source. Apache 2.0. Link w komentarzach.