AI — RAG (Retrieval-Augmented Generation)

Спроектируй memory-слой для LLM-ассистента (chat-помощник, multi-turn, 50 пользователей, средняя сессия 30 turns). Разнеси short-term, episodic, semantic memory. Как ты будешь компактовать историю, чтобы не упереться в 200k context window, и как искать релевантную историю из прошлых сессий.