mock_sobes
← AI — RAG (Retrieval-Augmented Generation)
senior design #723
Спроектируй memory-слой для LLM-ассистента (chat-помощник, multi-turn, 50 пользователей, средняя сессия 30 turns). Разнеси short-term, episodic, semantic memory. Как ты будешь компактовать историю, чтобы не упереться в 200k context window, и как искать релевантную историю из прошлых сессий.
Чтобы решить вопрос и сохранить попытку — войди.