Спроектируй memory-слой для LLM-ассистента (chat-помощник, multi-turn, 50 пользователей,
средняя сессия 30 turns). Разнеси short-term, episodic, semantic memory. Как ты будешь
компактовать историю, чтобы не упереться в 200k context window, и как искать релевантную
историю из прошлых сессий.
senior
design
#723
Чтобы решить вопрос и сохранить попытку — войди.