7 вопросов
-
senior design Тебе нужно построить RAG-ассистента по внутренней документации компании (~50k страниц, обновляется). Ассистент должен **обязательно цитировать источники** и **…
-
senior design Корпус 5M документов, embedding в Qdrant (HNSW). 200k документов в день меняются/удаляются, embedding пересчёт стоит ~$1.2/1M токенов. Спроектируй стратегию об…
-
senior design Спроектируй memory-слой для LLM-ассистента (chat-помощник, multi-turn, 50 пользователей, средняя сессия 30 turns). Разнеси short-term, episodic, semantic memor…
-
senior design Multi-tenant RAG: 200 клиентов, у каждого свой корпус (1k–500k документов), нужна изоляция и невозможность data leak. Сравни «collection per tenant» vs «shared…
-
senior design Корпоративный RAG. Документы имеют ACL (user/group, можно отозвать). Запрос пользователя не должен «процитировать» документ, к которому у него нет доступа. Сра…
-
senior design У тебя SLA на RAG: 3 секунды p95 от запроса до окончания streaming. Расскажи, как ты распределишь latency budget по стадиям, что делать параллельно, как cascad…
-
senior design Спроектируй SSE-стриминг ответа RAG: токены идут постепенно, но citations должны быть «привязаны» к фрагментам ответа и появляться на UI **до или одновременно*…