Подтемы
AI-ассистенты для разработки (Claude Code, Cursor, Copilot)
18 вопр.
AI — общая оценка (Evaluation)
14 вопр.
AI инфраструктура — vLLM / Triton / Ollama
14 вопр.
AI — LangChain / LlamaIndex (фреймворки для LLM-приложений)
16 вопр.
AI — LLM APIs (OpenAI, Anthropic, Mistral и т.п.)
27 вопр.
AI — LLM Fundamentals
29 вопр.
AI — MCP (Model Context Protocol, протокол интеграции LLM)
16 вопр.
AI — Prompt Engineering (промпт-инжиниринг)
18 вопр.
AI — RAG (Retrieval-Augmented Generation)
42 вопр.
AI — безопасность (Safety)
16 вопр.
AI — Structured Output (JSON-schema, retry-pattern)
17 вопр.
AI — Vector DBs (векторные БД: Pinecone/Qdrant/Weaviate)
15 вопр.
KServe — model serving на Kubernetes
14 вопр.
Локальный инференс LLM — vLLM / SGLang / Ollama / TGI (throughput, KV-cache, batching)
22 вопр.
MLOps Platform — Kubeflow, MLflow, MinIO
14 вопр.
MLOps — полный жизненный цикл ML (data→train→deploy→monitor→retrain)
20 вопр.
Rasa — диалоговые боты и NLU
16 вопр.
vLLM — high-throughput LLM inference
14 вопр.
10 вопросов
-
senior design Тебе на проде нужно сократить количество галлюцинаций в LLM-ответах (ассистент по документации компании). Какие техники применишь и в каком порядке?
-
senior design Тебе нужно построить RAG-ассистента по внутренней документации компании (~50k страниц, обновляется). Ассистент должен **обязательно цитировать источники** и **…
-
senior design Спроектируй ML-pipeline в k8s, который полностью **воспроизводимо** делает: ingest данных → preprocess → train → eval → register → deploy в serving (vLLM / KSe…
-
senior design Спроектируй KServe-деплоймент для production LLM endpoint с canary rollout новой версии модели: 10% трафика на v2, метрики качества и latency, автоматический r…
-
senior design Корпус 5M документов, embedding в Qdrant (HNSW). 200k документов в день меняются/удаляются, embedding пересчёт стоит ~$1.2/1M токенов. Спроектируй стратегию об…
-
senior design Спроектируй memory-слой для LLM-ассистента (chat-помощник, multi-turn, 50 пользователей, средняя сессия 30 turns). Разнеси short-term, episodic, semantic memor…
-
senior design Multi-tenant RAG: 200 клиентов, у каждого свой корпус (1k–500k документов), нужна изоляция и невозможность data leak. Сравни «collection per tenant» vs «shared…
-
senior design Корпоративный RAG. Документы имеют ACL (user/group, можно отозвать). Запрос пользователя не должен «процитировать» документ, к которому у него нет доступа. Сра…
-
senior design У тебя SLA на RAG: 3 секунды p95 от запроса до окончания streaming. Расскажи, как ты распределишь latency budget по стадиям, что делать параллельно, как cascad…
-
senior design Спроектируй SSE-стриминг ответа RAG: токены идут постепенно, но citations должны быть «привязаны» к фрагментам ответа и появляться на UI **до или одновременно*…