Подтемы
AI-ассистенты для разработки (Claude Code, Cursor, Copilot)
18 вопр.
AI — общая оценка (Evaluation)
14 вопр.
AI инфраструктура — vLLM / Triton / Ollama
14 вопр.
AI — LangChain / LlamaIndex (фреймворки для LLM-приложений)
16 вопр.
AI — LLM APIs (OpenAI, Anthropic, Mistral и т.п.)
27 вопр.
AI — LLM Fundamentals
29 вопр.
AI — MCP (Model Context Protocol, протокол интеграции LLM)
16 вопр.
AI — Prompt Engineering (промпт-инжиниринг)
18 вопр.
AI — RAG (Retrieval-Augmented Generation)
42 вопр.
AI — безопасность (Safety)
16 вопр.
AI — Structured Output (JSON-schema, retry-pattern)
17 вопр.
AI — Vector DBs (векторные БД: Pinecone/Qdrant/Weaviate)
15 вопр.
KServe — model serving на Kubernetes
14 вопр.
Локальный инференс LLM — vLLM / SGLang / Ollama / TGI (throughput, KV-cache, batching)
22 вопр.
MLOps Platform — Kubeflow, MLflow, MinIO
14 вопр.
MLOps — полный жизненный цикл ML (data→train→deploy→monitor→retrain)
20 вопр.
Rasa — диалоговые боты и NLU
16 вопр.
vLLM — high-throughput LLM inference
14 вопр.
9 вопросов
-
junior theory Что такое контекстное окно LLM и почему его размер не «бесплатный»?
-
junior mcq Какое утверждение про токены в LLM НЕВЕРНО?
-
junior theory Представьте, что ваша модель в production начала давать некорректные прогнозы. Какие 3 шага вы бы предприняли для диагностики проблемы, учитывая этапы жизненно…
-
junior theory Какой минимальный набор инструментов вы бы внедрили на этапе 'deploy', чтобы обеспечить устойчивость системы при сбое модели? Объясните, как каждый инструмент …
-
junior theory Представьте, что вы используете vLLM для обработки нескольких запросов одновременно. Как изменится throughput системы при увеличении размера KV-cache, если бат…
-
junior theory При использовании TGI (Text Generation Inference) с batching, как система может обрабатывать ситуации, когда один из запросов в батче вызывает ошибку (например…
-
junior theory Как бы вы оценили влияние разнообразия длины контекста (context length) на эффективность использования KV-cache в vLLM? Какие стратегии могут быть применены дл…
-
junior theory Представьте, что в системе на основе SGLang возникает долгий запрос, который блокирует ресурсы. Какие механизмы могут быть использованы для ограничения влияния…
-
junior theory Какие ограничения аппаратного обеспечения (например, лимиты памяти GPU) могут непосредственно влиять на выбор стратегии батчинга в Ollama? Как это влияет на ба…