Подтемы
AI-ассистенты для разработки (Claude Code, Cursor, Copilot)
18 вопр.
AI — общая оценка (Evaluation)
14 вопр.
AI инфраструктура — vLLM / Triton / Ollama
14 вопр.
AI — LangChain / LlamaIndex (фреймворки для LLM-приложений)
16 вопр.
AI — LLM APIs (OpenAI, Anthropic, Mistral и т.п.)
27 вопр.
AI — LLM Fundamentals
29 вопр.
AI — MCP (Model Context Protocol, протокол интеграции LLM)
16 вопр.
AI — Prompt Engineering (промпт-инжиниринг)
18 вопр.
AI — RAG (Retrieval-Augmented Generation)
42 вопр.
AI — безопасность (Safety)
16 вопр.
AI — Structured Output (JSON-schema, retry-pattern)
17 вопр.
AI — Vector DBs (векторные БД: Pinecone/Qdrant/Weaviate)
15 вопр.
KServe — model serving на Kubernetes
14 вопр.
Локальный инференс LLM — vLLM / SGLang / Ollama / TGI (throughput, KV-cache, batching)
22 вопр.
MLOps Platform — Kubeflow, MLflow, MinIO
14 вопр.
MLOps — полный жизненный цикл ML (data→train→deploy→monitor→retrain)
20 вопр.
Rasa — диалоговые боты и NLU
16 вопр.
vLLM — high-throughput LLM inference
14 вопр.
47 вопросов
-
middle theory Чем отличаются параметры temperature и top-p (nucleus sampling), и когда какой использовать?
-
middle theory Опиши полный RAG-пайплайн: от документов до ответа. Какие компоненты, где «дорого», где обычно теряется качество?
-
middle theory Объясните, в чём разница между fine-tuning и prompt engineering как способами адаптации LLM под конкретные задачи. Приведите примеры сценариев, где один подход…
-
middle theory Как работает механизм внимания (attention) в трансформерах? Как его архитектура влияет на способность LLM обрабатывать длинные последовательности?
-
middle theory Какие факторы влияют на вероятность генерации релевантного ответа LLM? Объясните, как изменение числа heads в multi-head attention влияет на качество вывода.
-
middle theory Объясни, как выбор размера чанков (chunk size) влияет на точность и полноту RAG-системы. Приведи примеры, когда крупные чанки могут ухудшить результаты, а мелк…
-
middle theory Как RAG-система может обрабатывать противоречивую информацию в источниках? Опиши стратегии, которые позволяют модели выбирать наиболее достоверный источник, и …
-
middle theory Какие архитектурные решения в RAG позволяют масштабировать систему при увеличении объёма документов? Опиши, как изменяются требования к хранению, вычислениям и…
-
middle theory Как получить от LLM структурированный JSON надёжно? Сравни подходы: просто prompt → response_format → JSON schema → function calling → constrained decoding.
-
middle theory Что нужно знать про токены и context window при работе с LLM API? Как считать стоимость, как обрезать контекст, что такое prompt caching?
-
middle theory Опиши архитектуру Rasa: что такое **Rasa NLU** и **Rasa Core**, что такое intent / entity, какие бывают **dialogue policies**. Чем Rasa отличается от «голого» …
-
middle theory В Rasa есть **stories**, **rules** и **forms**. Чем они отличаются, когда что использовать? Приведи короткий пример yml для каждого.
-
middle theory Из каких компонентов состоит **MLflow** (tracking / projects / models / registry)? Как организовать **model registry** с этапами (Staging → Production)? Как ML…
-
middle theory Зачем в MLOps-платформе **MinIO**? Почему S3-совместимое хранилище — стандарт для артефактов? Какие особенности конфигурации (versioning, lifecycle, multipart …
-
middle theory Представьте, что вы разрабатываете систему, где LLM должен обрабатывать запросы в реальном времени с жёсткими ограничениями по latency. Как вы будете балансиро…
-
middle theory Какие failure modes могут возникнуть при использовании prompt engineering в многоязычных системах? Опишите стратегию, которая позволяет уменьшить вероятность о…
-
middle theory Представьте, что вы разрабатываете систему, которая использует LLM API для генерации текста в реальном времени. Какие trade-offs вы должны учесть при выборе ме…
-
middle theory Какие конкретные failure modes могут возникнуть при работе с LLM API, и какие стратегии вы бы предложили для их обработки без потери данных или ухудшения польз…
-
middle theory Представьте, что вы работаете с векторной базой данных, где требуется поддерживать высокую точность поиска векторов при масштабировании. Какие trade-offs между…
-
middle theory Какие edge cases могут возникнуть при работе с векторной базой данных при обработке нестандартных данных, например, разреженных векторов или векторов с динамич…
-
middle theory Представьте, что вы разрабатываете систему, где критично минимизировать количество запросов к LLM. Объясните, как LangChain и LlamaIndex могут быть использован…
-
middle theory Как вы бы обработали ситуацию, когда LLM возвращает некорректные ответы в пайплайне, построенном с использованием LlamaIndex? Опишите подходы для обнаружения о…
-
middle theory Как использовать MLflow Tracking + Model Registry для production-pipeline'а? Стадии (None/Staging/Production/Archived), promotion-процесс, A/B testing.
-
middle theory Представьте, что вы применяете MCP (Model Compression and Pruning) к крупной нейросети для развертывания на устройствах с ограниченными ресурсами. Какие конкре…
-
middle theory Какие failure modes могут возникнуть при неправильной настройке гиперпараметров MCP (например, уровня прунирования или степени квантования), и как их можно диа…
-
middle theory Какие потенциальные failure modes могут возникнуть при оценке модели на данных с несбалансированными классами, и как их можно компенсировать без изменения метр…
-
middle theory Какие trade-offs возникают при выборе между использованием синтетических данных и реальных данных для оценки модели в production-сценариях, и как это влияет на…
-
middle theory Представьте, что вы разрабатываете систему с vLLM для обработки нескольких сотен запросов в секунду. Какие конкретные trade-offs вы должны учитывать при выборе…
-
middle theory Какие конкретные failure modes могут возникнуть при масштабировании Triton Inference Server с использованием GPU-кластера? Опишите, как можно диагностировать и…
-
middle theory Представьте, что вы разрабатываете систему, которая использует ИИ для принятия критических решений (например, в медицине или автономных транспортных средствах)…
-
middle theory Как вы бы оценили риски, связанные с использованием ИИ в системах с высокими ставками (например, финансовые алгоритмы), если у вас нет возможности полностью пр…
-
middle theory Что такое CLAUDE.md / .cursorrules / project context для AI-ассистентов? Какие правила писать. Примеры что работает / не работает.
-
middle theory Вы разрабатываете систему, где prompt engineering используется для генерации ответов на запросы, требующие **многошагового рассуждения** (например, решение зад…
-
middle theory Написать о стратегиях обслуживания отказов (retry-pattern) для получения структурированного JSON от LLM. Какие варианты есть и когда их использовать?
-
middle theory Написать о методах тестирования и профилирования стратегий обслуживания отказов для получения структурированного JSON от LLM. Какие инструменты можно использовать?
-
middle theory Опишите, как вы бы протестировали MCP (Model Context Protocol) в реальном проекте. Какие методы профилирования и отладки вы бы использовали для оценки эффектив…
-
middle theory Представьте, что вы настраиваете TGI для обработки запросов с высокой частотой. Какие метрики вы бы использовали для профилирования производительности, и как и…
-
middle theory Как бы вы диагностировали проблему с резким падением throughput в vLLM при обработке 100+ параллельных запросов? Опишите шаги по анализу, возможные причины (на…
-
middle theory Как бы вы сравнили подходы к **priority-based batching** в TGI и SGLang? Какие сценарии (например, критически важные запросы vs обычные) могут выиграть от этог…
-
middle theory Представьте, что вы внедряете систему мониторинга для модели с высокоразмерным выходом (например, генеративной модели). Какие 3 ключевых аспекта вы бы учитывал…
-
middle theory Как вы бы спроектировали систему автоматического переключения между версиями моделей в production, если новая версия начинает показывать ухудшение метрик на те…
-
middle theory Как вы бы обработали сценарий, когда данные в production содержат аномалии, которые не были учтены при обучении модели, но не нарушают формат входных данных? К…
-
middle theory LLM Prompt Injection Prevention Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory MCP (Model Context Protocol) Security Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory Retrieval-Augmented Generation (RAG) Security Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory Secure AI/ML Model Ops Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory Secure Coding with AI Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).