Подтемы
8 вопросов
-
senior theory Какой должна быть структура production runbook'а? Что в него попадает, а что нет. Чем runbook отличается от документации архитектуры.
-
senior theory Что такое blameless postmortem? Как его писать чтобы был полезен. 5 Whys vs Causal Analysis based on Systems Theory (CAST) — когда что.
-
senior theory Напишите Airflow DAG для daily-retrain ML-модели: extract → train → eval → deploy. Как отлаживать DAG локально? Что такое idempotency в context'е DAG'ов?
-
senior theory Чем Dagster отличается от Airflow? Когда что выбрать. Software-defined assets, type-checking, partitions.
-
middle theory Как использовать MLflow Tracking + Model Registry для production-pipeline'а? Стадии (None/Staging/Production/Archived), promotion-процесс, A/B testing.
-
middle theory Представьте, что вы разрабатываете систему с vLLM для обработки нескольких сотен запросов в секунду. Какие конкретные trade-offs вы должны учитывать при выборе…
-
middle theory Какие конкретные failure modes могут возникнуть при масштабировании Triton Inference Server с использованием GPU-кластера? Опишите, как можно диагностировать и…
-
senior theory Объясни vLLM PagedAttention и continuous batching. Как KV-cache хранится в страницах, сколько памяти нужно (формула), что такое prefix sharing. Continuous batc…