Подтемы
ClickHouse — OLAP, MergeTree, аналитика
14 вопр.
Postgres: схемы, миграции, транзакции, паттерны доступа
15 вопр.
БД — EXPLAIN ANALYZE (PostgreSQL)
25 вопр.
БД — Индексы (PostgreSQL)
22 вопр.
БД — Изоляция
18 вопр.
БД — Локи и MVCC
16 вопр.
БД — Партиционирование
16 вопр.
БД — PostgreSQL internals
16 вопр.
БД — Репликация
15 вопр.
БД — Шардирование
16 вопр.
DWH моделирование (Star/SCD/Kimball/Lakehouse)
14 вопр.
MongoDB (документная модель, агрегации, индексы)
14 вопр.
PostgreSQL — внутренности (MVCC, WAL, VACUUM, locks)
14 вопр.
Redis — типы данных, кеширование, локи
15 вопр.
SQLAlchemy 2.0 — async sessions, relationships, оптимизация
13 вопр.
86 вопросов
-
middle theory Как читать вывод EXPLAIN ANALYZE? Что значит `Seq Scan`, `Index Scan`, `Bitmap Heap Scan`, `cost=X..Y` и `actual time=A..B`?
-
senior theory Какие уровни изоляции есть в PostgreSQL? Какие аномалии возможны на каждом? Какой реально используется по умолчанию и почему стоит явно задавать?
-
middle theory Какие типы индексов есть в PostgreSQL и в каких случаях каждый? Не B-tree по умолчанию — это когда?
-
senior theory Что такое partial index и когда он реально окупается?
-
senior theory Что такое bloat у индексов в PostgreSQL и как с ним бороться?
-
middle theory Какие факторы влияют на выбор между B-tree и Hash индексами в PostgreSQL? В чём основное отличие их эффективности для операций поиска по точному значению и диа…
-
middle theory Как индексы влияют на производительность операций UPDATE и DELETE в PostgreSQL? Какие архитектурные особенности индексов могут привести к снижению производител…
-
middle theory Как PostgreSQL использует индексы для запросов с оператором LIKE? Почему запросы вида WHERE column LIKE '%pattern%' редко используют индексы, в отличие от WHER…
-
senior theory Объясните, как создаются индексы с выражениями в PostgreSQL, и приведите пример, где такой индекс может значительно повысить производительность. Какие особенно…
-
senior theory Какие преимущества и недостатки имеют частичные индексы (partial indexes) в PostgreSQL? Приведите пример создания частичного индекса и объясните, в каком сцена…
-
senior theory Объясните, как работают индексы GiST и SP-GiST в PostgreSQL, и в каких сценариях они предпочтительнее B-tree. Какие типы данных и операций они оптимизируют, и …
-
middle theory Как EXPLAIN ANALYZE помогает определить, стоит ли добавлять индекс на столбец? Приведите пример вывода, где индекс явно улучшит производительность, и объясните…
-
middle theory В выводе EXPLAIN ANALYZE встречается 'Filter: (price > 1000)'. Как это влияет на производительность, и какие альтернативы можно предложить для улучшения?
-
middle theory В EXPLAIN ANALYZE выводе есть 'Rows Removed by Filter: 99900'. Какие возможные причины этого и как это можно исправить?
-
senior theory В выводе EXPLAIN ANALYZE вы видите операцию 'Hash Join' с высоким 'rows' и низким 'actual rows'. Как это может повлиять на производительность запроса? Приведит…
-
senior theory В EXPLAIN ANALYZE для запроса с подзапросом в FROM-части вы видите 'Materialize' с высоким 'actual time'. Какие факторы могут вызывать это поведение, и как мож…
-
senior theory В EXPLAIN ANALYZE вы замечаете, что план использует 'Index Only Scan', но 'actual rows' значительно меньше, чем 'rows'. Какие причины могут вызывать такое расх…
-
middle theory Объясните, как уровни изоляции транзакций (например, READ COMMITTED vs REPEATABLE READ) влияют на возможность возникновения phantom reads. Приведите пример сце…
-
middle theory Как СУБД реализует изоляцию транзакций на уровне REPEATABLE READ? Какие механизмы используются для предотвращения несогласованности данных, и какие trade-offs …
-
middle theory Почему в некоторых сценариях (например, аналитических запросах) рекомендуется использовать уровень изоляции READ UNCOMMITTED, несмотря на его недостатки? Какие…
-
middle theory Объясните, как MVCC помогает избежать проблем с блокировками в транзакциях. Приведите пример сценария, где использование MVCC критично для избежания deadlocks.…
-
middle theory Как MVCC обеспечивает изоляцию транзакций на уровне Read Committed и Repeatable Read? В чём разница между реализацией в PostgreSQL и MySQL (InnoDB)? Приведите …
-
middle theory Как MVCC влияет на производительность при сканировании таблиц (например, в FULL TABLE SCAN)? Какие антипаттерны могут возникнуть при неправильной настройке MVC…
-
middle theory Объясните разницу между синхронной и асинхронной репликацией. В каких сценариях вы бы выбрали один из подходов и почему? Приведите примеры использования.
-
middle theory Какие стратегии разрешения конфликтов данных используются в репликации? Какие из них вы бы рекомендовали при работе с георепликацией и почему?
-
middle theory Что такое 'replication lag' и какие факторы влияют на его величину? Какие методы можно использовать для минимизации лага в репликации?
-
middle theory Объясните, почему выбор ключа шардирования критически важен для производительности и масштабируемости. Приведите примеры хороших и плохих ключей шардирования и…
-
middle theory Какие типы шардирования вы знаете? В чём разница между горизонтальным и вертикальным шардированием? Приведите примеры сценариев, где каждый из них будет предпо…
-
middle theory Какие проблемы возникают при масштаблице базы данных с шардированием, и как их можно решать? Приведите примеры инструментов или подходов для решения этих проблем.
-
middle theory Объясните разницу между горизонтальным и вертикальным партиционированием. В каких сценариях вы бы выбрали каждый из подходов? Приведите примеры использования и…
-
middle theory Какие стратегии партиционирования вы знаете (например, диапазонное, хэш-партитонирование, список)? Опишите их плюсы и минусы. В каком случае вы бы предпочли хэ…
-
middle theory Как партиционирование влияет на индексацию и выполнение запросов? Приведите пример, как партиционирование может ускорить или замедлить выполнение SELECT-запрос…
-
middle theory Объясните, как работает механизм Write-Ahead Logging (WAL) в PostgreSQL и как он обеспечивает целостность данных при сбое системы. Какие компоненты участвуют в…
-
middle theory Как PostgreSQL организует хранение данных в куче (heap) и что такое TOAST? В каких случаях используется сжатие данных в TOAST-таблицах?
-
middle theory Как PostgreSQL реализует параллельные запросы и какие ограничения существуют для их использования? Приведите примеры операций, которые могут быть оптимизирован…
-
senior theory Транзакции в FastAPI + SQLAlchemy async: где открывать, как обрабатывать ошибки, какие уровни изоляции, savepoints, SELECT FOR UPDATE — когда что?
-
senior theory Как делать миграции БД без даунтайма? Что нельзя одной миграцией, какие есть multi-step паттерны?
-
middle theory Перечисли основные типы данных Redis (**String / Hash / List / Set / Sorted Set / Stream**, плюс упомяни Bitmap, HyperLogLog, Geo). Для каждого — пример **типи…
-
senior theory Какие режимы **persistence** в Redis (**RDB / AOF / no persistence / hybrid**)? Какие trade-off (durability vs latency vs disk space vs restart time)? Что выбр…
-
senior theory Опиши паттерны кеширования: **cache-aside**, **read-through**, **write-through**, **write-back**, **write-around**. Чем отличаются, какие проблемы консистентно…
-
senior theory Как реализовать **distributed lock** через Redis (`SET NX EX`)? Какие проблемы у простой реализации (lost lock из-за GC pause, clock drift)? Что такое **Redloc…
-
middle theory Чем ClickHouse отличается от PostgreSQL? Когда выбирать ClickHouse, когда — нет? Что значит "колоночное хранилище" и почему это даёт огромный буст на аналитике.
-
senior theory Что такое MergeTree? Что значит PARTITION BY и ORDER BY? Чем ReplacingMergeTree отличается от обычного, и когда использовать?
-
senior theory Async SQLAlchemy 2.0: чем `AsyncSession` отличается от sync `Session`? Что такое `async_sessionmaker`, lazy loading проблемы, как правильно работать с relation…
-
middle theory Как устроен MVCC в Postgres? Что такое TXID, xmin/xmax, snapshot isolation? Почему `SELECT` не блокирует `UPDATE` и наоборот, и какой trade-off у этой модели?
-
senior theory Что такое WAL? Зачем он нужен, как устроен checkpoint, как через WAL делается репликация (streaming, logical)? Какие настройки критичны для durability vs произ…
-
senior theory Что делает VACUUM и AUTOVACUUM? Что такое bloat, freezing и transaction wraparound? Когда тюнить autovacuum и какие параметры крутить?
-
senior theory Какие бывают замки в Postgres (table-level, row-level, advisory)? Как диагностировать deadlock и lock contention через pg_locks и pg_blocking_pids?
-
middle theory Star vs Snowflake schema в DWH. В чём разница, когда какую брать? Что такое fact-таблица и dimension-таблица?
-
senior theory SCD (Slowly Changing Dimensions): Type 1, 2, 3, 4, 6. Какой когда? Конкретные примеры реализации.
-
senior theory Kimball (dimensional) vs Inmon (3NF normalized) — в чём спор? Какой подход когда выбирать? Что говорит Data Vault?
-
senior theory Data Lake vs Data Warehouse vs Data Lakehouse. Чем отличаются, как эволюционировали от Hadoop к Iceberg/Delta/Hudi? Что такое open table formats и зачем они?
-
senior theory В чём разница между phantom reads и non-repeatable reads? Почему REPEATABLE READ в Postgres (snapshot isolation) не равен SERIALIZABLE? Покажи аномалию write s…
-
senior theory Покажи реальный сценарий write skew на READ COMMITTED (банковский перевод, бюджет-чек, резервирование товара) и опиши 3 практических способа фикса БЕЗ перехода…
-
senior theory На проде Postgres висит query на 2 минуты, по приложению timeout. Опиши диагностику через `pg_locks`, `pg_stat_activity`, `pg_blocking_pids()`. Что искать, как…
-
senior theory Сравни advisory locks vs row-level locks в Postgres. Когда использовать каждый, какой overhead, как они ведут себя при connection drop?
-
senior theory Что такое partition pruning в Postgres? Когда оно НЕ работает (типичные ошибки)? Что такое partition-wise join и как его включить?
-
senior theory Сравни RANGE vs HASH vs LIST partitioning в Postgres. Когда какой выбрать, как избежать hot partition, что с rolling-window архивацией?
-
senior theory Спроектируй процесс шард-rebalance без downtime для системы с 8 шардами при добавлении 4 новых. Что с consistent hashing, dual-write/dual-read, как валидироват…
-
senior theory Сравни 2PC (two-phase commit) и Saga для кросс-шардовых транзакций. Когда что выбрать, какие компенсирующие действия в Saga, как обработать частичные сбои?
-
senior theory Сравни logical vs physical replication в Postgres. В чём разница в WAL, что с lag-мониторингом, как делать zero-downtime upgrade с logical?
-
senior theory Объясни связку VACUUM / bloat / transaction wraparound в Postgres. Как диагностировать bloat, какие autovacuum settings важны под нагрузкой, что такое emergenc…
-
junior theory What is SQL and what is it used for?
-
junior theory Describe the difference between SQL and NoSQL databases.
-
junior theory What are the different types of SQL commands?
-
junior theory Explain the purpose of the SELECT statement.
-
junior theory What is the difference between WHERE and HAVING clauses?
-
middle theory Define what a JOIN is in SQL and list its types.
-
middle theory What is a primary key in a database?
-
middle theory Explain what a foreign key is and how it is used.
-
middle theory How can you prevent SQL injections?
-
middle theory What is normalization? Explain with examples.
-
middle theory Describe the concept of denormalization and when you would use it.
-
middle theory What are indexes and how can they improve query performance?
-
middle theory Explain the purpose of the GROUP BY clause.
-
middle theory What is a subquery, and when would you use one?
-
middle theory Describe the functions of the ORDER BY clause.
-
middle theory Database Security Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory NoSQL Security Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory Query Parameterization Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
middle theory SQL Injection Prevention Cheat Sheet. Опишите основные риски и рекомендуемые меры защиты (по OWASP Cheat Sheet Series).
-
senior theory System Design: объясните тему «Database» — суть, за и против, когда применять.
-
senior theory Расскажите, как MongoDB обрабатывает **write concern** и **read concern** в условиях высокой нагрузки. Какие проблемы могут возникнуть при неправильной настрой…
-
senior theory Какие проблемы могут возникнуть при использовании **$lookup** в агрегационных пайплайнах MongoDB, особенно в случае больших объемов данных? Какие стратегии вы …
-
senior theory Объясните, как работает **sharding** в MongoDB и какие проблемы могут возникнуть при его неправильной настройке. Какие **anti-patterns** вы знаете, которые мог…
-
middle theory Расскажите, как MongoDB обрабатывает **document-level locking** и какие проблемы могут возникнуть при высокой конкуренции за ресурсы в условиях **write-heavy**…