12 вопросов
-
senior theory Объясни, как выбор стратегии ретриева (dense vs. sparse vs. hybrid) влияет на производительность и точность RAG-системы в контексте больших документов. Приведи…
-
senior theory Как RAG-система может обрабатывать противоречия между источниками, если один документ утверждает A, а другой — B? Опиши архитектурные решения, которые позволяю…
-
senior theory Какие архитектурные решения позволяют RAG-системе масштабироваться на миллионы документов без потери производительности? Объясни, как индексация, кэширование и…
-
senior theory У тебя корпус: 60% Markdown-документация, 30% PDF-руководств с таблицами, 10% — Python-репозиторий (~150k файлов кода). Нужно подобрать chunking-стратегию для …
-
senior theory Объясни, как ты построишь hybrid search (BM25 + dense embeddings). Сравни Reciprocal Rank Fusion и weighted-score fusion: какие проблемы решает RRF, и в каких …
-
senior theory Сравни bi-encoder, cross-encoder и ColBERT (late interaction) для reranking. Когда применять каждый, какова латентность, как добавить MMR для diversity. Расска…
-
senior theory Как ты построишь pipeline, который минимизирует галлюцинации в RAG-ответах? Покрой: grounded answering (отвечать только из контекста), цитирование, confidence …
-
senior theory Context window — 200k токенов. Расскажи, как ты планируешь token budget для RAG-системы: sysprompt, retrieved chunks, history, answer reserve. Когда применять …
-
senior theory Расскажи про три уровня кэша в RAG: embedding cache, query cache, semantic cache. Какие cache-keys, какая инвалидация при обновлении индекса, какие риски (stal…
-
senior theory Сравни pre-filter vs post-filter для metadata filtering в HNSW. Почему «HNSW + сильная фильтрация» — проблема, и как её решают современные vector store (Qdrant…
-
senior theory Как ты построишь evaluation для RAG: retrieval-метрики (Recall@K, MRR, nDCG) и generation-метрики (faithfulness, answer relevance, RAGAS). Сравни golden set vs…
-
senior theory Как выбрать embedding-модель? Сравни text-embedding-3-large vs ada-002 vs E5/BGE по dim, качеству, цене. Когда стоит fine-tune embedding на домен, что даёт qua…