mock_sobes
← AI — RAG (Retrieval-Augmented Generation)
senior theory #722
Сравни bi-encoder, cross-encoder и ColBERT (late interaction) для reranking. Когда применять каждый, какова латентность, как добавить MMR для diversity. Расскажи, как ты построишь cascading retrieval, чтобы уложиться в 500ms p95 на 50 кандидатов.
Чтобы решить вопрос и сохранить попытку — войди.