Сравни bi-encoder, cross-encoder и ColBERT (late interaction) для reranking. Когда применять
каждый, какова латентность, как добавить MMR для diversity. Расскажи, как ты построишь
cascading retrieval, чтобы уложиться в 500ms p95 на 50 кандидатов.
senior
theory
#722
Чтобы решить вопрос и сохранить попытку — войди.