Как ты построишь evaluation для RAG: retrieval-метрики (Recall@K, MRR, nDCG) и generation-метрики
(faithfulness, answer relevance, RAGAS). Сравни golden set vs LLM-as-judge. Что делать в CI, чтобы
не ломать качество при изменении промптов/моделей.
senior
theory
#732
Чтобы решить вопрос и сохранить попытку — войди.