Расскажи про RAGAS-метрики: faithfulness, context_precision, context_recall, answer_relevancy.
Как считаются, какие пороги в проде, что значит "не сошлось". Где LLM-as-judge даёт bias
и как его митигировать (position bias, verbosity bias, length bias, self-enhancement bias).
senior
theory
#806
Чтобы решить вопрос и сохранить попытку — войди.