mock_sobes
← AI — общая оценка (Evaluation)
senior theory #806
Расскажи про RAGAS-метрики: faithfulness, context_precision, context_recall, answer_relevancy. Как считаются, какие пороги в проде, что значит "не сошлось". Где LLM-as-judge даёт bias и как его митигировать (position bias, verbosity bias, length bias, self-enhancement bias).
Чтобы решить вопрос и сохранить попытку — войди.