AI — общая оценка (Evaluation)

Расскажи про RAGAS-метрики: faithfulness, context_precision, context_recall, answer_relevancy. Как считаются, какие пороги в проде, что значит "не сошлось". Где LLM-as-judge даёт bias и как его митигировать (position bias, verbosity bias, length bias, self-enhancement bias).