Какой из следующих методов наиболее эффективно помогает в **обнаружении долгосрочных эффектов** A/B-тестов с AI-агентами?