Какой из следующих подходов наиболее эффективен для **minimizing cost** при использовании LLM API в высоконагруженной системе?