Какой из следующих подходов наиболее эффективен для **handling rate limits** при использовании LLM API?