Какой из следующих подходов наиболее эффективен для уменьшения задержек в RAG-системах при использовании LlamaIndex?