AI — RAG (Retrieval-Augmented Generation)

Какие архитектурные решения позволяют RAG-системе масштабироваться на миллионы документов без потери производительности? Объясни, как индексация, кэширование и параллелизация влияют на latency и throughput, и приведи примеры антипаттернов, которые могут привести к деградации системы при масштабировании.