Какие архитектурные решения позволяют RAG-системе масштабироваться на миллионы документов без потери производительности? Объясни, как индексация, кэширование и параллелизация влияют на latency и throughput, и приведи примеры антипаттернов, которые могут привести к деградации системы при масштабировании.
senior
theory
#119
Чтобы решить вопрос и сохранить попытку — войди.