mock_sobes
← AI — RAG (Retrieval-Augmented Generation)
senior theory #119
Какие архитектурные решения позволяют RAG-системе масштабироваться на миллионы документов без потери производительности? Объясни, как индексация, кэширование и параллелизация влияют на latency и throughput, и приведи примеры антипаттернов, которые могут привести к деградации системы при масштабировании.
Чтобы решить вопрос и сохранить попытку — войди.