mock_sobes
← AI — RAG (Retrieval-Augmented Generation)
senior theory #727
Context window — 200k токенов. Расскажи, как ты планируешь token budget для RAG-системы: sysprompt, retrieved chunks, history, answer reserve. Когда применять map-reduce для огромных корпусов, какие truncation-стратегии безопасны, и почему «забить весь контекст» — плохая идея.
Чтобы решить вопрос и сохранить попытку — войди.