Context window — 200k токенов. Расскажи, как ты планируешь token budget для RAG-системы:
sysprompt, retrieved chunks, history, answer reserve. Когда применять map-reduce для огромных
корпусов, какие truncation-стратегии безопасны, и почему «забить весь контекст» — плохая идея.
senior
theory
#727
Чтобы решить вопрос и сохранить попытку — войди.