У тебя корпус: 60% Markdown-документация, 30% PDF-руководств с таблицами, 10% — Python-репозиторий
(~150k файлов кода). Нужно подобрать chunking-стратегию для каждой части. Сравни fixed-size,
sliding-window, semantic, hierarchical (parent-child) и code-aware (AST). Какие конкретно размеры
чанков и overlap ты возьмёшь и как это повлияет на recall@10 и точность?
senior
theory
#719
Чтобы решить вопрос и сохранить попытку — войди.