AI — RAG (Retrieval-Augmented Generation)

У тебя корпус: 60% Markdown-документация, 30% PDF-руководств с таблицами, 10% — Python-репозиторий (~150k файлов кода). Нужно подобрать chunking-стратегию для каждой части. Сравни fixed-size, sliding-window, semantic, hierarchical (parent-child) и code-aware (AST). Какие конкретно размеры чанков и overlap ты возьмёшь и как это повлияет на recall@10 и точность?