mock_sobes
← AI — RAG (Retrieval-Augmented Generation)
senior design #730
Спроектируй SSE-стриминг ответа RAG: токены идут постепенно, но citations должны быть «привязаны» к фрагментам ответа и появляться на UI **до или одновременно** с цитируемым текстом. Как обойти проблему, что LLM ставит `[doc_id]` в конце предложения (а не в начале), как обработать backpressure и cancellation.
Чтобы решить вопрос и сохранить попытку — войди.