Спроектируй **сквозную трассировку** для запроса в AI-платформе:
пользователь → API Gateway → FastAPI (`/chat`) → оркестратор LLM →
tool calls (vector search + REST API) → vLLM (через OpenAI-compat API)
→ ответ. Какие spans, какие атрибуты, какой sampling, что хранить,
как корелировать с logs и metrics.
senior
design
#368
Чтобы решить вопрос и сохранить попытку — войди.