Observability — distributed tracing, metrics, logs

Спроектируй **сквозную трассировку** для запроса в AI-платформе: пользователь → API Gateway → FastAPI (`/chat`) → оркестратор LLM → tool calls (vector search + REST API) → vLLM (через OpenAI-compat API) → ответ. Какие spans, какие атрибуты, какой sampling, что хранить, как корелировать с logs и metrics.