Что нужно знать про токены и context window при работе с LLM API? Как считать стоимость, как обрезать контекст, что такое prompt caching?