Какой из следующих факторов может привести к снижению throughput в vLLM при использовании большого количества параллельных запросов?