Какой из следующих подходов позволяет эффективно использовать GPU-ресурсы в Kubernetes при запуске нескольких моделей в одном Pod?