Какой из следующих факторов наиболее критичен при масштабировании Triton Inference Server на кластере GPU?