Alesha
Alexey Fateev
MLOps Engineer

Развертывание LLM с помощью TorchServe + vLLM | PyTorch

Развертывание LLM с помощью TorchServe + vLLM | PyTorch

Проектирование кластеров Kubernetes — выбор размера рабочих узлов

Проектирование кластеров Kubernetes — выбор размера рабочих узлов