Google Cloud ha anunciado el cambio de nombre de su Cloud HPC Toolkit a Cluster Toolkit, ampliando su alcance para abarcar las cargas de trabajo de IA/ML. Este conjunto de herramientas tiene como objetivo simplificar la creación y gestión de entornos de computación de alto rendimiento en Google Cloud.
Este cambio refleja la adopción generalizada de Cluster Toolkit en varios dominios, desde la computación científica y técnica hasta las aplicaciones de IA/ML.
Al agilizar la configuración y la implementación de clústeres, Cluster Toolkit permite a los usuarios centrarse en sus cargas de trabajo en lugar de en la gestión de la infraestructura. También ofrece flexibilidad para diversas tareas informáticas al admitir múltiples programadores como Slurm, GKE y Batch.
Entre las ventajas clave de Cluster Toolkit se incluyen:
* Fácil implementación y gestión de clústeres
* Opciones de inicio rápido para cargas de trabajo de HPC e IA/ML
* Integración de las prácticas recomendadas de Google Cloud
* Actualizaciones periódicas y nuevas funciones
* Accesibilidad de código abierto
Entre las nuevas funciones de Cluster Toolkit se incluyen:
* A3 Mega Blueprint: para implementar un clúster de máquinas virtuales A3 Mega listas para entrenar grandes modelos lingüísticos (LLM) y otras cargas de trabajo de IA/ML.
* Imagen de máquina virtual HPC: una imagen de máquina virtual preinstalada con herramientas y bibliotecas HPC populares.
* Slurm-gcp v6: la última versión de la solución Slurm-gcp, que proporciona una experiencia fluida para ejecutar cargas de trabajo de Slurm en Google Cloud.
Se recomienda encarecidamente actualizar los clones locales y los nombres de los comandos para evitar cualquier confusión.
Para empezar a utilizar Cluster Toolkit, seleccione uno de sus planos de HPC e IA/ML fáciles de usar, disponibles a través de su repositorio de GitHub, y utilícelo para configurar un clúster. También ofrecen una variedad de recursos para ayudarle a empezar, incluyendo documentación, inicios rápidos y vídeos.