Google Cloud anunció que Google Kubernetes Engine (GKE) ahora admite hasta 65,000 nodos, lo que le permite manejar modelos de IA masivos de billones de parámetros. A medida que la IA generativa evoluciona, la necesidad de una inmensa potencia informática para entrenar estos modelos se intensifica. GKE ahora ofrece una escala más de 10 veces mayor que los otros dos proveedores de nube pública más grandes, lo que permite a los clientes reducir el tiempo de entrenamiento del modelo o escalar modelos a múltiples billones de parámetros. Esta expansión también permite ejecutar cinco trabajos en un solo clúster, cada uno coincidiendo con la escala del récord mundial anterior de Google Cloud para el trabajo de entrenamiento más grande para LLM. Clientes como Anthropic, una empresa de investigación y seguridad de IA, han acogido con satisfacción estos desarrollos. Técnicamente, GKE está en transición del etcd de código abierto, un almacén de valores-clave distribuido, a un nuevo almacén de valores-clave más robusto basado en Spanner, la base de datos distribuida de Google. Este cambio marcará el comienzo de nuevos niveles de confiabilidad para los usuarios de GKE, mejorando la latencia de las operaciones del clúster. Además, gracias a una revisión importante de la infraestructura de GKE que administra el plano de control de Kubernetes, GKE ahora se escala significativamente más rápido. Google Cloud también mantiene su compromiso con el código abierto, asegurando que todas las optimizaciones y mejoras necesarias para tal escala sean parte del Kubernetes de código abierto central.
GKE se escala a 65,000 nodos para modelos de IA de billones de parámetros
Google Cloud