Fireworks.ai, una startup de IA generativa, ha lanzado el motor de inferencia más rápido y eficiente hasta la fecha. La compañía se basa en sistemas de IA compuestos, que reemplazan los modelos de IA únicos tradicionales con múltiples modelos que interactúan. Fireworks.ai se ha asociado con Google Cloud y otros socios como NVIDIA para ofrecer soluciones rentables y escalables. Google Cloud ayuda a Fireworks.ai a procesar más de 140 mil millones de tokens al día con un tiempo de actividad de la API del 99,99 %. Fireworks.ai también utiliza los servicios de Google Cloud, como Cloud Pub/Sub, Cloud Functions, Cloud Monitoring y BigQuery, para optimizar el rendimiento y reducir los costos. Gracias a esta asociación, Fireworks.ai ha podido ofrecer una latencia 4 veces menor y un rendimiento 4 veces mayor en comparación con los servicios alojados de la competencia. Fireworks.ai enfatiza la importancia del acceso de código abierto a la IA y trabaja con Google Cloud para permitir que más empresas obtengan valor del uso innovador de la IA generativa.
Fireworks.ai y Google Cloud: Impulsando la innovación en IA generativa
Google Cloud