AWS y AI21 Labs anunciaron la disponibilidad de la nueva y potente familia de modelos de lenguaje grandes (LLM) Jamba 1.5 de AI21 Labs en Amazon Bedrock. Estos modelos representan un avance significativo en las capacidades de lenguaje de contexto largo, ofreciendo velocidad, eficiencia y rendimiento en una amplia gama de aplicaciones.

Los modelos Jamba 1.5 aprovechan una arquitectura híbrida única que combina la arquitectura del modelo Transformer con la tecnología de modelo de espacio de estados estructurado (SSM). Este enfoque innovador permite a los modelos Jamba 1.5 manejar ventanas de contexto largas de hasta 256 000 tokens, al tiempo que mantiene las características de alto rendimiento de los modelos Transformer tradicionales.

Algunas de las principales ventajas de los modelos Jamba 1.5 incluyen:

* Manejo de contexto largo: con una longitud de contexto de 256 000 tokens, los modelos Jamba 1.5 pueden mejorar la calidad de las aplicaciones empresariales, como el resumen y análisis de documentos extensos, así como los flujos de trabajo de agentes y RAG.

* Multilingüe: compatibilidad con inglés, español, francés, portugués, italiano, holandés, alemán, árabe y hebreo.

* Fácil de usar para los desarrolladores: compatibilidad nativa con salida JSON estructurada, llamada a funciones y capacidad para digerir objetos de documentos.

* Velocidad y eficiencia: AI21 midió el rendimiento de los modelos Jamba 1.5 y compartió que los modelos demuestran una inferencia hasta 2,5 veces más rápida en contextos largos que otros modelos de tamaños comparables.

Los modelos Jamba 1.5 son perfectos para casos de uso como el análisis de documentos emparejados, el análisis de cumplimiento y la respuesta a preguntas para documentos largos. Pueden comparar fácilmente información de múltiples fuentes, verificar si los pasajes cumplen con pautas específicas y manejar documentos muy largos o complejos.

La familia de modelos Jamba 1.5 de AI21 Labs ya está disponible de forma general en Amazon Bedrock en la región Este de EE. UU. (Norte de Virginia) de AWS.

Creo que estos modelos representan un importante paso adelante en el campo del procesamiento del lenguaje. La capacidad de manejar contextos largos abre una amplia gama de nuevas posibilidades para los desarrolladores y las empresas. Estoy emocionado de ver qué aplicaciones innovadoras se desarrollarán utilizando estos modelos.