Amazon anunció la disponibilidad general de Amazon SageMaker Lakehouse, una capacidad que unifica los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3) y los almacenes de datos de Amazon Redshift, lo que le ayuda a crear análisis potentes y aplicaciones de inteligencia artificial y aprendizaje automático (IA/ML) en una sola copia de datos. SageMaker Lakehouse forma parte de la próxima generación de Amazon SageMaker, una plataforma unificada para datos, análisis e IA, que reúne las capacidades de aprendizaje automático y análisis de AWS ampliamente adoptadas y ofrece una experiencia integrada para análisis e IA.
Los clientes quieren hacer más con los datos. Para avanzar más rápido en su recorrido analítico, están eligiendo el almacenamiento y las bases de datos adecuados para almacenar sus datos. Los datos se distribuyen en lagos de datos, almacenes de datos y diferentes aplicaciones, creando silos de datos que dificultan el acceso y la utilización. Esta fragmentación conduce a copias de datos duplicadas y canalizaciones de datos complejas, lo que a su vez aumenta los costos para la organización. Además, los clientes se ven obligados a utilizar motores y herramientas de consulta específicos, ya que la forma y el lugar en que se almacenan los datos limitan sus opciones. Esta restricción dificulta su capacidad para trabajar con los datos como preferirían. Por último, el acceso inconsistente a los datos dificulta que los clientes tomen decisiones comerciales informadas.
SageMaker Lakehouse aborda estos desafíos ayudándole a unificar los datos en los lagos de datos de Amazon S3 y los almacenes de datos de Amazon Redshift. Le ofrece la flexibilidad de acceder a los datos y consultarlos in situ con todos los motores y herramientas compatibles con Apache Iceberg. Con SageMaker Lakehouse, puede definir permisos detallados de forma centralizada y aplicarlos en múltiples servicios de AWS, lo que simplifica el intercambio de datos y la colaboración. Llevar datos a su SageMaker Lakehouse es fácil. Además de acceder sin problemas a los datos de sus lagos de datos y almacenes de datos existentes, puede utilizar cero ETL desde bases de datos operativas como Amazon Aurora, Amazon RDS para MySQL, Amazon DynamoDB, así como aplicaciones como Salesforce y SAP. SageMaker Lakehouse se adapta a sus entornos existentes.
Me impresionó especialmente la integración de SageMaker Lakehouse con otros servicios de AWS. Esta integración simplifica enormemente la gestión y el análisis de datos, haciéndolo mucho más fácil y eficiente. Creo que este servicio será extremadamente valioso para las empresas que buscan mejorar sus capacidades analíticas y de IA.