Box.Inc, líder mundial en gestión de contenido en la nube, ha compartido su exitosa implementación de Google Cloud Dataplex para mejorar la gobernanza, el descubrimiento, la observabilidad y la seguridad de los datos. Como empresa basada en datos, Box.Inc se enfrentó a desafíos para administrar grandes cantidades de datos y al mismo tiempo garantizar su seguridad, accesibilidad y cumplimiento. La implementación de una solución de catálogo de datos avanzada basada en Dataplex fue crucial para optimizar las operaciones de su plataforma de datos.
Uno de los desafíos clave que enfrentó Box.Inc fue el descubrimiento de datos, donde los analistas de productos, los científicos de datos y los ingenieros de ML tenían dificultades para encontrar y comprender conjuntos de datos relevantes. Al aprovechar las etiquetas de metadatos y las plantillas de etiquetas de Dataplex, pudieron crear un marco de metadatos estandarizado que facilitó el descubrimiento y la recuperación de datos.
Otro desafío fue la observabilidad de los datos, donde los ingenieros de datos encontraron difícil monitorear las canalizaciones de datos para fines de depuración. Las etiquetas de metadatos operativos a nivel de tabla de Dataplex combinadas con las potentes API de Data Lineage les ayudaron a lograr la observabilidad de datos de extremo a extremo, lo que garantiza que los metadatos críticos, como las marcas de agua de ingestión y el estado de la canalización, se capturen con precisión.
Además, Box.Inc fortaleció su postura de seguridad al implementar un marco integral de clasificación de datos para un control de acceso detallado. Al clasificar los datos confidenciales y aplicar controles de acceso estrictos, podrían cumplir con las regulaciones como el RGPD y proteger la información confidencial del cliente.
En conclusión, Dataplex ha permitido a Box.Inc transformar su plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Con un enfoque en la gobernanza, el descubrimiento, la observabilidad y el cumplimiento de la seguridad de los datos, están equipados para enfrentar los desafíos de la gestión de datos en la era digital.