Seis estrategias para simplificar la integración de datos en entornos multicloud

El entorno en la nube se ha convertido en un imán para todo tipo de empresas: para startups que no quieren invertir demasiados recursos en construir una infraestructura TI propia; para empresas ya establecidas que aspiran a ganar eficiencia al trasladar algunas aplicaciones y cargas de trabajo a la nube; y para las que ofrecen aplicaciones SaaS o DaaS (data-as-a-service).

Y no solo eso. Teniendo en cuenta las particularidades del mercado y las distintas alternativas que ofrece, cada vez son más las que optan por escenarios multicloud, trabajando a la vez con proveedores como Amazon Web Services, Google Cloud Platform o Microsoft Azure, mientras configuran un despliegue IT híbrido en el que se incluye su centro de datos on premises.

Denodo observa que esto que desde luego tiene muchas ventajas, presenta también distintos retos a superar cuando los usuarios necesitan acceder a una visión completa de los datos que manejan. Los entornos híbridos aumentan la complejidad de la administración TI de las empresas y suponen desafíos en términos de gobernanza y seguridad de los datos. En este sentido y para simplificar la integración de los datos y su análisis posterior, Denodo propone las siguientes estrategias:

  • 1. Virtualización de los datos

Más que nunca, las organizaciones necesitan una estrategia de integración de datos. La forma en la que las empresas han llevado sus silos de datos al cloud ha provocado que la gestión de los mismos sea cada vez más compleja. Para unificar e integrar, la virtualización de datos puede aliviar la complicación que conlleva el despliegue de túneles de datos para extraerlos de cada una de las fuentes en las que se encuentran y trasladarlos después a un data lake, ya sea local o en la nube.

Tal vez le interese: Data Virtualization for Dummies

  • 2. Integración eficiente

Las organizaciones deben examinar cómo pueden reducir movimiento y migración de datos, que son habitualmente, las fases más intensivas en tiempo de la integración de los mismos.

Y aquí aunque es cierto que la virtualización de los datos no elimina por completo la necesidad de migrarlos, le da a las organizaciones la posibilidad de dejarlos «intactos», replicando de forma virtualizada solo los necesarios en un data warehouse en la nube.

  • 3. Acceso a silos multicloud

Aunque las ventajas de aproximación multicloud son evidentes (evitar vendor lock-in, ahorro de costos, etc.), la mayoría de los usuarios se enfrentan al mismo problema: al crecer el número de silos de datos, se incrementa la necesidad de contar con conocimientos cada vez más técnicos y especializados en cada uno de estos. Esto no solo limita su integración, sino también que la empresa tenga una visión de los mismos unificada. Al combinar fuentes dispares de datos de forma virtual para crear nuevas vistas lógicas, mediante una capa de virtualización de datos, los usuarios pueden resolver este problema.

Tal vez te interese: Encuesta Global sobre Nube 2020: realidades y expectativas

  • 4. Sincronizar la virtualización

En escenarios híbridos y multidistribuidos en los que se almacena información estructurada y no estructurada en una arquitectura multicloud, suele ser difícil encontrar un recurso desde el que acceder a un «conocimiento» uniforme de todos los datos con los que contamos. Sin embargo, al sincronizar la virtualización de los datos con los metadatos y la gestión de datos semánticos con la que contamos, las organizaciones pueden avanzar hacia su integración en dos frentes: metadatos y especificaciones compartidas y modelos de datos semánticos de alto nivel.

  • 5. Gobernanza

En los entornos híbridos multi-cloud, el gobierno de los datos es más complicado. En este sentido, las organizaciones necesitan asegurarse de que cuentan con las mismas reglas, políticas, procesos, etc., en cada uno de los silos en los que almacenan sus datos. Deben conocer de qué forma se accede y contar con mecanismos que sancionan los accesos indebidos.

En este punto, una capa de virtualización de los datos puede mejorar la forma en la que las organizaciones determinan el acceso a los mismos, estableciendo un punto de acceso único, de modo que solo los usuarios autorizados pueden trabajar con datos sensibles.

  • 6. Cuellos de botella

Al apostar por la virtualización de los datos, se incrementa su agilidad, se reduce el volumen de las cargas de trabajo y se evitan cuellos de botella en el desarrollo y despliegue de aplicaciones y datos.