A medida que crece el Internet de las cosas (IoT), también crece la cantidad de datos no estructurados que las organizaciones necesitan procesar.
El Internet de las cosas (IoT) actual ha recorrido un largo camino desde el «hogar inteligente». Ahora estamos en una escala de infraestructura global inteligente, con millones de dispositivos IoT en red. Desde ciudades inteligentes y fabricación hasta vigilancia minorista y sostenibilidad de centros de datos, la practicidad de IoT es clara. Sin embargo, lo que es menos práctico es el tamaño de su conjunto de datos.
El IoT crea zettabytes de datos durante todo el día. Estos datos no solo son grandes, no están estructurados, lo que significa que almacenarlos ni siquiera es la historia completa: procesarlos, extraerlos y analizarlos es el próximo gran obstáculo. Está dejando a muchas organizaciones luchando por encontrar las soluciones de almacenamiento y análisis adecuadas para mantenerse a la vanguardia de su escala.
Así es como las organizaciones pueden aprovechar los datos de IoT para obtener más ventaja en el perímetro.
¿Por qué los datos de IoT están creciendo en alcance y en valor?
El IoT se compone de máquinas, sistemas, sensores, cámaras y otros equipos que están conectados en red con otras máquinas y sistemas para compartir, almacenar y procesar datos. Estos dispositivos IoT pueden ofrecer:
- recomendaciones automatizadas
- eficiencia incrementada
- seguimiento de inventario
- escaneo biométrico en los controles de seguridad
- sistemas de gestión de flotas que controlan la velocidad y la ubicación del conductor
- sistemas de seguridad pública que mantienen una estrecha vigilancia en áreas concurridas y alertan a las autoridades sobre situaciones peligrosas
IDC predijo que para 2025, 152 000 dispositivos IoT se conectarán a Internet por minuto, y las estimaciones de la cantidad total de dispositivos conectados para 2025 oscilan entre 27 000 millones y 80 000 millones.
Cada uno de esos miles de millones de dispositivos está generando sus propios grandes volúmenes de datos no estructurados en tiempo real, la mayoría de los cuales deben almacenarse, administrarse, agregarse y analizarse si una organización desea obtener su verdadero valor. Intentar hacer eso en hardware heredado es una batalla cuesta arriba.
El desafío de IoT y datos no estructurados
Los tipos de datos de IoT pueden variar:
- Datos estructurados: piense en información categorizada fácilmente que podría caber en filas y columnas de una hoja de cálculo de Excel
- Datos no estructurados: datos que son más difíciles de organizar. Esto puede incluir datos de flujo de tráfico hasta comentarios de clientes grabados desde una llamada telefónica hasta imágenes de vigilancia de cámaras y comentarios en las redes sociales.
Los datos no estructurados son difíciles de organizar y también son el tipo de datos más común. Los analistas de la industria dicen que podría representar del 80% al 90% de toda la recopilación de datos de una organización. Para muchas organizaciones, la forma más viable y económica de almacenar esto era en almacenamiento basado en disco. Pero para que los datos de IoT sean útiles, deben ser accesibles, y el disco se suma a este desafío.
Lo que se necesita es velocidad y agilidad. Los sistemas de análisis de big data que pueden analizar datos no estructurados y agregarlos con otras fuentes y tipos de datos pueden hacer conexiones y proporcionar información a partir de conjuntos de datos muy diferentes, como los comportamientos de compra de los clientes y los patrones climáticos. O la rotación de empleados y las tasas de interés federales. La importancia y las demandas de los datos no estructurados no son diferentes cuando se trata de IoT.
Ahí es donde radica el valor, y donde el almacenamiento de datos no estructurados basado en flash puede ayudar.
¿Por qué el almacenamiento de datos es clave para desbloquear información?
Las empresas que desean aprovechar el verdadero potencial de su IoT y otros datos necesitan la solución adecuada para almacenarlos. Si se trata de almacenar datos de IoT para un análisis inmediato o posterior, la solución inteligente es aquella que les ayuda a abordar los desafíos que plantean los datos no estructurados exigentes y de rápido crecimiento.
El almacenamiento se suele dividir en silos. Estos a menudo se alinean con las diversas formas en que el sistema mantiene, organiza y presenta los datos. Si las soluciones de almacenamiento están optimizadas para tipos específicos de datos y cargas de trabajo en función del soporte del protocolo, los requisitos de rendimiento o la escalabilidad, puede crear problemas para el análisis de big data. Cuando todos los tipos de datos deben almacenarse, administrarse y analizarse juntos, la capacidad de organizar, administrar y acceder a todos los datos desde la misma plataforma es fundamental.
Por Julio Castrejón, Country Manager México en Pure Storage