Big Data hoy: la información no se analiza ni se protege

EMC ha hecho públicos los resultados del último estudio Digital Universe, elaborado por IDC y patrocinado por EMC, “Big Data, Bigger Digital Shadows and Biggest Growth in the Far East”. 


El informe revela que, a pesar de la expansión sin precedentes que experimenta el universo digital, debido a los volúmenes masivos de datos generados diariamente por personas y dispositivos, solamente el 0.5% de la información mundial está siendo analizada.
 

La proliferación de dispositivos como las PCs y los smartphones, el incremento del acceso a Internet en los mercados emergentes y el aumento de datos generados por máquinas, como cámaras de videovigilancia o detectores inteligentes, ha contribuido a duplicar el universo digital en los últimos años, hasta alcanzar los 2.8 ZB. Sin embargo, la consultora predice que para 2020 el universo digital habrá logrado situarse en 40 ZB, una cifra que supera las previsiones que se habían hecho anteriormente en un 14%, y es que 40 ZB es un número 57 veces superior a la cantidad de granos de arena de todas las playas de nuestro planeta.

Hay 700,500,000,000,000,000,000 granos de arena en las playas de la Tierra (setecientos trillones quinientos mil billones). Si pudiéramos guardar este volumen de 40 ZB en el formato Blue-Ray actual, el peso de estos discos (sin embalaje) sería el mismo que 424 portaaviones Nimitz-class. Para 2020 se prevé que la cifra de 40 ZB se corresponderá con 5,247 GB por persona. 

El informe de este año es el primero en que IDC ha podido determinar donde se origina la información en el universo digital o donde es capturada o consumida por primera vez, poniendo de manifiesto algunos cambios muy significativos durante este proceso. En su sexta edición, el estudio –que mide y prevé la cantidad de información digital creada y copiada anualmente- revela importantes hallazgos sobre los “Big Data Gap”, que son: la diferencia entre el volumen de información con un valor oculto y el valor que actualmente está siendo aprovechado, el nivel de protección requerido frente al que se aplica a los datos; y por último, las implicaciones geográficas de los datos a escala global.
 

Otro aspecto destacado del estudio se refiere a la pérdida de normes volúmenes de información valiosa: Las promesas y expectativas en Big Data se basan en la extracción de valor de ingentes volúmenes de información sin explotar. Sin embargo, la mayoría de estos nuevos datos no están ni clasificados ni estructurados, lo que indica que es muy poco lo que se sabe acerca de ellos. En este sentido, IDC estima que en 2012, el 23% (643 exabytes) del universo digital sería aprovechable para Big Data si fuese clasificado y analizado.

Sin embargo, actualmente sólo el 3% de los datos potencialmente útiles está clasificado, y es inferior aún el porcentaje que está siendo analizado. En lo referente a la protección de la información, el estudio revela que la mayoría de la información digital no está protegida y añade que el volumen de datos que requiere ser protegido aumenta a un ritmo aún más rápido que el propio universo digital. En este sentido se asegura que menos de la tercera parte del universo digital necesitaba protección en 2010, una proporción que se espera que supere el 40% en 2020. 

Cloud

Según IDC, Cloud Computing juega un rol cada vez más importante en la gestión de Big Data, tanto quese prevé un incremento en el número de servidores, que se multiplicará por 10. Asimismo, el volumen de información gestionada directamente por los centros de datos corporativos se multiplicará por 14. Respecto a la morfología de los datos, se afirma que el tipo de datos almacenados en la nube experimentará una transformación radical durante los próximos años.

En 2020, IDC predice que el 46.7% de la información almacenada en la nube va a estar relacionada con el entretenimiento, es decir, que no serán datos corporativos. A medida que la infraestructura del universo digital esté cada vez más interconectada, la información no residirá en la misma región donde va a ser consumida, lo cual tampoco será necesario. En ese mismo año 2020, IDC estima que cerca del 40% de los datos estarán “tocados” por cloud computing, es decir, que en algún momento entre su creación y su consumo, habrán sido almacenados o procesados en la nube, pública o privada.