Las grandes V del Big Data
Volumen
Como su propio nombre indica, cuando hablamos de Big Data nos referimos a grandes volúmenes de datos. Así que la cantidad de datos que recibas importa. Pueden ser datos de valor desconocido, como los datos sobre el número de clics en un sitio web o una aplicación móvil. Para algunas empresas pueden ser decenas de terabytes de datos, mientras que para otras pueden ser cientos de petabytes. O es posible que sepas exactamente la fuente y el valor de los datos que recibes, pero aun así vas a recibir grandes volúmenes a diario.
Velocidad
La velocidad es la gran V que representa lo rápido que se reciben y tratan los datos. Si los datos se transfieren directamente a la memoria y no se escriben en un disco, la velocidad será mayor y, como consecuencia, operarás mucho más deprisa y los datos se proporcionarán prácticamente en tiempo real. Pero para esto también hace falta una forma de evaluar los datos en tiempo real. La velocidad es también la gran V más importante en ámbitos como el aprendizaje automático y la inteligencia artificial.
Variedad
La variedad se refiere a los tipos de datos que están disponibles. Cuando trabajas con tantos datos, debes saber que muchos de ellos son no estructurados y semiestructurados (texto, audio, vídeo, etc.). Habrá que procesar aún más los metadatos para que todos puedan entenderlos.
Veracidad
La veracidad se refiere a lo exactos que son los datos del conjunto de datos. Puedes recopilar muchos datos de redes sociales o sitios web, pero ¿cómo puedes asegurarte de que los datos son exactos y correctos? Si usas datos de mala calidad sin comprobarlos, puedes tener problemas. Los datos inciertos pueden dar lugar a análisis imprecisos y llevarte a tomar decisiones equivocadas. Así que siempre debes comprobar los datos y cerciorarte de disponer de suficientes datos precisos para obtener resultados válidos y relevantes.
Valor
Como decimos, no todos los datos citados tienen valor y pueden utilizarse para tomar decisiones comerciales. Es importante conocer el valor de los datos que tienes a tu disposición. Tendrás que establecer una forma de limpiar los datos y confirmar que son relevantes para el propósito que tienes en mente.
Variabilidad
Cuando tienes muchos datos, en realidad puedes utilizarlos con muy distintos fines y formatearlos de distintas maneras. No es fácil recoger tantos datos, analizarlos y gestionarlos de la manera más adecuada, así que lo normal es usarlos varias veces. Eso es lo que significa la variabilidad: la opción de utilizar los datos con distintos fines.
Ya sabemos muchas cosas sobre el Big Data: qué es, los tipos de datos que existen y las grandes V. Pero todo esto no serviría de gran cosa si no sabemos qué se puede hacer con el Big Data y por qué es cada vez más importante.

Comentarios
Publicar un comentario