Tipos de Big Data

Entre los Big Data hay tres tipos de datos: estructurados, semiestructurados y no estructurados. En cada uno de estos tipos hay mucha información útil que puedes extraer para usarla en distintos proyectos. 
  • Los datos estructurados tiene un formato fijo y a menudo son numéricos. Así que en muchos casos los gestionan maquinas y no humanos. Este tipo de datos es información que ya esta ordenada en bases de datos y hojas de calculo almacenadas en bases de datos SQL, lagos de datos y almacenes de datos.
  • Los datos no estructurados son información que esta desorganizada y no esta en un formato predeterminado porque puede ser casi cualquier cosa. Es el caso, por ejemplo, de los datos recopilados de fuentes de redes sociales y puede convertirse en archivos de documentos de texto almacenados en Hadoop, como clusteres o sistemas NoSQL.
  • Los datos semiestructurados pueden contener ambas formas de datos, como registros de servidores web o datos de sensores que haya configurado. Para ser precisos, son datos que a pesar de no estar clasificados en un repositorio concreto (una base de datos), contienen información vital o etiquetas que segregan elementos individuales dentro de los datos.
El Big Data incluye siempre múltiples fuentes y la mayor parte del tiempo es de distintos tipos también. Así que no siempre es fácil saber como integrar todas las herramientas que necesites para trabajar con distintos tipos de datos. 






Comentarios

Entradas populares de este blog

Cómo construir un plan de Data Governance en Big data

¿Cómo funciona el Big Data?

Usos del Big Data