Entradas

Mostrando entradas de enero, 2021

¿Hacia dónde irá el Big Data en el futuro?

Imagen
El Big Data ya está cambiando las reglas de juego en muchos aspectos, y sin duda seguirá creciendo. ¡Imagínate lo mucho que puede cambiarnos la vida todo esto en el futuro! Una vez que todo lo que tenemos a nuestro alrededor empiece a usar Internet (el Internet de las Cosas), las posibilidades de usar el Big Data serán tremendas. La cantidad de datos que tenemos a nuestra disposición no hará más que aumentar, y la tecnología analítica avanzará todavía más. El Big Data es una de esas cosas que conformará el futuro de la humanidad. Todas las herramientas que usamos para el Big Data también evolucionarán. Las infraestructuras deberán adaptarse a nuevos requisitos. Quizá en el futuro seamos capaces de almacenar todos los datos que necesitamos en una sola máquina y es posible que tenga espacio de sobra. De ser así, resultaría más barato y sencillo trabajar con todo esto. En Mailjet, nos interesa el Big Data y sin duda vamos a estar pendientes de cómo evoluciona.

Usos del Big Data

Imagen
El análisis del Big Data pueden hacerlo personas y máquinas, según las necesidades de cada uno. Usando distintos métodos analíticos, puedes combinar distintos tipos de datos y fuentes para descubrir cosas y tomar decisiones relevantes. Así podrás lanzar tus productos más rápido y dirigirlos al público adecuado. Vamos a ver algunos de los usos más habituales del Big Data. Desarrollo de productos  Cuando el grueso de tu actividad se centra en el producto, el Big Data es más que imprescindible. Vamos a tomar un ejemplo que casi todo el mundo conoce: Netflix. ¿Cómo crees que hace Netflix para enviarte un mensaje con recomendaciones especialmente elegidas para ti cada semana? Con la ayuda del análisis de Big Data, claro. Utilizan modelos predictivos y te informan de las novedades que quizás te gusten clasificando los datos del pasado y los programas que has visto o marcado como favoritos. Hay empresas que utilizan otros recursos, como información de redes sociales, información de ventas...

Las grandes V del Big Data

Imagen
Volumen  Como su propio nombre indica, cuando hablamos de Big Data nos referimos a grandes volúmenes de datos. Así que la cantidad de datos que recibas importa. Pueden ser datos de valor desconocido, como los datos sobre el número de clics en un sitio web o una aplicación móvil. Para algunas empresas pueden ser decenas de terabytes de datos, mientras que para otras pueden ser cientos de petabytes. O es posible que sepas exactamente la fuente y el valor de los datos que recibes, pero aun así vas a recibir grandes volúmenes a diario.  Velocidad  La velocidad es la gran V que representa lo rápido que se reciben y tratan los datos. Si los datos se transfieren directamente a la memoria y no se escriben en un disco, la velocidad será mayor y, como consecuencia, operarás mucho más deprisa y los datos se proporcionarán prácticamente en tiempo real. Pero para esto también hace falta una forma de evaluar los datos en tiempo real. La velocidad es también la gran V más importante en ...

¿Cómo funciona el Big Data?

Imagen
La idea principal que subyace al Big Data es que cuanto más sabes sobre algo, mejor lo entiendes y te ayuda a tomar una decisión o buscar una solución. En muchos casos, este proceso está totalmente automatizado; contamos con unas herramientas tan avanzadas que crean millones de simulaciones para dar el mejor resultado posible. Pero para conseguirlo con la ayuda de las herramientas analíticas, el aprendizaje automático o incluso la inteligencia artificial, hay que saber cómo funciona el Big Data y configurarlo todo correctamente. La necesidad de gestionar tantos datos requiere una infraestructura estable y bien estructurada. Habrá que procesar rápidamente ingentes volúmenes y distintos tipos de datos y esto puede sobrecargar un único servidor o clúster. Por eso tendrás que contar con un sistema bien pensado para gestionar el Big Data. Según la capacidad del sistema, se deberán tener en cuenta todos los procesos. Y en el caso de las grandes empresas, pueden hacer falta cientos o miles de...

Tipos de Big Data

Imagen
Entre los Big Data hay tres tipos de datos: estructurados, semiestructurados y no estructurados. En cada uno de estos tipos hay mucha información útil que puedes extraer para usarla en distintos proyectos.  Los datos estructurados  tiene un formato fijo y a menudo son  numéricos.  Así que en muchos casos los gestionan maquinas y no humanos. Este tipo de datos es información que ya esta ordenada en bases de datos y hojas de calculo almacenadas en bases de datos SQL, lagos de datos y almacenes de datos. Los datos no estructurados son información que esta desorganizada y no esta en un formato predeterminado porque puede ser casi cualquier cosa. Es el caso, por ejemplo, de los datos recopilados de fuentes de redes sociales y puede convertirse en archivos de documentos de texto almacenados en Hadoop, como clusteres o sistemas NoSQL. Los datos semiestructurados pueden contener ambas formas de datos, como registros de servidores web o datos de sensores...

Herramientas de Big Data

Imagen
Como el Big Data es algo que no deja de crecer, las que se usan para gestionarlo evolucionan con el y se perfeccionan permanentemente. se emplean las herramientas como Hadoop,  Pig ,  Hive ,  Cassandra , Spark , Kafka , etc., dependiendo de los requisitos de cada organización. Hay muchísimas soluciones, y buena parte de ellas son de código abierto. También hay una fundación Apache Software Foundation   (ASF)— que apoya muchos de estos proyectos sobre Big Data.  Como esas herramientas son muy importantes para el Big Data, vamos a explicar un poco en que consisten. Quizá una de las mas afianzadas para analizar Big Data sea Apache Hadoop un marco de trabajo de código abierto para almacenar y procesar grandes conjuntos de datos. Otra que cada vez esta recibiendo mas atención es Apache Spark. Una de las ventajas de Spark es que puede almacenar gran parte de los datos de procesamiento en la memoria y en el disco, así que pude ser muc...

Cómo construir un plan de Data Governance en Big data

Imagen
Gobernabilidad significa asegurarse de que los datos estén autorizados, organizados y con los permisos de usuario necesarios en una base de datos, con el menor número posible de errores, manteniendo al mismo tiempo la privacidad y la seguridad . Esto no parece un equilibrio fácil de conseguir, sobre todo cuando la realidad de dónde y cómo los datos se alojan y procesan está en constante movimiento. A continuación veremos algunos pasos recomendados al crear un plan de Data Governance en Big Data. 1. Acceso y Autorización Granular a Datos 2. Seguridad perimetral, protección de datos y autenticación integrada Con la autenticación, se trata de ver  cómo integrarse con LDAP [Lightweight Directory Access Protocol], Active Directory y otros servicios de directorio . También se puede dar soporte a herramientas como Kerberos para soporte de autenticación. Pero  lo importante es no crear una infraestructura separada, sino integrarla en la estructura existente. 3. Encriptación y Tokeni...

Desafíos de la calidad de datos en Big Data

Imagen
Las especiales características del Big Data hacen que su  calidad de datos   se enfrente a múltiples desafíos. Se trata de las conocidas como 5 Vs: Volumen, Velocidad, Variedad, Veracidad y Valor, que definen la problemática del Big Data. Estas 5 características del big data provocan que las empresas tengan  problemas para extraer datos reales y de alta calidad, de conjuntos de datos tan masivos, cambiantes y complicados . Hasta la llegada del Big Data, mediante ETL podíamos cargar la información estructurada que teníamos almacenada en nuestro sistema ERP y CRM, por ejemplo. Pero  ahora, podemos cargar información adicional que ya no se encuentra dentro de los dominios de la empresa: comentarios o likes en redes sociales, resultados de campañas de marketing, datos estadísticos de terceros, etc.  Todos estos datos nos ofrecen información que nos ayuda a saber si nuestros productos o servicios están funcionando bien o por el contrario están teniendo problemas. Alg...

¿Por qué el Big Data es tan importante?

Imagen
Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras, proporciona un punto de referencia . Con una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que la empresa considere adecuada. Al hacerlo,  las organizaciones son capaces de identificar los problemas de una forma más comprensible . La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente . También les permite eliminar las áreas problemáticas antes de que los problemas acaben con sus beneficios o su reputación. El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades . Eso, a su vez, conduce a movimientos de negocios más inteligentes, operaciones más ...

¿Qué es Big Data?

Imagen
Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales , tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.  Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo,  la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes . La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de gran parte de los datos generados por las tecnologías modernas , como los  web logs, la identificación por radiofrecuencia (RFID), los senso...