BIG DATA
UN MUNDO INTERMINABLE DE POSIBILIDADES

Big Data

Originalmente se asoció el término “Big Data” a tres conceptos clave: gran volumen de datos, variedad y complejidad de los mismos y velocidad en el procesamiento. 

Durante la última década, la cantidad de datos disponibles ha crecido exponencialmente a medida que se han agregado distintos tipos de fuentes y orígenes de datos como teléfonos móviles y wearables, redes sociales, etiquetas RFID, cámaras, vehículos, TV’s y dispositivos IoT, entre otras. Es indudable que en la actualidad existe un gran volumen de datos disponible y, por lo tanto, el concepto “Big Data” ha evolucionado, asociándose más a las estrategias, métodos y herramientas utilizados para su procesamiento.

¿Big Data reemplaza el Business Intelligence?

No, por el contrario, se complementan muy bien. La diferencia principal con el BI tradicional, es un tema técnico: es decir, cómo vamos a almacenar los datos, qué herramientas y arquitectura se van a utilizar y, por último, qué estrategias aplicar.


Ambos conceptos persiguen el propósito de “disponibilizar información relevante y fiable, para las personas correctas, en el momento justo” para apoyar la toma de mejores decisiones, de la manera más rápida y eficiente posible.

Ciclo de Big Data
Big Data vs Business Intelligence

Sin embargo, el procesamiento de grandes (enormes) volúmenes de datos de distintos tipos y orígenes, no estructurados (o al menos una gran parte de ellos), prácticamente en tiempo real, requiere de estrategias y herramientas distintas a las del BI. 

¿Cuáles son estos datos no estructurados? e-mails o cadena de textos, fotografías, videos, audios, geo-referencias, valores de sensores y resultados de aplicar AI sobre cualquiera de estos, entre otros.

"No todo lo que cuenta se puede contar y no todo lo que se puede contar cuenta"

Albert einstein

Arquitectura y Herramientas de Big Data

Ciclo de gestión de la información, consta de cuatro grandes etapas: Recolección, Almacenamiento, Procesamiento y Aplicación de los datos. Particularmente en Big Data, la arquitectura estará caracterizada por:

Sistemas de archivos distribuidos

Para facilitar el almacenamiento de grandes volúmenes de datos en bruto

BBDD NoSQL

Para el almacenamiento de datos no estructurados

BBDD en memoria

Como consecuencia del procesamiento de datos con estas características

De esta forma se da solución a los tres conceptos que caracterizan el concepto de Big Data mencionados anteriormente.

Los 3 problemas del Big Data

Se pueden conformar diversos ecosistemas tecnológicos donde desarrollar una solución de Big Data. Las posibilidades son infinitas, pero cabe destacar herramientas como Apache Hadoop, MongoDB, Jupiter, Apache Spark, Elasticsearch, Apache Storm y Apache Kafka, que son probablemente las herramientas más utilizadas en la actualidad.

“Solo me fío de las estadísticas que he manipulado”

WINSTON CHURCHILL

Desafíos en Big Data

La calidad del dato y la imparcialidad del código, la seguridad y confidencialidad del sistema, y la ética con la que se trata la información, son los desafíos más importantes en materia de Big Data.

No todos los datos generan información, pero sí, todos los datos tienen un coste asociado a la recolección, procesamiento, almacenamiento y el eventual descarte. En la actualidad, durante el proceso de toma de decisiones, las organizaciones utilizan menos del 2% de los datos y se estima que, del volumen total de datos, entre el 25% y el 30% tendrán valor que aportar en dicho proceso. 

¿Necesitas que te ayudemos?

Queremos Ayudarte