Grandes Datos (Big Data) vs Minería de Datos (Data Mining). ¿Porqué no es lo mismo?

Minería de datos

 

Big Data y  minería de datos o data mining suelen relacionarse muy a menudo hoy en día, sin embargo, existen claras e importantes diferencias  entre ambos términos, y que a continuación vamos a explicar.

Antes de empezar el análisis de las diferencias recordaremos un poco la utilidad, tanto de Big data  como de Data mining.

Diferencias entre Big Data y Data Mining

¿Qué es Big Data?

Se refiere a un volumen grande de datos que pueden ser estructurados, semiestructurados y no estructurados. Comprende de 5 Vs, es decir

Volumen: se refiere a una cantidad de datos o tamaño de datos que puede estar en quintillón cuando se trata de big data.
Variedad: se refiere a diferentes tipos de datos como redes sociales, registros del servidor web, etc.
Velocidad: se refiere a qué tan rápido crecen los datos, los datos crecen exponencialmente y a un ritmo muy rápido.
Veracidad: se refiere a la incertidumbre de los datos como las redes sociales significa si los datos pueden ser confiables o no.
Valor: se refiere a los datos que estamos almacenando y si el procesamiento vale la pena y cómo nos estamos beneficiando de esta gran cantidad de datos.
Los datos grandes se pueden analizar en busca de ideas que conducen a mejores decisiones y movimientos comerciales estratégicos.

¿Cuántos datos se requieren para llamarse Big Data?

Regularmente, datos que son iguales o mayores a 1 Tb  son conocidos como Big Data. Algunos especialistas predicen que para el 2020, habrá 5,200 Gb de datos en cada persona en el mundo.

data mining

¿Por qué se considera importante el Big Data?

La importancia de Big Data no radica en cuántos datos tenemos, sino en lo que podemos obtener de esos datos. Podemos analizar datos para reducir costos y tiempo, tomar las mejores decisiones.

¿Qué es la Minería de Datos?

La extracción de datos también conocida como descubrimiento de conocimiento de los datos se refiere a la extracción de conocimiento de una gran cantidad de datos, es decir, Big Data. Se usa principalmente en la estadística, el aprendizaje automático e inteligencia artificial.

Los componentes de la minería de datos consisten principalmente en 5 niveles, que son:

  • Extraer, transformar y cargar datos en el almacén
  • Almacenar y administrar
  • Proporcionar acceso a datos (Comunicación)
  • Analizar (Proceso)
  • Interfaz de usuario (presentar datos al usuario.

Necesidad de Minería de Datos

La minería de datos nos brinda ayuda en las calificaciones de crédito, marketing, detección de fraude, como qué tipos de transacciones son como un fraude al verificar las transacciones pasadas de un usuario, verificar la relación del cliente, como qué clientes son leales y cuáles no.

Minería de datos

Big Data vs Data Mining: Diferencias

Data Mining y Big data son 2 conceptos diferentes.

Big data  se refiere a una gran cantidad de datos mientras que data mining se refiere a un drive profundo en los datos para extraer el conocimiento clave o información de una determinada cantidad de datos.

El concepto principal en Data Mining es profundizar en el análisis de los patrones y las relaciones de los datos que pueden usarse más en Inteligencia Artificial, Análisis Predictivo, etc. Pero el concepto principal en Big Data es la fuente, variedad, volumen de datos y cómo almacenar y procesar esta cantidad de datos.

Se puede decir que Data Mining no necesita depender de Big Data, ya que se puede hacer sobre la cantidad pequeña o grande de datos, pero los big data seguramente si dependen de Data Mining porque si no podemos encontrar el valor o importancia de una gran cantidad de datos, entonces esos datos no habrán servido.

En resumen, los grandes datos son los activos y la minería de datos es el administrador que se utiliza para proporcionar resultados beneficiosos.

 

 

Comentarios

Puedes compartir este post si te gustó!