logo

Qué es el data mining

Data 
03/06/2021

El data mining, la minería de datos o la prospección de datos son términos que posiblemente hayas escuchado en alguna ocasión. En el artículo de hoy resolveremos las dudas frecuentes y explicaremos de manera clara y contundente qué es el data mining o que significa la minería de datos.

 

¿Qué es la minería de datos?

De entrada, diremos que no es un término de nueva aparición. No es algo que utilicemos desde la revolución tecnológica, pero ha sido con la transformación digital con la que nos hemos dado cuenta de la necesidad, el potencial y el increíble valor del dato.

Los datos que acumulan las empresas o negocios, las instituciones o incluso cualquier particular, han pasado a convertirse en una materia prima que, una vez bien elaborada, se convierte en conocimiento valioso para la concepción de estrategias y persecución de objetivos en el ámbito de los datos extraídos.

 

Minería de datos y estadística ¿es lo mismo?  

Aunque es verdad que en una primera aproximación al término podríamos encontrar cierto paralelismo con la estadística, el data mining trabaja con un gran volumen de datos y con una tipología diferente. Además, persigue un objetivo final, la extracción del conocimiento.

Por ejemplo, la estadística nos dice que el 16% de las mujeres nacen rubias, pero si establecemos un conjunto de reglas basadas en antecedentes, y otras características concretas podríamos predecir si el futuro bebé será una niña rubia.

De todas maneras, tenemos que otorgarle a la ciencia estadística el papel de “madre” de la minería de datos, pero la gran diferencia es que el data mining no arroja datos, sino, conocimiento nuevo extraído y originado por la herramienta y de una manera asistida o automática. 

 

                       para qué sirve la minería de datos y la extracción del conocimiento 

 

¿De dónde viene la minería de datos? 

De la necesidad. El crecimiento de las bases de datos digitales y la aparición de variadas fuentes de creación de datos ha generado la obligación de aprender a interpretarlos, de saber estudiarlos, para de esta manera predecir el futuro, entender el presente y analizar el pasado.

Este sistema que antes se podía realizar de manera más manual, ahora ya es imposible con el crecimiento exponencial de los datos y es necesario utilizar potentes herramientas.

Es por ello que la minería de datos se convierte en el método de resolución del problema que supone el análisis de las bases de datos actuales. 

Pongamos un ejemplo. Una franquicia de comida rápida desea abrir un nuevo establecimiento y duda en diferentes zonas geográficas. Una de las cosas que hará esta empresa es analizar su base de datos buscando el perfil de sus mejores clientes y cruzarlos con diferentes datos sociodemográficos estableciendo patrones característicos y determinando dónde se encuentran ubicados un mayor número de esos “buenos clientes”.   

 

El almacén de los datos o el data warehouse

Cuando las cantidades de datos no eran tan grandes como ahora, se podía recurrir al análisis y volcado de informes a través de lenguajes convencionales como el SQL. Pero una vez que su crecimiento se disparó, la tecnología permitió construir una nueva arquitectura llamada almacén de datos o data warehouse. Sus primeras apariciones son a finales de los 80.

 

                    el almacén o warehouse de la minería de datos

 

A día de hoy, el big data y la tecnología avanzada ha cambiado las capacidades de estos almacenes y ha reducido los costes, ha mejorado su rendimiento, su fiabilidad y en definitiva, les ha dado más valor a los datos. 

 

Aplicaciones de la minería de datos 

Podríamos decir sin temor a equivocarnos, que las empresas de distribución o de publicidad fueron las primeras en aplicar la minería de datos, pero realmente hoy se utiliza en cualquier área o sector, por ejemplo:

-La banca

-Seguros médicos

-Educación

-Política

-Medicina

-Ciencia…

 

Las etapas de la minería de datos

Existen una amplia variedad en los sistemas de minería de datos y cada uno de ellos se centra en las características típicas del dato que minan o la técnica que emplean. 

Aunque la minería de datos es el proceso principal para obtención del conocimiento, el desarrollo es más amplio y se describe en varias fases:

1-Preparación de datos. Se determinan las fuentes, se transforma y estandarizan los datos, se corrigen y se almacenan.

2-Minería de datos. Se clasifican y agrupan los datos y se decide el método a utilizar.

3-Evaluación. Es donde los expertos analizan los patrones.

4-Difusión. Se aplica el nuevo conocimiento adquirido. 

En muchas ocasiones pueden aparecer diferentes objetivos, por ejemplo, un e-commerce puede utilizar la minería de datos en su negocio para tener localizados a los mejores clientes, cómo conservarlos y mantenerlos contentos, pero también podría tener como objetivo construir un segundo modelo predictivo que le ayude a localizar a los clientes que dejarán de serlo próximamente.

Nos hemos centrado en la minería de datos porque es la etapa más importante del KDD (extracción de conocimiento) pero queremos que tengas claro que forma parte de un proceso más amplio. 

Para finalizar, hay que tener en cuenta que la fase de evaluación e interpretación de los patrones que nos arrojan los algoritmos no es nada sencilla. Se barajan diferentes criterios y es necesario ponerlos en el contexto del modelo predictivo y tener muy en cuenta el coste asociado de los errores que pudiéramos cometer.

En ocasiones, las predicciones no son un reflejo del mundo real porque podríamos haber omitido algunos parámetros que inciden en ella, por eso es de vital importancia contar con profesionales bien formados en el departamento. En nuestro Máster en Business Intelligence y Data Management capacitamos a los profesionales para ocupar los puestos que demandan las grandes compañías.

Da un paso adelante y predice un mejor futuro para ti, matriculándote en una de las formaciones más buscadas.

 

 

 



© Instituto de Innovación Digital de las Profesiones. Planeta Formación y Universidades. Todos los derechos reservados.
Por cualquier consulta, escríbanos a info@inesdi.com