Contenidos:
¿Qué es la minería de datos?
Origen
La minería de datos comenzó a desarrollarse alrededor de los años sesenta, cuando los matemáticos y estadísticos empiezan a utilizar términos como Data Mining (DM), Data Fishing o Data Archaeology con la idea de encontrar correlaciones entre los datos. Aún no había una definición previa.
«Desde el origen, los procesos de minería de datos utilizan el análisis matemático para deducir patrones y tendencias que existen en los datos pero que sin estos procesos, no seríamos capaces de identificar»
Introducción al Data Mining
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Estos modelos de exploración de datos se pueden aplicar en muchos escenarios. Algunos de los más importantes son:
1. Pronóstico: Cálculo de las ventas y predicción de las cargas del servidor o del tiempo de inactividad del servidor.
2. Riesgo y probabilidad: Elegir los mejores clientes para correspondencia, determinar el punto de equilibrio probable para escenarios de riesgo, asignación de probabilidades a diagnósticos u otros resultados de destino.
3. Recomendaciones: Determinación de los productos que se pueden vender juntos y generación de recomendaciones.
4. Búsqueda de secuencias: Análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos.
5. Agrupación: Distribución de clientes o eventos en grupos de elementos relacionados y análisis y predicción de afinidades.
Conceptualización
Por todo ello, no podemos decir que tengamos una única definición del término Data Mining (DM). Podríamos aproximarnos definiendo a la Minería de Datos como el conjunto de métodos estadísticos que proporcionan un alto volumen de datos (correlaciones o patrones) con la siguiente estructura de conocimiento:
Datos + Estadística = Información.
Según algunos autores, el Data Mining es aquella parte de la estadística (especialmente estadística no paramétrica) que se usa para resolver problemas que se presentan actualmente en el Análisis de Datos.
Minería de Datos, ¿Aprendizaje Automático?
El aprendizaje automático es uno de esos avances que está revolucionando nuestras vidas casi sin saberlo. Sectores como la salud, la robótica, la tecnología financiera o los Big Data están experimentando un cambio de 180 grados gracias a los modelos que son capaces de predecir el futuro y aprender de sus propias predicciones. En resumidas cuentas, un estadio prematuro de la más conocida Inteligencia Artificial.
¿Qué se entiende por Aprendizaje Automático?
El aprendizaje automático se podría definir como el objetivo de aquellos programas capaces de ir mejorando su comportamiento y resultados utilizando la experiencia propia (aprendizaje automático= Software) y poniéndolo en valor, de forma que esos datos sean de utilidad y faciliten su interpretación y la consecuente toma de decisiones.
Dentro de los tipos de aprendizaje automático podemos diferenciar tres esquemas principales:
- Aprendizaje inductivo:
Creamos modelos de conceptos a partir de generalizar ejemplos simples, buscando patrones comunes que expliquen los ejemplos. - Aprendizaje deductivo:
Aplicamos la deducción para obtener descripciones generales a partir de un ejemplo de concepto y su explicación. - Aprendizaje por refuerzo:
En este caso el algoritmo aprende observando el mundo que le rodea y con un continuo flujo de información en las dos direcciones (del mundo a la máquina, y de la máquina al mundo) realizando un proceso de ensayo-error, y reforzando aquellas acciones que reciben una respuesta positiva en el mundo.
Para más información, no dude en ponerse en contacto con nosotros.
¿Hablamos?
Queremos acompañarle en su próximo proyecto.