¿Qué es Data Mining?

Desde sus inicios, el término “Data Mining” (Minería de datos) ha sido llamado por muchos nombres. En los 60′s, los estadísticos utilizaban términos como “Data Fishing” (Pesca de datos) o “Data Dredging” (Filtración de datos) para referirse a lo que consideraban la “mala práctica” de analizar datos sin una hipótesis a priori.

El término “Data Mining” apareció alrededor de 1990 en la comunidad de base de datos. Brevemente, existía la frase “database mining” ™, pero fue registrada por la compañía de software HNC (ahora parte de Fair, Isaac), y los investigadores la cambiaron por “data mining”. Otros términos utilizados en ese tiempo eran: Data Archaeology (arqueología de datos), Information Harvesting (recolección de información), Information Discovery (Descubrimiento de Información), Knowledge Extraction (Extracción de conocimiento), entre otros.

En 1989, Gregory Piatetsky-Shapiro acuñó el término “Knowledge Discovery in Databases (KDD)” (Descubrimiento de Conocimiento en Bases de Datos) para el primer taller que se realizó sobre el mismo tema, y este término se hizo más famoso dentro de la comunidad científica y académica. A fines del 2003 el término “Data Mining” se fue convirtiendo cada vez más popular en la comunidad empresarial y en la prensa. A inicios de 2004, la búsqueda en Google del término “data mining” se encontraba en alrededor de 2.000.000 de páginas.

En la actualidad, Data Mining (Minería de Datos) y Knowledge Discovery (Descubrimiento de Conocimiento) se utilizan indistintamente, y también se han agregado nuevos términos que podrían parecer similares, pero no lo son tanto, tales como: Business Intelligence, Analytics, Business Analytics, Web Mining, Web Analytics, entre otros.

Peeeero, ¿Qué es Data Mining?

Dejamos aquí algunas frases cortas que ciertamente ayudarán a quienes están dentro de este mundillo para poder definir el término “Data Mining” y responder esa recurrente pregunta que siempre nos hacen: “a que se dedica ud.”?

Al final de las frases, incluimos un video más producido del profesor Stephan Kudyba, del NJIT, intentando explicar de qué se trata esta cosa llamada “Data Mining”, claro que está en inglés, pero pueden activar los CC para entenderlo mejor.

Frases cortas para ayudar a un data miner a definir “Data Mining”:

“Descubrimiento de conocimiento en bases de datos”
Gregory Piatetsky-Shapiro

“Extracción no trivial de información que reside de manera implícita en los datos”
Wikipedia

“Torturar a los datos hasta que confiesen”
Anónimo

“Excarvar montañas de datos y encontrar pepitas de oro (o diamantes)”
Anónimo

“La gente puede venir con estadísticas para probar cualquier cosa. Cuarenta por ciento de todas las personas lo saben”
Homero Simpson

Dilbert

Y finalmente el video del profesor Stephan Kudyba, del NJIT, intentando explicar Data Mining:

¿Y para ti?, ¿Qué es Data Mining?

…escriban sus comentarios!

Leave a reply