Kaggle : El “Fight Club” para Data Miners
Kaggle, la plataforma de Competencias de Data Mining que venimos siguiendo hace un tiempo, fue recientemente descrita en la revista Bloomberg BusinessWeek como un “Fight Club para Geeks”, una especie de Club de la Pelea para Data Miners, y que sin duda ha visto crecer su membresía en alrededor de 27.000 nuevos usuarios.
Según reza la historia, Kaggle fue fundada en abril de 2010, cuando un economista australiano decidió aprovechar el impulso luego que ganó, junto con un equipo, una competencia para mejorar los algoritmos de recomendación de películas de Netflix. Así fue como luego, fundó una compañía llamada Kaggle, para ayudar a empresas de cualquier tamaño a ejecutar competencias de Data Mining al estilo Netflix. El modelo es sencillo: el cliente proporciona un conjunto de datos, le dice a Kaggle la pregunta qué quiere responder y cuánto dinero en premios está dispuesto a pagar.
Kaggle organiza los datos de entrada de la competencia en un concurso para que los equipos de Data Miners apliquen sus modelos. Hasta la fecha, hay unas 25.000 usuarios, que han participado en decenas de concursos respaldados por Ford, Deloitte, Microsoft y otras compañías. Incluso hay interés de algunos inversores en poner 11 millones de USD en la compañía en noviembre de este año.
El rápido crecimiento de la empresa se debe principalmente al aumento de la demanda de Silicon Valley de los llamados científicos de datos (a.k.a. Data Miners), que son capaces de extraer conocimiento del negocio y aplicar técnicas de minería de datos a los montones de información. Grandes sitios de internet, como Facebook y Google, utilizan a estos profesionales para refinar los algoritmos de la publicidad. En otros lugares, están ayudando a los retailers a promover sus productos, y en los bancos a detectar el fraude.
Sólo para comentar, el premio más lucrativo en Kaggle es una recompensa de $ 3 millones de USD ofrecidos por Heritage Provider Network al Data Miner que pueda predecir con exactitud qué pacientes serán ingresados en un hospital en el año que viene, mirando sus reclamos de seguro en los datos. Más de 1.000 personas han descargado los datos que cubren cuatro años de visitas al hospital, y tienen hasta abril de 2013 para publicar las respuestas.
El sueño de los dueños de Kaggle es llegar a conseguir que sea tan grande, que algunos participantes puedan renunciar a sus puestos de trabajo. “Estos muchachos deberían ganar tanto como algunos managers de fondos de inversión o jugadores de golf”, afirman. Mientras tanto, en WebMining Consultores Limitada, estamos tomando nota para ver si algún día nos animamos a desarrollar una iniciativa como ésta. Claro está!, necesitariamos el apoyo de algunas empresas chilenas o algún inversionista ángel. Si ud. es uno de ellos, contáctenos, que tenemos muchas ideas!.
Bueno, deseamos mucha suerte a los amigos de Kaggle!, por continuar con iniciativas como éstas e impulsar el desarrollo del área.
Quizás te podría interesar mirar también estos artículos:
- Competencia de Data Mining : Predicción de la calidad de una foto
- Competencia de Data Mining : Previniendo el sobreajuste (overfitting)
- Competencia de Data Mining : Dame algo de Crédito
- Competencia de Data Mining : Desafío Wikipedia
- Competencia de Data Mining : Predicción de Reclamos de Seguros
Escribe una respuesta
Debe estar conectado para escribir un comentario.

