Text Mining con RapidMiner

En WebMining Consultores creemos que la mejor forma de aprender es haciendo. Por lo que inaguramos nuestro primer video tutorial para mostrar el uso de herramientas y técnicas de Data Mining.

En este primer video tutorial veremos un proyecto de text mining básico utilizando la herramienta RapidMiner para crear un listado de stop-words o palabras vacías, que utilizaremos en un próximo proyecto, que también mostraremos en un próximo tutorial, claro está.

Este tutorial requiere el uso del componente Text Processing de RapidMiner y los operadores Read Document, Process Documents y Tokenize.

Más abajo encontrarás el link con el archivo de entrada y el resultado que utilizamos en este proyecto. Ojalá sea de utilidad y esperamos sus comentarios más abajo. Saludos!

Archivos utilizados:

Actualización 09-Mar-2012 : Dadas las consultas, se actualizó el video tutorial a uno de mejor resolución. Recomendamos utilizar la resolución 720 HD y ampliar el video a pantalla completa para una mejor visualización. Que lo disfruten!.

Comments ( 19 )

  1. / Viviana
    Buenas Noches! Me encanto el video, esta muy bien explicado, es el primer video en español que encontré en la web de text mining usando rapidminer, les comento que estoy haciendo mi trabajo final de grado, que consiste en el uso de text mining con rapidminer, usando los títulos bibliográficos de la biblioteca de la facultad y los contenidos de las carreras, me ha sido de mucha ayuda su video, como para entender un poco mas cuales son lo operadores necesarios para procesar los textos, les agradecería si pudiesen mandarme información sobre text mining o algún otro video mas complejo haciendo uso de rapideminer. Desde ya muchas gracias. Viviana Villafañe
    • / WebMining Consultores
      Hola. Gracias Viviana por tus comentarios, nos animan a continuar! La próxima semana publicaremos un par de videos más complejos sobre Text Mining usando RapidMiner...así que estate atenta. Saludos.
  2. / Juanjo Torres
    Hola. Soy profesor en la Universidad Complutense de Madrid. En l actualidad estoy impartinedo un curso de Minería de datos y me gustaría enseñar a mis alumnos el uso de rapidminer y especialmente la minería de textos y minería web. Muchas gracias por este primer tutorial. Espero ansioso el próximo. Entretanto podeis indicarme algun sitio donde pueda ver algún tutorial , aunque sea escrito, sobre text mining con rapidminer. Otra vez, muchas gracias
    • / WebMining Consultores
      Gracias por su comentario!. Estamos editando los nuevos tutoriales, con un poco de paciencia, ya estarán disponibles. Puede encontrar más tutoriales en el sitio de RapidMiner. Saludos.
  3. / Felipe
    Hola Buen aporte gracias, espero que muy pronto publiques el segundo tutorial. no se si depronto me puedes compartir mas información sobre Minera de Textos, ya que he encontrado pocos ejemplos practicos Gracias desde Colombia
  4. / recuatico
    Muy buen video, quedamos a la espera de uno nuevo del mismo rapid miner relacionado con clustering y segmentación.
  5. / Juan
    Bueno quería felicitarlos!! muy buen vídeo tutorial. En la actualidad estoy trabajando en mi tesis de grado en minería de texto con rapidminer y otros aspectos relacionados con la minería de texto. La verdad es que no hay mucha información respecto al tema salvo algunos vídeos tutoriales en ingles que están en un foro determinado. Les agradecería mucho que si ustedes tienen mas información a cerca del tema me la la enviasen por favor, de preferencia en lo relacionado con minería de texto con rapidminer. Felicidades nuevamente!!.. sigan así..
    • / WebMining Consultores
      Gracias Juan. Esperamos pronto poder sacar otro videotutorial. Estamos con mucho trabajo :) Saludos! WebMining Consultores Limitada
  6. / mgag2b
    Podrían publicar el video en formato de texto, pdf, word o como presentación ???  No logro verlo nitidamente. Por cierto alguna idea para tesis de grado en este campo ??? Me gustaría ser el primero en mi universidad en presentar un proyecto en este tema. Saludos y a la espera de más tutoriales.
  7. / juan3_140
    DEMASIADO BNO ESTE VIDEO EXPLICAN PASO A PASO TODO, TENGO UNA PREGUNTA Q QUISIERA Q ME AYUDARAN Y ES COMO PUEDO IMPLEMENTAR EN RAPIDMINER CON EL PLUGIN TEXT PROCESSING EL ALGORITMO LEVENSHTEIN YA Q NECESITO COMPARAR NOMBRES DE PERSONAS PARA SABER EN CUANTAS TABLAS DE DIFERENTES BASES DE DATOS EXISTEN Y OBTENER UNA INFORMACION MAS PRECISA
    • / WebMining Consultores
      En general en RapidMiner lo que se hace es calcular el score TF-IDF de un término dentro de un documento. Esto indica lo importante que es el término en relación al documento en que se encuentra, en comparación con la importancia que el mismo término tiene en el resto de los documentos. Luego se calcula la distancia entre los documentos, basado en el indicador TF-IDF como medida de similitud. Ahora si tu estás tratando de calcular la distancia entre dos términos y no documentos, entonces deberias usar la distancia de Levenshtein, que creo, (todavía) no está implementada en RapidMiner. Entonces debes usar alguna de estas implementaciones en otros lenguajes. Saludos! WebMining Consultores Limitada
  8. / juan
    MUCHAS GRACIAS WEBMINING CONSULTORES LIMITADA POR LA RESPUESTA, HACIENDO UNA BUSQUEDA SOBRE LO QUE VENIA PREGUNTADO ENCONTRE ESTA PAGINA PERO NO SE SI PODRIA SER AYUDA PARA APLICAR LEVENSHTEIN EN RAPIDMINER http://rapid-i.com/api/rapidminer-5.1/com/rapidminer/tools/math/similarity/nominal/LevenshteinDistance.html SI LA PUDIERAN CONSULTAR SERIA DE GRAN AYUDA. GRACIAS POR LA ATENCION
    • / WebMining Consultores
      Gracias Juan. Conocemos el link y se refiere a la clase java que implementa la distancia de Levenshtein. Cuando decimos que no está implementada en Rapidminer, queremos decir que no está implementada como operador ni como método de cálculo dentro de un operador. Por lo tanto, hay que programar la implementación, cosa que aún no está hecha como te señalamos en la respuesta anterior. Saludos! WebMining Consultores Limitada
  9. / juan
    MUCHAS GRACIAS POR LA INFORMACION. AGREGO QUE EL VIDEO ES DE GRAN AYUDA. PORQUE NO HAN VUELTO A MONTAR MAS DOCUMENTACION DE RAPIDMINER???
  10. / Ivan
    El vídeo ya no está disponible. ¿Tenéis pensado volver a subirlo o proporcionar la información por otro medio? Me interesa mucho saber cómo hacer una lista de palabras vacías con Rapid Miner y no encuentro ninguna otra fuente de información alternativa. Gracias.
  11. / carlosqb
    Muy claro el instructor, los felicito, ¿y cuando se viene el segundo video? quedamos con el archivo resultado... Espero que pronto suban mas videos de rapidminer excelente web de información y capacitación.   Saludos Carlos Quezada

Leave a reply