Monthly archives "Junio"

6 Articles

¿Qué cantidad de datos crearemos en 2011?

Está claro que el mundo está produciendo datos a una velocidad nunca antes vista. Peeero, ¿qué significa esto? ¿Cuánto es 1,8 zetabytes?, que es el número indicado por IDC y EMC para la cantidad de datos que se crearán y replicarán sólo este año!!!. Para ayudarnos a dimensionar la magnitud de esta cifra, Mashable, un [...]

Read more → 49 views

Text Mining: Distancia de Levenshtein

La distancia de Levenshtein es un potente algoritmo que puede ser aplicado para tareas de Text Mining.  Se considera a la distancia de Levenshtein como la generalización de la distancia de Hamming y de la distancia de Damerau-Levenshtein, y determina una medida de “similaridad” o “cercanía” entre dos cadenas de caracteres. Por ejemplo, la distancia [...]

Read more → 4,541 views

10 funciones potentes para Proc SQL

Navegando por Internet, hemos encontrado un interesante blog de análisis de datos usando SAS, de Charlie H., que incluye código, explicaciones, diagramas y gráficos con un gran nivel de detalle. Uno de los artículos que nos pareció interesante destacar, tiene relación con 10 poderosas funciones para el procedimiento Proc SQL de SAS, que como saben, [...]

Read more → 11,224 views