<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>WebMining</title>
	<atom:link href="http://www.webmining.cl/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.webmining.cl</link>
	<description>Powering Web Intelligence</description>
	<lastBuildDate>Tue, 14 Feb 2012 14:42:30 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
		<item>
		<title>Cuadrante Mágico para Plataformas de Business Intelligence (2012)</title>
		<link>http://www.webmining.cl/2012/02/cuadrante-magico-para-plataformas-de-business-intelligence/</link>
		<comments>http://www.webmining.cl/2012/02/cuadrante-magico-para-plataformas-de-business-intelligence/#comments</comments>
		<pubDate>Sun, 12 Feb 2012 17:24:44 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[2012]]></category>
		<category><![CDATA[Business Intelligence Platforms]]></category>
		<category><![CDATA[Cuadrante Mágico]]></category>
		<category><![CDATA[Gartner]]></category>
		<category><![CDATA[Magic Quadrant]]></category>
		<category><![CDATA[Plataformas de Business Intelligence]]></category>
		<category><![CDATA[Tendencias]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1709</guid>
		<description><![CDATA[Al igual como vimos el año pasado, el Magic Quadrant for Business Intelligence Platforms (Cuadrante Mágico para las plataformas de Business Intelligence) de Gartner para este año 2012, identifica que el principal objetivo de las plataformas de BI es la presentación de información y señala un creciente interés por las funcionalidades analíticas por parte de [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.webmining.cl/2011/05/cuadrante-magico-plataformas-business-intelligence/"><img class="size-full wp-image-1714 alignright" title="mc2012" src="http://www.webmining.cl/wp-content/uploads/2012/02/mc2012.png" alt="" width="195" height="200" />Al igual como vimos el año pasado</a>, el <strong>Magic Quadrant for Business Intelligence Platforms</strong> (Cuadrante Mágico para las plataformas de Business Intelligence) de Gartner para este año 2012, identifica que el principal objetivo de las  plataformas de BI es la presentación de información y señala un  creciente interés por las funcionalidades analíticas por parte de  usuarios y fabricantes.</p>
<p>Además de las opiniones de los usuarios &#8211; que va desde personal TI, consultores hasta usuarios de negocios &#8211; Gartner define una plataforma de BI como una plataforma de software que ofrece 14 capacidades que se listan más abajo. Estas capacidades se organizan en tres categorías de funcionalidades: <strong>Integración, Entrega de información y Análisis</strong>. La entrega de información es el foco central de la mayoría de los proyectos de BI de hoy en día, pero se está viendo un interés creciente en las implementaciones de análisis para el descubrimiento de nuevo conocimiento (Modelos Predictivos y Data Mining), y en la integración (por ejemplo con Microsoft Office) para poner en práctica esas ideas.</p>
<p>Las categorías y capacidades que Gartner define son:</p>
<ol>
<li>Integración
<ul>
<li> Infraestructura BI</li>
<li> Manejo de metadata</li>
<li> Herramientas de desarrollo</li>
<li> Colaboración</li>
</ul>
</li>
<li>Entrega de información
<ul>
<li> Reporting</li>
<li> Cuadros de mando</li>
<li> Consultas Ad hoc</li>
<li> Integración con Microsoft Office</li>
<li> Búsqueda basada en BI</li>
<li> Mobile BI</li>
</ul>
</li>
<li>Análisis
<ul>
<li> Procesamiento analítico on-line (OLAP)</li>
<li> Visualización interactiva</li>
<li> Modelos predictivos y Data Mining</li>
<li> Scorecards</li>
</ul>
</li>
</ol>
<p>Dando una rápida mirada, la valoración de las grandes empresas permaneció prácticamente igual, a excepción de una bajada de  Microsoft con respecto a la habilidad de ejecutar sus herramientas.</p>
<div id="attachment_1717" class="wp-caption aligncenter" style="width: 410px"><img class="size-full wp-image-1717" title="Cuadrante Mágico de Gartner para Plataformas de Business Intelligence" src="http://www.webmining.cl/wp-content/uploads/2012/02/mc20121.png" alt="Cuadrante Mágico de Gartner para Plataformas de Business Intelligence" width="400" height="410" /><p class="wp-caption-text">Cuadrante Mágico de Gartner para Plataformas de Business Intelligence (Fuente: Gartner, Feb 2012) </p></div>
<p>Resumiendo:</p>
<ul>
<li><strong>IBM</strong>,  sin variación</li>
<li><strong>Jaspersoft</strong>, se mantiene en su cuadrante, con una bajada similar a Microsoft</li>
<li><strong>MicroStrategy</strong>, aumentó su valoración</li>
<li><strong>Pentaho</strong>, por fin debuta, y lo hace en el cuadrante de jugadores de nicho</li>
<li><strong>QlikView</strong>, mejor reconocimiento de marca</li>
<li><strong>SAP</strong>, se mantiene, y promete un interesante futuro</li>
<li><strong>SAS</strong>, continua como líder en análisis</li>
<li><strong>Tableu</strong>, se mantiene por tercer año en su cuadrante y aumenta su valoració</li>
</ul>
<p>Bueno, les dejamos <a href="http://www.gartner.com/technology/reprints.do?id=1-196VVFJ&amp;ct=120207&amp;st=sb" target="_blank">aquí el reporte</a>, para que lo revisen. Como ya es costumbre,  se presentan las fortalezas, debilidades y áreas de oportunidad de todos  los fabricantes, pero no quisimos extendernos más en esto, aplicando poder de síntesis con el resumen anterior. Ojalá sea de utilidad y posteen sus  comentarios!</p>
<p><em><strong>Link:</strong> <a href="http://www.webmining.cl/wp-content/uploads/2012/02/mqbi2012.pdf">Copia local del reporte en PDF</a></em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/02/cuadrante-magico-para-plataformas-de-business-intelligence/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Competencia de Data Mining : SAS lanza concurso al estilo Moneyball</title>
		<link>http://www.webmining.cl/2012/02/competencia-de-data-mining-sas-lanza-concurso-al-estilo-moneyball/</link>
		<comments>http://www.webmining.cl/2012/02/competencia-de-data-mining-sas-lanza-concurso-al-estilo-moneyball/#comments</comments>
		<pubDate>Wed, 08 Feb 2012 19:21:08 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[Analytics]]></category>
		<category><![CDATA[Challenge]]></category>
		<category><![CDATA[Competencia]]></category>
		<category><![CDATA[Competition]]></category>
		<category><![CDATA[Data Mining Contest]]></category>
		<category><![CDATA[Moneyball]]></category>
		<category><![CDATA[SAS]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1696</guid>
		<description><![CDATA[Si algunos ya vieron la película Moneyball (retitulada &#8220;El juego de la fortuna&#8221;) les contamos que trata de la historia de Billy Beane, un gerente responsable de armar un club de béisbol (Atléticos de Oakland) con un presupuesto limitado, mediante técnicas analíticas e ideas radicales sobre la forma de evaluar el valor de los jugadores [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-1699" style="border: 0pt none; margin-left: 6px; margin-right: 6px;" title="moneyball" src="http://www.webmining.cl/wp-content/uploads/2012/02/moneyball.jpg" alt="" width="200" height="157" />Si algunos ya vieron la película Moneyball (retitulada &#8220;El juego de la fortuna&#8221;) les contamos que trata de la historia de Billy Beane, un gerente responsable de armar un club de béisbol (Atléticos de Oakland) con un presupuesto limitado, mediante técnicas analíticas e ideas radicales sobre la forma de evaluar el valor de los jugadores en base a cálculos estadísticos. La historia cuenta que, en última instancia, los Atléticos ganaron veinte partidos consecutivos, estableciendo un récord en la Liga Americana.</p>
<p>Pues bien, esta historia real ha inspirado a la gente de <a href="http://www.analyticsconosur.com" target="_blank">Analytics Cono Sur</a>, una comunidad de <a href="http://www.sas.com" target="_blank">SAS</a>, a  lanzar una competencia de Data Mining para proponer mejoras para una  entidad del futbol argentino (un club, un  jugador, un manager, un DT u  otro) basado en el análisis  con técnicas de Analytics sobre la base de  los datos suministrados por el  concurso.</p>
<p>La descripción del problema, dice la página de la competencia:</p>
<blockquote><p>Desde SAS te invitamos a que propongas mejoras para una entidad del  futbol argentino (un club, un jugador, un manager, un DT, la misma AFA u  otros) basado en un análisis con técnicas de Analytics sobre la base de  datos suministrados en este concurso y te ganes un fabuloso premio para  un hincha de futbol.</p>
<p>Sobre la base de los datos del concurso deberás realizar algún  estudio, sólo o en equipo de hasta 3 concursantes, utilizando técnicas  de Analytics, con la herramienta que elijas y entregar una propuesta  de valor, mejora o descubrimiento que sirva para cualquier entidad del  futbol local.</p>
<p>Para finalizar se realizará un encuentro donde todos los equipos  dispondrán de 15 min para presentar su propuesta ante el jurado del  concurso, en un encuentro distendido e instructivo, donde se nombrará un  ganador!!</p></blockquote>
<p>y los datos:</p>
<blockquote><p>Los datos del concurso son  datos del Torneo de Apertura 2011  (Fuente:  Gran DT) + Características de jugadores de Equipos Locales de  Primera División (Fuente: Base de Datos PES). El trabajo también puede integrar información de fuentes adicionales  para producir un análisis más potente, rico o valioso. La fuente deberá  ser de público acceso que será fiscalizada por el jurado. Una vez  aceptada por el jurado será válida y se pondrá a disposición de  cualquier otro equipo. <a href="http://www.analyticsconosur.com/pg/file/read/49155/base-de-datos-concurso-moneyball-2012" target="_blank">Acceder a datos</a><a href="http://www.analyticsconosur.com/pg/file/read/49155/base-de-datos-concurso-moneyball-2012">&#8230;</a></p></blockquote>
<p>En tanto que los premios son:</p>
<blockquote><p>Primer premio: 3 entradas en platea para ver un partido de primera división,  nacional B o eliminatorias donde Argentina sea local (sujeto a  disponibilidad) y  3 becas para cursos regulares SAS durante 2012 (sujeto a disponibilidad)</p>
<p>Segundo premio: 3 becas para cursos regulares de SAS Argentina a dictarse en 2012 (sujeto a disponibilidad)</p>
<p><strong>Notar que los premios no incluyen viajes ni traslados.</strong></p></blockquote>
<p>Las fechas claves:</p>
<blockquote><p>Lanzamiento Concurso: 1 Febrero 2012<br />
Fecha máxima para inscripción: 29 de Febrero 2012 (no implica entregar el trabajo sino sólo registración al concurso)<br />
Fecha máxima de presentación de trabajo: 15 de marzo 2012<br />
Fecha de presentación ante jurado y anuncio ganador: 29 marzo 2012 (a confirmar)</p></blockquote>
<p>Haz <a href="http://www.analyticsconosur.com/pg/news/view/49214/ya-arranc-concurso-moneyball-en-el-futbol-argentino" target="_blank">clic aquí</a> para más detalles del concurso y les deseamos muy buena suerte a los participantes! (<em>NdR: si alguien de Chile compite, por favor, <a href="http://www.webmining.cl/contacto/">contáctenos</a></em>)</p>
<p>Más abajo, les dejamos el trailer de la película para que se inspiren los competidores!. Suerte!<br />
<iframe title="YouTube video player" class="youtube-player" type="text/html" width="425" height="344" src="http://www.youtube.com/embed/ou-bhZM7eBo" frameborder="0" allowFullScreen="true"> </iframe></p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/02/competencia-de-data-mining-sas-lanza-concurso-al-estilo-moneyball/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Modelamiento por Uplift</title>
		<link>http://www.webmining.cl/2012/02/modelamiento-por-uplift/</link>
		<comments>http://www.webmining.cl/2012/02/modelamiento-por-uplift/#comments</comments>
		<pubDate>Wed, 08 Feb 2012 03:05:34 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Data Mining]]></category>
		<category><![CDATA[WM Labs]]></category>
		<category><![CDATA[incremental modelling]]></category>
		<category><![CDATA[lift]]></category>
		<category><![CDATA[modelamiento]]></category>
		<category><![CDATA[modelos de respuesta]]></category>
		<category><![CDATA[net modelling]]></category>
		<category><![CDATA[propensión]]></category>
		<category><![CDATA[response models]]></category>
		<category><![CDATA[true lift modelling]]></category>
		<category><![CDATA[uplift modelling]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=347</guid>
		<description><![CDATA[El Modelamiento por Uplift o Uplift Modelling, también conocido como incremental modelling, true lift modelling o net modelling, es una técnica de Minería de Datos que modela directamente el impacto incremental de una acción, generalmente de marketing, sobre el comportamiento de un individuo.  En otras palabras, es un modelo predictivo basado en el Lift, que [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignright size-full wp-image-1666" style="border: 0pt none; margin-left: 5px; margin-right: 5px;" title="uplift-segm-front" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segm-front.jpg" alt="" width="150" height="145" />El <strong>Modelamiento por Uplift</strong> o <strong><a href="http://en.wikipedia.org/wiki/Uplift_modelling" target="_blank">Uplift Modelling</a></strong>, también conocido como <strong>incremental modelling</strong>, <strong>true lift modelling</strong> o <strong>net modelling</strong>, es una técnica de Minería de Datos que modela directamente el impacto incremental de una acción, generalmente de marketing, sobre el comportamiento de un individuo.  En otras palabras, es un modelo predictivo basado en el <strong><a href="http://en.wikipedia.org/wiki/Lift_%28data_mining%29" target="_blank">Lift</a></strong>, que busca predecir la respuesta incremental de un cliente frente a una determinada acción.</p>
<p>Generalmente esta técnica se utitliza en empresas de servicios financieros, telecomunicaciones y retail para aumentar las ventas nuevas, las ventas cruzadas, disminuir la pérdida de clientes y  realizar actividades de retención. Pero veamos un poco más de qué se trata esta técnica y cómo se cruza con la metodología tradicional del marketing de bases de datos. Antes de continuar con los detalles, si ud. quiere aplicar uplift modelling en su empresa, <a href="http://www.webmining.cl/contacto">contáctenos</a>.</p>
<h3>Midiendo el uplift</h3>
<p>Frecuentemente lo que se busca con los llamados modelos de respuesta o modelos de propensión es identificar a los prospectos que más probablemente responderán en forma positiva a una campaña en la que se les ofrece algún producto o servicio. Al focalizar estas campañas en los prospectos más atractivos se podría <span style="text-decoration: line-through;">teóricamente</span> incrementar las ganancias, es decir, el <a href="http://en.wikipedia.org/wiki/Return_on_Investment" target="_blank">ROI</a> de la campaña. Esto se aplica para cualquier tipo de campaña (de adquisición, cross-selling o retención).</p>
<p>Para efectos de simplificar nuestro ejemplo, de ahora en adelante, supondremos que estamos hablando de una campaña de adquisición de clientes.</p>
<p><a href="http://scientificmarketer.com/2007/09/uplift-modelling-faq.html" target="_blank">El uplift de la campaña de marketing se define generalmente</a> como la <em>diferencia</em> entre la tasa de respuesta de un <em>grupo experimental</em> de clientes y un <em>grupo de control aleatorio</em>. El grupo experimental es quien recibe el &#8220;tratamiento&#8221;, es decir, la campaña de marketing, mientras que el grupo de control no es contactado.  Lo anterior permitirá aislar el efecto de la acción de marketing y medir la efectividad de la acción individualmente.</p>
<blockquote><p>grupo experimental = recibe el &#8220;tratamiento&#8221; o campaña</p>
<p>grupo de control = no la recibe</p></blockquote>
<p>Para ilustrar lo anterior, supongamos la campaña de marketing hipotética que se muestra en la siguiente tabla, el número de respuestas y la tasa de respuesta calculada para cada grupo. De la diferencia entre el grupo experimental y el de control, obtenemos que la campaña tiene un uplift de la tasa de respuesta de un 7% (12%-5%), es decir, se han generado 77.500 respuestas adicionales (90.000 &#8211; 12.500).</p>
<table style="border: 1px solid #b0c4de; width: 321px; height: 92px;" border="1" align="center">
<tbody>
<tr style="background-color: #f5f5f5;">
<td style="border: 1px solid #b0c4de; background-color: #ffffff; text-align: center;"><strong>Grupo</strong></td>
<td style="border: 1px solid #b0c4de; background-color: #ffffff; text-align: center;"><strong>Número de clientes</strong></td>
<td style="border: 1px solid #b0c4de; background-color: #ffffff; text-align: center;"><strong>Respuestas</strong></td>
<td style="border: 1px solid #b0c4de; background-color: #ffffff; text-align: center;"><strong>Tasa de respuesta</strong></td>
</tr>
<tr style="text-align: right;">
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">Experimental</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">750.000</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">90.000</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">12%</td>
</tr>
<tr>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">Control</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">250.000</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">12.500</td>
<td style="border: 1px solid #b0c4de; text-align: right; background-color: #ffffff;">5%</td>
</tr>
</tbody>
</table>
<h3>Modelamiento tradicional</h3>
<p>El modelamiento  tradicional suele tomar al grupo de clientes experimental e intenta construir un modelo predictivo que separa a los clientes que más probablemente responden, de los que no responden. Normalmente esto se realiza utilizando alguna técnica de Minería de Datos  como un modelo de regresión, un árbol de decisión, una red neuronal u otro. El problema de este enfoque es que estos modelos sólo utilizan clientes contactados para construir el modelo. ¿Qué pasa si no se contactan o no responden positivamente?.</p>
<h3>Modelamiento por uplift</h3>
<p>A  diferencia del anterior, el modelamiento por uplift, utiliza tanto a los clientes  tratados  por la acción de marketing (grupo experimental) y a los de control (grupo de control), para construir un modelo predictivo que se centra  en la  respuesta gradual. Para  entender este tipo de modelo se propone <del></del>que existe una segmentación  fundamental que separa a los clientes en  alguno de los cuatro grupos siguientes:</p>
<p style="text-align: center;"><img class="aligncenter size-full wp-image-1671" title="uplift-segmfund" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmfund.jpg" alt="" width="286" height="223" /></p>
<ol>
<li><strong>Los influenciables</strong><em> </em><strong>:</strong> clientes que responden positivamente a la acción de marketing y compran el producto/servicio. Este segmento es también conocido como &#8220;the persuadables&#8221; en inglés.</li>
<li><strong>Los seguros</strong><strong>: </strong>clientes sobre los cuales la acción de marketing <span style="text-decoration: underline;">no tiene ninguna influencia</span>, ya que de todas maneras <span style="text-decoration: underline;">si comprarán el producto/servicio</span>. También conocidos como &#8220;the sure things&#8221;.</li>
<li><strong>Los resistentes:</strong> clientes sobre los cuales la acción de marketing <span style="text-decoration: underline;">no tiene ninguna influencia</span> y aunque se les contacte, <span style="text-decoration: underline;">no comprarán el producto/servicio</span>. Este segmento se conoce como &#8220;the lost causes&#8221;.</li>
<li><strong>Los no-molestar:</strong> clientes sobre los cuales la acción de marketing tiene un <span style="text-decoration: underline;">influencia negativa</span>, disminuyendo incluso su propensión a comprar. Este segmento se conoce como &#8220;the do not disturb&#8221;,  los &#8220;sleeping dogs&#8221; y también algunos les llaman los &#8220;boomerangs&#8221;.</li>
</ol>
<p>Como puede apreciarse de esta segmentación fundamental, <strong>el único</strong> segmento que proporciona una verdadera respuesta incremental es el segmento de <em>los influenciables</em>. Es decir, estos clientes son los únicos que tienen un impacto positivo en el marketing y comprarán el producto/servicio si reciben el tratamiento. Por lo tanto, si queremos maximizar el efecto de una campaña, debemos focalizarnos en dicho segmento y descartar el resto. Es inútil gastar dinero en los otros segmentos ya que el contacto no serviría para estimularlos a una compra, más aún, en el caso de los <em>no-molestar</em>, podría tener un efecto exactamente contrario y provocar la deserción del cliente.</p>
<p>Es así como el modelamiento por uplift ofrece una técnica de scoring o puntuación que permite separar a  los clientes en los grupos anteriormente descritos, ordenándolos, por ejemplo, en base a una mayor probabilidad o propensión de compra para el segmento de los <em>influenciables</em>, una menor probabilidad al segmento de los<em> seguros</em> y <em>resistentes</em>, y finalmente la probabilidad mínima de comprar, al segmento de los <em>no molestar</em>.  De esta forma, obtendríamos una curva de ganancia como la de la siguiente figura y sería sencillo determinar un valor de corte que seleccione exitosamente a quiénes debemos contactar (es decir a los <em>influenciables</em>), maximizando así las ganancias reales.</p>
<p><img class="aligncenter size-full wp-image-1663" title="uplift-gan" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-gan.jpg" alt="" width="527" height="359" /></p>
<p>Notar que lo que sucede con el modelamiento tradicional es que a menudo apunta al segmento de los <em>seguros</em>, ya que no puede distinguirlos del segmento de <em>los influenciables</em>, como sí lo hace el modelamiento por uplift. El modelo tradicional estaría incluyendo el incremento natural de las ventas, que está dado por las compras que realizaría dicho segmento si es contactado. Por su parte, el modelamiento por uplift se centra en la respuesta incremental, y generalmente obtendrá mejores efectividades cuando se aplica a la generación de demanda o a las campañas de retención.  Por ejemplo, apuntando sólo a clientes <em>influenciables </em>en campañas de marketing outbound los costos por contacto disminuyen y el retorno por contactado puede aumentar considerablemente. Otro beneficio del uso del modelamiento por uplift es la eliminación de los efectos negativos en las campañas de retención, por ejemplo, en los sectores de telecomunicaciones y servicios financieros, las campañas de retención gatillan que el cliente cancele el contrato o la póliza. El modelamiento por uplift permite que estos clientes, los <em>no molestar</em>, sean retirados de la campaña previamente.</p>
<p>Volviendo a los gráficos, podemos representar los segmentos de clientes en términos de su probabilidad de compra si son contactados o no. En el siguiente gráfico el eje horizontal X muestra la probabilidad de compra si el cliente no recibe tratamiento, mientras que el eje vertical Y muestra la probabilidad correspondiente si se le contacta. Un cliente que es absolutamente resistente a la campaña se encuentran a lo largo del centro de la franja blanca (la &#8220;diagonal principal&#8221;). Cuanto más positiva sea la acción de marketing más afectará la probabilidad de compra del cliente, y más hacia la parte superior izquierda se encontrará en el gráfico. Por el contrario, si la acción en realidad reduce la probabilidad de compra, se encontrará más hacia la esquina inferior derecha.</p>
<p><img class="aligncenter size-full wp-image-1681" title="uplift-segmpbb" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmpbb.jpg" alt="" width="331" height="284" /></p>
<p>Del mismo gráfico se desprende que el segmento de <em>influenciables</em> tiene una mayor probabilidad de  compra si es contactado que si no lo es, de allí su ubicación en la parte superior izquierda. Los<em> no molestar</em> ocupan el sitio opuesto, es decir, tienen mayor probabilidad de compra si no son contactados. Los<em> seguros</em> tienen alta probabilidad de compra, se los contacte o no. Mientras que los <em>resistentes</em> tienen baja probabilidad de compra, también si se los contacte o no.  Este gráfico es una idealización, ya que estamos excluyendo la densidad  de cada segmento. Una mayor densidad de los grupos <em>influenciables</em> y <em>no  molestar</em> puede cambiar considerablemente la situación que describimos.</p>
<p><img class="aligncenter size-full wp-image-1685" title="uplift-segmuplift" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmuplift.jpg" alt="" width="331" height="284" /></p>
<p>El punto clave de todo esto es que los  ingresos de la campaña son proporcionales a la distancia de la &#8220;diagonal principal&#8221; (que representa el uplift, el impacto incremental o lift neto, son todos sinónimos). La distancia diagonal desde la esquina inferior derecha hacia la esquina superior izquierda cuantifica el impacto positivo incremental (ventas adicionales generadas), mientras que la distancia por debajo y a la derecha representa los efectos negativos (destrucción de las ventas incrementales). Por lo tanto, mientras más se concentre un modelo en el segmento de los <em>influenciables</em>, mayor será su impacto incremental. Es decir, la efectividad de una campaña estará directamente relacionada con la concentración de los <em>influenciables</em> versus el resto de los segmentos en la muestra seleccionada.</p>
<h3>El Problema de los Modelos de Penetración</h3>
<p>Los modelos de penetración simplemente miran el porcentaje de clientes que compran un producto/servicio sin ningún tipo de estimulación en particular. En otras palabras, éstos modelan la probabilidad de compra sin necesidad de contacto (área achurada). En estos modelos, la práctica habitual es apuntar a todos los clientes con una &#8220;propensión&#8221; por encima de cierto límite o umbral, es decir, todos los clientes al lado derecho de la línea vertical en el gráfico.</p>
<p><img class="aligncenter size-full wp-image-1688" title="uplift-segmuplift-1" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmuplift-1.jpg" alt="" width="331" height="284" /></p>
<p>Como muestra el gráfico, el problema con los modelos de penetración es que tienden a dirigirse a todos los <em>no molestar</em>, es decir, los ahuyentan del negocio, así como también se desgastan en contactar a los <em>seguros</em>, que iban a comprar de todos modos. Tal vez, lo más sorprendente, es que ni siquiera se dirigiren a todos los <em>influenciables</em>. Esto se debe a que los modelos de penetración se basan en una muestrade clientes sin tratamiento y no tienen absolutamente ninguna información sobre lo que sucedería si se estimula a estos clientes.  Es evidente que si nuestro objetivo es maximizar el rendimiento de una campaña de marketing directo, la última cosa que queremos hacer es fijarnos un objetivo sobre la base de un modelo de penetración.</p>
<h3>El Problema de los Modelos de Respuesta</h3>
<p>Dado que los modelos de penetración no parecen estar haciendo lo que queremos, ¿qué hay de los modelos tradicionales de respuesta?. La diferencia entre un modelo de penetración y un modelo de respuesta es que el primero se basa en una población no tratada, y el último, está construído sobre una población tratada. Suponiendo , una vez más, que un cierto valor umbral se tomó para la probabilidad de compra si es contactado, el impacto del modelo de respuesta se muestra en el siguiente gráfico.</p>
<p><img class="aligncenter size-full wp-image-1689" title="uplift-segmuplift-2" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmuplift-2.jpg" alt="" width="331" height="284" /></p>
<p>La buena noticia es que la &#8220;respuesta&#8221; del modelo hace algo más cerca de lo que queremos, sin dejar de ser lo ideal. En el lado positivo, que capta todos los <em>influenciables</em> cuya probabilidad de compra se incrementa significativamente por nuestra acción de marketing. El lado menos positivo, es que también se dirige a todos los <em>seguros</em> (que habrían comprado de todos modos) y a una buena proporción de los <em>no molestar</em>, para los que nuestros esfuerzos son contraproducentes.</p>
<h3>Conclusión: Modelamiento por Uplift</h3>
<p>El problema con los modelos de penetración y los modelos de respuesta es que desvian nuestros esfuerzos de marketing. Si nuestro objetivo es maximizar el aumento incremental de las ventas , nos gustaría apuntar a los <em>influenciables</em> y a nadie más. Las técnicas tradicionales construyen un modelo predictivo a partir de una muestra de clientes contactados que intenta separar los clientes propensos a comprar de los que no lo serían. Estas técnicas solo utilizan muestras de clientes previamente contactados. Este hecho ya sesga nuestra evaluación de efectividad.</p>
<p><img class="aligncenter size-full wp-image-1690" title="uplift-segmuplift-3" src="http://www.webmining.cl/wp-content/uploads/2012/02/uplift-segmuplift-3.jpg" alt="" width="331" height="284" /></p>
<p>Como vimos al principio, el uplift de una campaña de marketing se define como la diferencia en la tasa de respuesta entre un grupo “tratado” y un grupo aleatorio de control (pero no el que se toma habitualmente, que ya es un grupo sesgado). Esta medida permite aislar el efecto de una acción de marketing y medir su efectividad. Esta medida, y no la medición tradicional, es una <strong>evaluación honesta</strong> de la efectividad de una campaña de marketing. Un modelo predictivo debe tratar de maximizar la respuesta incremental, no la probabilidad de respuesta. Para esto debe optimizar una medida diferente que la que habitualmente se usa. Y esta medida es precisamente el uplift.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/02/modelamiento-por-uplift/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Kaggle : El &#8220;Fight Club&#8221; para Data Miners</title>
		<link>http://www.webmining.cl/2012/01/kaggle-el-fight-club-para-data-miners/</link>
		<comments>http://www.webmining.cl/2012/01/kaggle-el-fight-club-para-data-miners/#comments</comments>
		<pubDate>Fri, 27 Jan 2012 21:38:11 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Data Mining]]></category>
		<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[Competencia]]></category>
		<category><![CDATA[Competition]]></category>
		<category><![CDATA[Crowdsourcing]]></category>
		<category><![CDATA[Data Miner]]></category>
		<category><![CDATA[Fight Club]]></category>
		<category><![CDATA[Kaggle]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1629</guid>
		<description><![CDATA[Kaggle, la plataforma de Competencias de Data Mining que venimos siguiendo hace un tiempo, fue recientemente descrita en la revista Bloomberg BusinessWeek como un &#8220;Fight Club para Geeks&#8221;, una especie de Club de la Pelea para Data Miners, y que sin duda ha visto crecer su membresía en alrededor de 27.000 nuevos usuarios. Según reza [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-1635" style="border: 0pt none; margin-left: 6px; margin-right: 6px;" title="kaggle" src="http://www.webmining.cl/wp-content/uploads/2012/01/kaggle.jpg" alt="" width="200" height="200" />Kaggle, <a href="http://www.webmining.cl/?s=kaggle">la plataforma de Competencias de Data Mining que venimos siguiendo hace un tiempo</a>, fue recientemente descrita <a href="http://www.businessweek.com/magazine/kaggles-contests-crunching-numbers-for-fame-and-glory-01042012.html" target="_blank">en la revista Bloomberg BusinessWeek</a> como un <em>&#8220;Fight Club para Geeks&#8221;</em>, una especie de Club de la Pelea para Data Miners, y que sin duda ha visto crecer su membresía en alrededor de 27.000 nuevos usuarios.</p>
<p>Según reza la historia, Kaggle fue fundada en abril de 2010, cuando un economista australiano decidió aprovechar el impulso luego que ganó, junto con un equipo, una competencia para mejorar los algoritmos de recomendación de películas de Netflix. Así fue como luego, fundó una compañía llamada Kaggle, para ayudar a empresas de cualquier tamaño a ejecutar <a href="http://www.kaggle.com/competitions" target="_blank">competencias de Data Mining</a> al estilo Netflix. El modelo es sencillo: el cliente proporciona un conjunto de datos, le dice a Kaggle la pregunta qué quiere responder y cuánto dinero en premios está dispuesto a pagar.</p>
<p>Kaggle organiza los datos de entrada de la competencia en un concurso para que los equipos de Data Miners apliquen sus modelos. Hasta la fecha, hay unas 25.000 usuarios, que han participado en decenas de concursos respaldados por Ford, Deloitte, Microsoft y otras compañías. Incluso hay interés de algunos inversores en poner 11 millones de USD en la compañía en noviembre de este año.</p>
<p>El rápido crecimiento de la empresa se debe principalmente al aumento de la demanda de Silicon Valley de los llamados científicos de datos (a.k.a. Data Miners), que son capaces de extraer conocimiento del negocio y aplicar técnicas de minería de datos a los montones de información. Grandes sitios de internet, como Facebook y Google, utilizan a estos profesionales para refinar los algoritmos de la publicidad. En otros lugares, están ayudando a los retailers a promover sus productos, y en los bancos a detectar el fraude.</p>
<p>Sólo para comentar, el premio más lucrativo en Kaggle es una <a href="http://www.heritagehealthprize.com/c/hhp" target="_blank">recompensa de $ 3 millones de USD ofrecidos por Heritage Provider Network</a> al Data Miner que pueda predecir con exactitud qué pacientes serán ingresados ​​en un hospital en el año que viene, mirando sus reclamos de seguro en los datos. Más de 1.000 personas han descargado los datos que cubren cuatro años de visitas al hospital, y tienen hasta abril de 2013 para publicar las respuestas.</p>
<p>El sueño de los dueños de Kaggle es llegar a conseguir que sea tan grande, que algunos participantes puedan renunciar a sus puestos de trabajo. <em>&#8220;Estos muchachos deberían ganar tanto como algunos managers de fondos de inversión o  jugadores de golf&#8221;</em>, afirman. Mientras tanto, en <em>WebMining Consultores Limitada</em>, estamos tomando nota para ver si algún día nos animamos a desarrollar una iniciativa como ésta. Claro está!, necesitariamos el apoyo de algunas empresas chilenas o algún inversionista ángel. Si ud. es uno de ellos, <a href="http://www.webmining.cl/contacto">contáctenos</a>, que tenemos muchas ideas!.</p>
<p>Bueno, deseamos mucha suerte a los amigos de Kaggle!, por continuar con iniciativas como éstas e impulsar el desarrollo del área.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/kaggle-el-fight-club-para-data-miners/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SAS crece un 12% en 2011</title>
		<link>http://www.webmining.cl/2012/01/sas-crece-un-12-en-2011/</link>
		<comments>http://www.webmining.cl/2012/01/sas-crece-un-12-en-2011/#comments</comments>
		<pubDate>Wed, 25 Jan 2012 19:24:59 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[2011]]></category>
		<category><![CDATA[Analytics]]></category>
		<category><![CDATA[Best companies to work]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Resultados]]></category>
		<category><![CDATA[SAS]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1612</guid>
		<description><![CDATA[A propósito de las 100 mejores compañías para trabajar, SAS Institute ha publicado sus finanzas relativas al ejercicio fiscal del año 2011, en las que ha experimentado un crecimiento global del 12% en su facturación, que a todo esto, ya alcanza los 2.725 mil millones de dólares anuales. La región de Europa, Oriente Medio y [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-1613" title="sas-revenues" src="http://www.webmining.cl/wp-content/uploads/2012/01/sas-revenues.jpg" alt="" width="140" height="140" />A propósito de las <a href="http://money.cnn.com/magazines/fortune/best-companies/2012/full_list/" target="_blank">100 mejores compañías para trabajar</a>, SAS Institute ha publicado sus finanzas relativas al ejercicio fiscal del año 2011, en las que ha experimentado un crecimiento global del 12% en su facturación, que a todo esto, ya alcanza los 2.725 mil millones de dólares anuales.</p>
<p>La  región de Europa, Oriente Medio y África (EMEA) generó un 42% de la  facturación total. En tanto América un 46% y la región Asia-Pacífico un 12%.</p>
<div id="attachment_1618" class="wp-caption aligncenter" style="width: 310px"><img class="size-full wp-image-1618 " title="Ingresos 2011 por región" src="http://www.webmining.cl/wp-content/uploads/2012/01/SAS_revenue_by_region2011.jpg" alt="Ingresos 2011 por región" width="300" height="231" /><p class="wp-caption-text">Ingresos 2011 por región</p></div>
<p>Por  áreas de negocio, <a href="http://www.webmining.cl/2011/08/estudio-de-proveedores-globales-de-soluciones-anti-lavado-de-dinero/">el software para la detección del fraude</a> registró un  crecimiento de tres dígitos, mientras que las soluciones on-demand  crecieron casi un 50%. Por su parte, las soluciones de Analytics y Gestión de la Información hicieron lo propio a dos dígitos, así como lo  hicieron las soluciones de customer intelligence, distribución, riesgos  y gestión de la cadena de suministros.</p>
<p style="text-align: center;">&nbsp;</p>
<div id="attachment_1617" class="wp-caption aligncenter" style="width: 410px"><img class="size-full wp-image-1617" title="Ingresos 2011 por industria" src="http://www.webmining.cl/wp-content/uploads/2012/01/SAS_revenue_by_industry2011.jpg" alt="Ingresos 2011 por industria" width="400" height="266" /><p class="wp-caption-text">Ingresos 2011 por industria</p></div>
<p>Estos datos corroboran el buen momento por el que pasa SAS (<a href="http://www.webmining.cl/2011/10/rumores-de-venta-de-sas/">alejando los rumores de venta?</a>). En 2011 la compañía aumentó su fuerza laboral en un 9,2% al mismo tiempo que reinvirtió un 24% de su facturación en I+D.</p>
<p style="text-align: center;">&nbsp;</p>
<div id="attachment_1616" class="wp-caption aligncenter" style="width: 510px"><img class="size-full wp-image-1616 " title="Ingresos anuales 1976-2011" src="http://www.webmining.cl/wp-content/uploads/2012/01/SAS_revenue2011.jpg" alt="Ingresos anuales 1976-2011" width="500" height="290" /><p class="wp-caption-text">Ingresos anuales 1976-2011</p></div>
<p>Según Jim Goodnight, CEO de SAS:</p>
<blockquote><p>&#8220;La innovación es  lo que ha mantenido SAS cada vez mayor de los últimos 36 años&#8221;. &#8220;No  podemos tener éxito sin la innovación, nuevos productos, ideas y  servicios. Los empleados leales, creativos y saludables son  innovadores&#8221;.</p></blockquote>
<p>Al  hacer públicos estos resultados, la compañía ha querido  también anunciar algunos de los ámbitos en que están trabajando para este nuevo año. Entre las novedades se  encuentra una expansión de la familia de <em>SAS High-Performance Analytics</em> para proporcionar un mayor valor a través de soluciones de negocio  analíticas tanto especializadas en sectores de actividad concretos como  horizontales. También añadirá a <em>SAS Customer Intelligence</em> nuevas versiones de <em>SAS Media Analytics </em>y <em>SAS Marketing Automation</em>. Por otro lado actualizará su software anti-fraude <em>SAS Anti-Money Laundering </em>para luchar mejor contra los delitos económicos. Finalmente aumentará las inversiones en <em>SAS Analytics </em>para abarcar un mayor espectro de análisis predictivos y de textos, forecasting y necesidades de investigación operativa.</p>
<p>Para más detalles, <a href="http://www.sas.com/news/preleases/2011financials.html" target="_blank">ver nota de prensa</a> <em>(NdR: Este post no es auspiciado por SAS <del>, ojalá fuera.</del>)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/sas-crece-un-12-en-2011/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Accenture adquiere Neo Metrics Analytics</title>
		<link>http://www.webmining.cl/2012/01/accenture-adquiere-neo-metrics-analytics/</link>
		<comments>http://www.webmining.cl/2012/01/accenture-adquiere-neo-metrics-analytics/#comments</comments>
		<pubDate>Wed, 25 Jan 2012 15:29:04 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Business Intelligence & Analytics]]></category>
		<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[Accenture]]></category>
		<category><![CDATA[Analytics]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Compañías]]></category>
		<category><![CDATA[Companies]]></category>
		<category><![CDATA[Neo Metrics]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1605</guid>
		<description><![CDATA[Nos enteramos hoy que Accenture y Neo Metrics unen sus capacidades analíticas. De acuerdo a la web de la compañía, Accenture ha movido la ficha en el Business Intelligence &#38; Analytics con la adquisición de la compañía Neo Metrics, basada en Madrid (ambas con negocios en Chile), y que tiene cierto peso específico en el [...]]]></description>
			<content:encoded><![CDATA[<p><img class="size-full wp-image-1608 alignright" title="accenture-neometrics" src="http://www.webmining.cl/wp-content/uploads/2012/01/accenture-neometrics.jpg" alt="" width="200" height="200" />Nos enteramos hoy que <a href="http://www.accenture.com" target="_blank">Accenture</a> y <a href="http://www.neo-metrics.com" target="_blank">Neo Metrics</a> unen sus capacidades analíticas. De acuerdo a la web de la compañía, Accenture ha movido la ficha en el Business Intelligence &amp; Analytics con la adquisición de la compañía  Neo Metrics, basada en Madrid (<strong>ambas con negocios en Chile</strong>), y que tiene cierto peso específico en el  desarrollo de los modelos analíticos predictivos y de optimización, con  grandes clientes en los sectores de telecomunicaciones, utilities y  entidades financieras.</p>
<p>Según versa <a href="http://www.accenture.com/es-es/landing-pages/Pages/neometrics.aspx" target="_blank">la web de entrada a Neometrics</a>:</p>
<blockquote><p><em>Accenture ha llegado al acuerdo de adquisición de Neo Metrics, compañía española líder en el campo de la inteligencia analítica.</em></p>
<p><em>Las fortalezas que aportará Neo Metrics, unidas al conocimiento,  experiencia y alcance global de Accenture, generarán una propuesta de  valor única para ayudar a nuestros clientes a convertirse en  organizaciones de alto rendimiento.</em></p></blockquote>
<p>La operación lleva consigo la incorporación de las capacidades de análisis, desarrollo e investigación de Neo Metrics a la cartera de modelos analíticos de Accenture, que ampliará la capacidad de Accenture para ayudar a sus clientes a predecir y analizar con rapidez el comportamiento de sus consumidores. Como explica Vicente Moreno, presidente de Accenture España:</p>
<blockquote><p><em>La adquisición de Neo Metrics fortalece nuestras soluciones de analytics y complementa el <a title="Centro de Innovación de Analytics. Esto abre una nueva ventana." href="http://www.accenture.com/es-es/Pages/service-analytics-innovation-center-barcelona.aspx" target="_blank">Centro de Innovación de Analytics</a> de  Accenture en Barcelona, un centro que hemos inaugurado hace ahora ocho  meses. Esta operación demuestra una vez más nuestro compromiso con el  mercado español -al que consideramos un núcleo clave para incorporar  modelos analíticos predictivos- además de poner a disposición de  nuestros clientes todas estas capacidades</em></p></blockquote>
<p>La adquisición se encuentra sujeta a los requisitos de cierre habituales  y se espera que la operación se complete en un plazo de 30 días. <a title="Ver Nota de Prensa. Esto abre una nueva ventana." href="http://www.accenture.com/es-es/company/newsroom-spain/Pages/acn-adquiere-neometrics.aspx" target="_blank">Ver Nota de Prensa (24 de enero de 2012).</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/accenture-adquiere-neo-metrics-analytics/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Profesor de Stanford lanza empresa educativa en línea</title>
		<link>http://www.webmining.cl/2012/01/profesor-de-stanford-lanza-empresa-educativa-en-linea/</link>
		<comments>http://www.webmining.cl/2012/01/profesor-de-stanford-lanza-empresa-educativa-en-linea/#comments</comments>
		<pubDate>Tue, 24 Jan 2012 20:13:23 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Data Mining]]></category>
		<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[Clases gratis]]></category>
		<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[ML]]></category>
		<category><![CDATA[Online class]]></category>
		<category><![CDATA[Robotic Car]]></category>
		<category><![CDATA[Search Engine]]></category>
		<category><![CDATA[Stanford]]></category>
		<category><![CDATA[Udacity]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1595</guid>
		<description><![CDATA[Se recuerdan de las clases on-line gratuitas de Stanford del año pasado? Recuerdan los cursos de Machine Learning (ML) y el de Introduction to Artificial Intelligence (AI)?.  Bueno, al parecer Sebastian Thrun , el profesor del segundo curso, renunció a Stanford para lanzar Udacity, una empresa educativa en línea. Udacity ofrece sus primeros dos cursos [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.webmining.cl/2011/08/stanford-lanza-curso-online-gratuito-de-machine-learning/"><img class="alignright size-full wp-image-1597" title="udacity" src="http://www.webmining.cl/wp-content/uploads/2012/01/udacity.jpg" alt="" width="200" height="200" />Se recuerdan de las clases on-line gratuitas de Stanford del año pasado</a>? Recuerdan los cursos de <a href="http://www.ml-class.org" target="_blank">Machine Learning (ML)</a> y el de <a href="https://www.ai-class.com/" target="_blank">Introduction to Artificial Intelligence (AI)</a>?.  Bueno, al parecer Sebastian Thrun , el profesor del segundo curso, renunció a Stanford para lanzar <strong><a href="http://www.udacity.com/" target="_blank">Udacity</a></strong>, una empresa educativa en línea. Udacity ofrece sus primeros dos cursos gratuitos en línea &#8220;<strong><em>CS101: Building a Search Engine</em></strong>&#8221; y &#8220;<strong><em>CS 373: Programming a Robotic Car</em></strong>&#8221; (ver videos más abajo).</p>
<p>De acuerdo a lo que Thrun explica en su propia página:</p>
<blockquote><p><em>Una de las cosas más increíbles que he hecho en mi vida es enseñar a una clase de 160.000 alumnos. En el otoño de 2011, Peter Norvig y yo decidimos ofrecer nuestra clase de &#8220;Introducción a la Inteligencia Artificial&#8221; para el mundo en línea, de forma gratuita.</em></p>
<p><em> Pasamos noches interminables grabandonos en video a nosotros mismos, e interactuando con decenas de miles de estudiantes. Estudiantes voluntarios tradujeron algunas de nuestras clases a más de 40 idiomas, y al final hemos graduado a más de 23.000 estudiantes de 190 países. De hecho, Peter y yo le enseñamos a más estudiantes de IA, que todos los profesores de IA en el mundo.</em></p>
<p><em> Esta única clase tuvo más </em><em>impacto </em><em> educativo que toda mi carrera </em><em>completa</em><em>.</em></p></blockquote>
<p>Thrun dio otros interesantes contrastes entre la clase del mundo real y la en línea. Por ejemplo: hay más estudiantes en línea que gente en el pequeño país de Lituania,  mientras que ningún estudiante Standford ha tenido una puntuación perfecta en el curso, 248 estudiantes en línea han obtenido un puntaje del 100%, es decir, completar las tareas y las preguntas del examen sin una sola respuesta incorrecta.</p>
<p>Thrun incluso agrega:</p>
<blockquote><p><em>Ahora que he visto el verdadero poder de la educación, no hay vuelta atrás. Es como una droga. No voy a ser capaz de enseñar a 200 alumnos de nuevo, en un aula convencional.</em></p></blockquote>
<h3>Los 2 primeros cursos</h3>
<p><strong>CS101: Building a Search Engine (Construyendo un motor de búsqueda) </strong>será enseñado por Dave Evans,  Profesor de la Universidad de Virginia y Sebastian Thrun, no requiere experiencia previa y tiene como objetivo enseñar no sólo &#8220;lo suficiente acerca de la informática que se puede construir un motor de búsqueda como Google o Yahoo&#8221; en tan sólo siete semanas.</p>
<p><iframe title="YouTube video player" class="youtube-player" type="text/html" width="425" height="344" src="http://www.youtube.com/embed/BQHMLD9bwq4" frameborder="0" allowFullScreen="true"> </iframe></p>
<p><strong>CS 373: Programming a Robotic Car (Programando un auto robótico) </strong>será dictado por  Sebastiam Thrun y no requiere conocimientos de programación, pero idealmente si de probabilidades y álgebra lineal. Toda la programación será en <a href="http://es.wikipedia.org/wiki/Python" target="_blank">Python</a>.</p>
<p><iframe title="YouTube video player" class="youtube-player" type="text/html" width="425" height="344" src="http://www.youtube.com/embed/bdCnb0EFAzk" frameborder="0" allowFullScreen="true"> </iframe></p>
<p>Así que <a href="http://www.udacity.com/" target="_blank">a anotarse a los cursos en la web de Udacity</a>. Recuerden que también están los <a href="http://www.webmining.cl/2011/11/stanford-anuncia-mas-cursos-online-gratis-para-enerofebrero-2012/">otros cursos gratuitos de Stanford</a>, que se han retrasado un poco y <strong>parten oficialmente en Febrero 2012</strong>. ¡Buena Suerte y a estudiar!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/profesor-de-stanford-lanza-empresa-educativa-en-linea/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Retención de clientes : Hyundai lidera en la industria automovilística</title>
		<link>http://www.webmining.cl/2012/01/retencion-de-clientes-hyundai-lidera-en-la-industria-automovilistica/</link>
		<comments>http://www.webmining.cl/2012/01/retencion-de-clientes-hyundai-lidera-en-la-industria-automovilistica/#comments</comments>
		<pubDate>Tue, 24 Jan 2012 14:22:16 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[Customer Retention]]></category>
		<category><![CDATA[Hyundai]]></category>
		<category><![CDATA[Retención de Clientes]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1580</guid>
		<description><![CDATA[Un reciente estudio de J.D. Power señaló que, entre los principales manufacturadores de automóviles en EE.UU.,  Hyundai tiene la mejor retención de clientes: una tasa de 64%, mientras que el promedio de la industria es de sólo 49%. Esto significa que sólo la mitad de los propietarios de automóviles en EE.UU. comprará la misma marca [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignright size-full wp-image-1585" title="ccc" src="http://www.webmining.cl/wp-content/uploads/2012/01/ccc.jpg" alt="" width="200" height="148" />Un reciente estudio de <a href="http://www.jdpower.com/news/pressRelease.aspx?ID=2012002" target="_blank">J.D. Power</a> señaló que, entre los principales manufacturadores de automóviles en EE.UU.,  <a href="http://wot.motortrend.com/jd-power-says-hyundai-first-in-customer-retention-jeep-gains-big-157447.html" target="_blank">Hyundai tiene la mejor retención de clientes</a>: una tasa de 64%, mientras que el promedio de la industria es de sólo 49%. Esto significa que sólo la mitad de los propietarios de automóviles en EE.UU. comprará la misma marca para reemplazar su auto actual. Si eso no es una bandera roja para las empresas, no sabemos que será.</p>
<p>Extrapolando a nuestro país, <a href="http://www.anac.cl/index.php?option=com_docman&amp;Itemid=0&amp;task=doc_download&amp;gid=572" target="_blank">según la ANAC</a>, Hyundai vendió en Chile un total de 35.063 vehículos durante el año 2011. Supongamos entonces por un momento que Hyundai tiene la misma tasa de retención de 64% en Chile, lo que equivale a una tasa de pérdida del 36%. Así que cuando estos propietarios busquen su próximo vehículo,12.983 de ellos no serán un Hyundai.</p>
<p>Si fueramos dueños de Hyundai (o de otra marca), lo primero que hariamos sería crear una &#8220;Oficina de Retención de Clientes&#8221;.  Dicha oficina se encargaría de tratar de no perder ninguno de los 35.063 clientes como sea posible. Si esta oficina sólo retuviera el 1% de ellos, generaría alrededor de USD 4.5 Millones más para Hyundai. Tener en cuenta que estamos hablando de la mejor compañía fabricante de automóviles que hay en la retención de clientes en el mundo!.</p>
<p>Ahora bien, mire su propia empresa de automóviles, o su propio negocio. ¿Cuál es su Oficina de Retención de Clientes? ¿Quién tiene la autoridad para hacer la investigación y crear la estrategia para generar ingresos adicionales mediante la reducción de la pérdida de clientes? ¿Quién tiene la capacidad de diseñar y desarrollar de la relación con sus clientes para aumentar la lealtad?.<a href="http://www.webmining.cl/servicios/"> Le recomendamos encontrar un especialista</a> para jactarse de su retención!!</p>
<div id="attachment_1586" class="wp-caption aligncenter" style="width: 220px"><a href="http://www.webmining.cl/wp-content/uploads/2012/01/customer-retention-motor-industry.jpg"><img class="size-medium wp-image-1586" title="Customer Retention Study, J.D. Power and Associates (clic para agrandar)" src="http://www.webmining.cl/wp-content/uploads/2012/01/customer-retention-motor-industry-210x300.jpg" alt="Customer Retention Study, J.D. Power and Associates (clic para agrandar)" width="210" height="300" /></a><p class="wp-caption-text">Customer Retention Study, J.D. Power and Associates</p></div>
<p style="text-align: center;">&nbsp;</p>
<p><em>Link:  <a href="  http://businesscenter.jdpower.com/JDPAContent/CorpComm/News/content/Releases/pdf/2012002-crss.pdf" target="_blank">Hyundai Ranks Highest in Customer Retention among 33 Automotive Brands</a>, <a href="http://www.webmining.cl/wp-content/uploads/2012/01/2012002-crss.pdf">Respaldo local</a></em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/retencion-de-clientes-hyundai-lidera-en-la-industria-automovilistica/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Análisis de Deciles con Qlikview</title>
		<link>http://www.webmining.cl/2012/01/analisis-de-deciles-con-qlikview/</link>
		<comments>http://www.webmining.cl/2012/01/analisis-de-deciles-con-qlikview/#comments</comments>
		<pubDate>Tue, 17 Jan 2012 14:41:08 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[WM Labs]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Código fuente]]></category>
		<category><![CDATA[Cuantil]]></category>
		<category><![CDATA[Decil]]></category>
		<category><![CDATA[Fractil]]></category>
		<category><![CDATA[Fractile]]></category>
		<category><![CDATA[Pareto]]></category>
		<category><![CDATA[Qlikview]]></category>
		<category><![CDATA[Tips & tricks]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1556</guid>
		<description><![CDATA[El Análisis de Deciles es una herramienta de segmentación popular. Mientras que el Análisis de Pareto divide, por ejemplo a un grupo de clientes,  en la conocida curva 80-20, donde el 20% de los clientes origina el 80% de los ingresos o ventas de una compañía, el análisis de deciles lo que hace es dividirlos [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignright size-full wp-image-1571" title="decile-analysis-qv" src="http://www.webmining.cl/wp-content/uploads/2012/01/decile-analysis-qv.jpg" alt="" width="200" height="200" />El Análisis de <a href="http://es.wikipedia.org/wiki/Decil" target="_blank">Deciles</a> es una herramienta de segmentación popular. Mientras que el Análisis de <a href="http://es.wikipedia.org/wiki/Diagrama_de_Pareto" target="_blank">Pareto</a> divide, por ejemplo a un grupo de clientes,  en la conocida <strong>curva 80-20</strong>, donde el 20% de los clientes origina el 80% de los ingresos o ventas de una compañía, el análisis de deciles lo que hace es dividirlos en grupos de igual tamaño al 10%.</p>
<p>La imagen de abajo muestra un ejemplo de un análisis de deciles. Para este ejemplo, tomamos una base de datos con las marcas y modelos de los vehículos motorizados livianos en Chile, <a href="https://www.sii.cl/avalu/tv/liv2011xls.zip" target="_blank">disponible aquí</a>. En dicha base encontraremos todas las marcas y modelos de automóviles que se comercializaron en Chile durante el 2011 (38.090 vehículos livianos) y su <a href="http://www.emol.com/noticias/economia/2011/12/22/518373/sii-publica-pre-tasacion-fiscal-de-vehiculos-para-el-2012-conozca-los-10-autos-mas-caros.html" target="_blank">tasación fiscal</a>.</p>
<p>Utilizando este script, cargaremos la información a Qlikview:</p>
<pre class="brush: vb; title: ; notranslate">
SET ThousandSep='.';
SET DecimalSep=',';
SET MoneyThousandSep='.';
SET MoneyDecimalSep=',';
SET MoneyFormat='$ #.##0,00;-$ #.##0,00';
SET TimeFormat='h:mm:ss';
SET DateFormat='DD-MM-YYYY';
SET TimestampFormat='DD-MM-YYYY h:mm:ss[.fff]';
SET MonthNames='ene;feb;mar;abr;may;jun;jul;ago;sep;oct;nov;dic';
SET DayNames='lun;mar;mié;jue;vie;sáb;dom';

LOAD [Código] as cod, [TASACIÓN 2011] as tas
FROM C:\liv2011.xls (biff, embedded labels);
</pre>
<p>Y obtendremos el siguiente gráfico:</p>
<p><img class="aligncenter size-full wp-image-1558" title="decile-analysis" src="http://www.webmining.cl/wp-content/uploads/2012/01/decile-analysis.jpg" alt="" width="625" height="371" /></p>
<p>Este ejemplo muestra cómo un grupo de 38.090 marcas y modelos de vehículos,  se divide en deciles de alrededor de 3.800 marcas-modelos. Un montón de cosas interesantes que se puede aprender de este análisis son, por ejemplo:</p>
<p>- Los dos primeros deciles, osea el 20% de las marcas-modelos de autos, corresponden a los autos más caros (con mayor tasación fiscal) con el 60.9% de la tasación total de todos los vehículos. Y con una tasación que es significativamente superior a la media ($15.842.983);<br />
- El 30% de las marcas-modelos más caras corresponden al 73.1% de la tasación total de todos los vehículos;<br />
- El último decil aporta con menos del 1% a la tasación total, con una media de $206.893</p>
<p>Así que, <strong>¿cómo podemos crear un análisis de deciles en QlikView?.</strong> Mediante el uso de la <strong>función fractile</strong>!!!. Esta función devuelve el punto de corte para un cuantil o fractil.  Por ejemplo <strong>fractile(tas, 0.25) </strong>devuelve la cantidad de autos que cortan bajo el 25% de la tasación total.</p>
<p>Usando este concepto, podemos crear entonces una dimensión calculada anidada para crear los diez deciles:</p>
<pre class="brush: vb; title: ; notranslate">
=if(valor &lt;= fractile(TOTAL tas, 0.1), 10,
if(valor &lt;= fractile(TOTAL tas, 0.2), 9,
if(valor &lt;= fractile(TOTAL tas, 0.3), 8,
if(valor &lt;= fractile(TOTAL tas, 0.4), 7,
if(valor &lt;= fractile(TOTAL tas, 0.5), 6,
if(valor &lt;= fractile(TOTAL tas, 0.6), 5,
if(valor &lt;= fractile(TOTAL tas, 0.7), 4,
if(valor &lt;= fractile(TOTAL tas, 0.8), 3,
if(valor &lt;= fractile(TOTAL tas, 0.9), 2, 1)))))))))
</pre>
<p>En la expresión anterior, <strong>TOTAL tas</strong> se utiliza porque el percentil debe ser calculado sobre el conjunto de todos los datos, sin tener en cuenta las variables de la dimensión. Así que a probarlo y feliz decileo!!!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/analisis-de-deciles-con-qlikview/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>In Memory Analytics: Cinco factores para estimular la adopción</title>
		<link>http://www.webmining.cl/2012/01/in-memory-analytics-cinco-factores-para-estimular-la-adopcion/</link>
		<comments>http://www.webmining.cl/2012/01/in-memory-analytics-cinco-factores-para-estimular-la-adopcion/#comments</comments>
		<pubDate>Mon, 16 Jan 2012 22:58:36 +0000</pubDate>
		<dc:creator>WebMining Consultores</dc:creator>
				<category><![CDATA[Noticias y Tendencias]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Data bases]]></category>
		<category><![CDATA[Data Warehouse]]></category>
		<category><![CDATA[In-memory]]></category>

		<guid isPermaLink="false">http://www.webmining.cl/?p=1542</guid>
		<description><![CDATA[Las compañías están tratando de explorar nuevos mercados, manteniendo sus actuales clientes. Este esfuerzo ha adquirido una nueva dimensión con la explosión del Biga Data y del Social Media. Con el fin de elaborar estrategias más rápido y acelerar la respuesta en tiempo real (o casi en tiempo real), las capacidades de hacer un  análisis [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-thumbnail wp-image-1551" style="border: 0pt none; margin: 5px;" title="In-Memory" src="http://www.webmining.cl/wp-content/uploads/2012/01/In-Memory-150x150.jpg" alt="" width="150" height="150" />Las compañías están tratando de explorar nuevos mercados, manteniendo sus actuales clientes. Este esfuerzo ha adquirido una nueva dimensión con la explosión del <em>Biga Data</em> y del <em>Social Media</em>. Con el fin de elaborar estrategias más rápido y acelerar la respuesta en tiempo real (o casi en tiempo real), las capacidades de hacer un  análisis rápido se ha convertido en algo crucial. Hay varias opciones para hacer análisis de este tipo: Análisis en Memria (In Memory Analytics), Análisis en bases de datos y aplicaciones  de Data Warehouse.</p>
<p>Mientras las aplicaciones de Data Warehouse tienen  actores maduros como <a href="http://www.netezza.com/" target="_blank">Netezza</a>, <a href="http://www.greenplum.com/" target="_blank">Greenplum</a>, <a href="http://www.kognitio.com">Kognitio</a> y <a href="http://www.vertica.com" target="_blank">Vertica</a>, las otras dos tecnologías son relativamente nuevas, siendo In Memory Analytics la más nueva . Aunque en la análisis en base de datos ha tenido un ritmo acelerado, es una tecnología cara. Por el contrario, el análisis en memoria no es tan caro, y por lo tanto, una de las favoritas para aprovechar los avances en el manejo de memoria adicional de los últimos años.</p>
<p>Según el artículo &#8220;<a href="http://searchbusinessintelligence.techtarget.in/news/2240113106/In-memory-analytics-Six-factors-spurring-adoption" target="_blank"><em>In memory analytics: Six factors spurring adoption</em></a>&#8221; del sitio <em>SearchBusinessIntelligence.in</em> varios son los factores que están impulsando la rápida adopción del In Memory Analytics o Análisis en Memoria, entre ellas:</p>
<ol>
<li><strong>Sistemas operativos de 64 bits.</strong> En la época del 32 bits, como saben, sólo se podía reconocer hasta 4 GB de RAM. Incluso si se ha añadia más chips de memoria no se podía aprovechar esa capacidad adicional. Ahora con los sistemas operativos de 64-bit que se utilizan ampliamente en la actualidad, podemos ir más allá de terabytes (TB) de memoria direccionable, la que utilizada para consulta, es mucho más rápida que el acceso a los datos almacenados en unidades de disco duro .</li>
<li><strong>Asequibilidad.</strong> La memoria RAM se convierte en un espacio de trabajo temporal para el perfeccionamiento del sistema. Cuanto más memoria RAM disponible, más tareas se pueden realizar a la vez, lo que resulta en mejoras en el rendimiento. Anteriormente, una actualización 8 GB de RAM costaba alrededor de US$ 100 a US$ 150, lo que ya está disponible a partir de US$50 a US$70. De esta manera, las empresas pueden crear discos de RAM y responder rápidamente a las altas demandas de análisis en tiempo real.</li>
<li><strong>Análisis en tiempo real</strong>. En los escenarios tradicionales de almacenamiento de datos, debido a las diferentes arquitecturas físicas, la extracción, carga y acceso de datos para consultar toma un largo tiempo. Otro inconveniente es que los datos del Data Warehouse están desactualizados un día (o un par de horas) que los datos disponible en los sistemas operacionales. El análisis en memoría es capaz de eliminar esta latencia y permitir, <span style="text-decoration: underline;">en tiempo real</span>, el uso de información de los operacionales y transaccionales para la toma de decisiones.</li>
<li><strong>Análisis exploratorio rápido.</strong> En este proceso, los usuarios pueden ver todos los datos disponilbes, filtrar los datos necesarios para hacerlos más atractivos, y obtener conocimientos a través de un análisis rápido. Con el análisis en memoria, los usuarios pueden ver los datos completos de una sola vez. También se pueden realizar exploraciones previas para visualizar patrones, tendencias y anomalías que estén ocurriendo, y rápidamente hacer un análisis y determinar acciones a tomar.</li>
<li><strong>Disminición de costo en TI.</strong> Debido a que el movimiento de datos de los Data Warehouse y las bases de datos se reduce, el análisis en memoria puede llevar a una menor dependencia del personal de TI. También se puede simplificar el análisis realizado por las herramientas (como por ejemplo QlikView) que requieren de un dominio experto especial o conocimientos de Minería de Datos. De esta manera, el análisis en memoria hace más fácil que los usuarios de negocio puedan realizar análisis exploratorio por sí mismos en lugar de esperar a que el personal de TI les proporcione los datos requeridos y eventualmente los cuadros de mando, cubos, etc.</li>
</ol>
<p>Finalmente, y de acuerdo a las <a href="http://www.webmining.cl/2012/01/las-predicciones-centrales-para-el-mercado-de-bi-segun-gartner/">predicciones de Gartner para el 2012</a>, la computación en memoria verá el uso generalizado de la memoria flash en dispositivos de consumo, dispositivos de entretenimiento y otros sistemas de TI integrados. A diferencia de la RAM (la memoria de los servidores y PCs), la memoria flash es persistente, incluso si no hay fuente de poder. De esta manera, la memoria flash se parece más a las unidades de disco normales en el sentido de almacenar la información físicamente. Sin embargo, la memoria flash tiene mucho de la velocidad de la memoria RAM y es mucho más rápido que una unidad de disco normal.</p>
<p>Debido al bajo costo &#8211; y baja calidad-  la memoria flash se podría utilizar para minimizar los ciclos críticos de uso de memoria. Los usuarios y proveedores de TI, por lo tanto, deberian mirar al In Memory Analytics como una tendencia tecnológica de largo plazo. Si desea conocer más de esta tecnología, le recomendamos también echar un vistazo a <a href="http://www.webmining.cl/servicios/servicios-analytics/">nuestros servicios de In-Memory Analytics</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.webmining.cl/2012/01/in-memory-analytics-cinco-factores-para-estimular-la-adopcion/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

