CALCULANDO LA PROBABILIDAD DE COMPRA DE UNA CAMIONETA DE LUJO (R VS PYTHON VS EXCEL)

Haciendo algunos análisis en Python y R me encontré con una gráfica muy interesante para datos de probabilidad logística (cada cuanto ocurre un evento). Les dejo abajo las dos graficas tanto en R como Python.

EN R

EN PYTHON

Ambos sistemas utilizan una gráfica de área con mas de 600 puntos para delimitar la probabilidad de que un usuario que recibe una publicidad compre el articulo según su edad y su salario estimado. En ambos casos el sistema calcula las áreas de ocurrencia del evento y delimita un espacio entre los ejes X/Y, para después generar una gráfica de dispersión (scatter) y colocar los puntos predichos por el sistema (tanto los que acierta como los que falla)

Haciendo lo mismo, pero con Excel.

Les dejo el libro descargable aquí para que puedan ver como funciona la grafica y la paso a explicar abajo.

Una vez con nuestra matriz de predicciones y nuestros ejes X1 y X2 escalados, vamos a obtener una segunda matriz que nos diga cuando el evento ocurre y cuando no (0 es no, 1 es sí) por lo que usaremos una vieja técnica de SI y #N/A. La formula queda así.

=SI(E3=0,C3,NOD())

Las nuevas 4 columnas serán nuestros indicadores X, Y para la grafica de dispersión, por lo cual los añadiremos a nuestro gráfico. Adicional, crearemos una línea que corra en los siguientes puntos, misma que nos servirá de división entre los resultados de compra o no compra.

Entonces la gráfica inicialmente tendrá los siguientes parámetros:

Vamos a ajustar los ejes, quitar lineas de division y darle forma a nuestros puntos para que nuestra grafica preeliminar quede así:

Ahora, hagamos un poco de trampa (muajaja). Como no podemos combinar una gráfica de área con los parámetros necesarios, vamos al área del grafico y creemos un relleno degradado como la imagen siguiente.

Veremos transformada nuestra grafica en un mapa de colores rojo y verde y con una línea de división para los valores aciertos y fallidos. Solo le damos un poco de color a nuestros puntos para resaltar y tendremos una gráfica similar a las obtenidas en R y Python.

Una técnica bastante buena para presentar resultados en Excel, sobre todo hablando de probabilidades o datos que están en rangos. El formato en Excel es mas amigable que en los otros sistemas. Pruébala y dime que tal te funciono.

CALCULANDO LA PROBABILIDAD DE COMPRA DE UNA CAMIONETA DE LUJO (R VS PYTHON VS EXCEL)

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Scroll hacia arriba