Analisis con Tableau: Comparar una categoria con el total usando FIXED LOD

jueves, 14 de julio de 2016

Comparar una categoria con el total usando FIXED LOD

Una de las novedades más útiles de las últimas versiones de Tableau, en concreto en al versión 9.0, fue la introducción de las expresiones de nivel de detalle (LOD por sus siglas en inglés). De forma resumida se trata de un tipo de expresiones que permiten realizar cálculos agregados en un nivel de detalle distinto al que tenemos en nuestra visualización.

Escribiré más sobre LOD y ejemplos de como y para que utilizar este tipo de expresiones en futuros posts, pero para empezar veamos un ejemplo lo más sencillo posible, Imaginemos que queremos visualizar el porcentaje de ventas por categoría de producto en una región concreta, y a la vez comparar dicho porcentaje con el porcentaje por categoría del total, de forma que podamos ver si la estructura de ventas de una determinada región es mayor o menor al global. Para realizar este cálculo vamos a utilizar una LOD utilizando el comando FIXED. El cual nos permite definir el nivel de detalle independientemente de la visualización.


1) Vamos a empezar creando una sencilla visualización para ver el total de ventas por subcategoría para el total nacional utilizando la base de datos Superstore Sales disponible con Tableau. Para ello basta con arrastrar la dimensión Subcategoría a filas y la medida Ventas a columnas, hacer click derecho en esta última y elegir Percentage of Total dentro del menú Quick Table Calculation. Obtendremos de este modo un gráfico similar a este, que utilizaremos para asegurarnos que nuestros cálculos posteriores funcionan correctamente y en el que podemos ver que teléfonos y sillas suponen cada uno en torno a un 14% de las ventas totales:


2) Ahora vamos a duplicar esta misma visualización, pero añadiendo la dimensión State en filtros de modo que podamos elegir la distribución de ventas para el Estado que queramos, Colorado por ejemplo. Podemos ver ahora que en Colorado las ventas de sillas suponen casi un 26% del total de ventas y teléfonos un 15% aproximadamente.



3) Pero ¿que ocurre si queremos comparar la distribución de ventas de dicho Estado con las totales? Una posibilidad sería por ejemplo crear un campo calculado que solo sume las ventas de dicho Estado, por ejemplo: if [State]="Colorado" THEN [Sales] ELSE NULL END y compararlo con el total utilizando un gráfico de doble eje, pero en lugar de eso vamos a utilizar una LOD. Para ello vamos a crear un campo calculado que fije las ventas por subcategoría independientemente de lo que tengamos en la visualización. Para ello utilizaremos la expresión:



4) A continuación arrastramos este nuevo campo calculado a la marca Detail de la visualización y hacemos de nuevo click en el botón derecho de dicha píldora para calcular el porcentaje como hicimos en el paso 1).

5) Ahora añadiremos una línea de referencia por celda y especificaremos este nuevo campo como nuestra línea de referencia. Para ello hacemos click en la pestaña de Analytics > Reference Line > Cell, especificando este nuevo campo calculado como nuestro valor a mostrar como línea de referencia. Es importante que no nos olvidemos de incluir dicho campo en la marca Detail de nuestra visualización o no podremos especificarlo como nuestra línea de referencia. Si hemos hecho todo correctamente, tendremos ahora un gráfico similar a este:


En este gráfico contamos ahora con una línea de referencia en cada barra con el porcentaje de ventas a nivel nacional, aunque en la visualización estemos filtrando la barra para el Estado de Colorado. Pasando el ratón por encima de cualquiera de las líneas de referencia podremos comprobar que el porcentaje es el mismo que el habíamos creado en el paso 1). Ahora además podemos ver mucho más claramente que el porcentaje de ventas de sillas en Colorado e mucho mayor que el total a nivel nacional (25% vs 14%)

6) Podemos completar aún más la información para diferenciar mejor aquellas subcategorías con una diferencia en el porcentaje de ventas que queramos destacar. Por ejemplo + ó - 1%. Para ello creamos otro campo calculado con una condición IF y para evitar errores podemos arrastrar directamente las dos medidas que necesitamos de la visualización (el porcentaje de ventas - el porcentaje de ventas LOD) y definir los límites que queramos, por ejemplo:


7) Finalmente arrastramos este nuevo campo a la marca de color, definimos los colores que queramos y ahora tendremos cada subcategoría de un color distinto, dependiento de si las ventas en el Estado que hemos filtrado son un 1% superiores o más a la media nacional (en azul), un 1% inferiores o menos (en rojo) o están entre ese +1% y -1% (en gris).


Ahora resulta mucho más sencillo ver que en Colorado la proporción de ventas de 4 categorías están por encima de la media a nivel nacional y la proporción de ventas de 3 categorías está por debajo. Pudiendo además seleccionar con el filtro el Estado que queramos y actualizando nuestro análisis al instante.

No hay comentarios: