Analisis con Tableau

viernes, 23 de septiembre de 2016

Cómo crear una pirámide de población en Tableau

Una pirámide de población es un histograma horizontal que representa la distribución de la población de una región por sexo y edad. Mostrando la población más joven en la parte inferior, y la más anciana en la parte superior y cada género en un sentido (hombres hacia la derecha y mujeres hacia la izquierda o viceversa). Para además hacer el gráfico comparable entre distintos países, normalmente no se representa en cantidades absolutas (número de habitantes) sino en porcentaje respecto al total de población de la región. 


Se trata por tanto de un gráfico muy útil para analizar la estructura de la población de una región determinada. Así, una población en fase de rápido crecimiento tendrá una base muy amplia (elevado porcentaje de jóvenes) y una parte alta de la pirámide estrecha (reducido porcentaje de personas ancianas), mientras que una población envejecida o en fase de envejecimiento tendrá una mayor amplitud en la parte media y alta de la pirámide (mayor porcentaje de población en edades medias y avanzadas que jóvenes). 

¿Cómo construir una pirámide de población en Tableau?

domingo, 18 de septiembre de 2016

Cómo crear small multiples en Tableau

Se llama small multiples a una serie de gráficos del mismo tipo usando un mismo eje, de forma que sean fácilmente comparables, permitiendo así visualizar distintas particiones de una base de datos de un solo vistazo. Resultan por tanto especialmente útiles cuando el principal objetivo es comparar datos entre distintos valores de una categoría. Aquí un ejemplo que cree hace unos días de small multiples utilizando pirámides de población en distintos países de Europa (click en la imagen para abrir el dashboard).


¿Cómo crear small multiples en Tableau?

miércoles, 14 de septiembre de 2016

Novedades en Tableau 10 (II): Filtros a través de distintas bases de datos

Para mi esta es la gran novedad de Tableau 10 y la que más impacto tiene en mi día a día. Antes de Tableau 10, para utilizar un filtro en varias bases de datos al mismo tiempo había que crear un parámetro para que este, a través de un campo calculado en cada una de las bases de datos, actuara como un filtro. El problema es que los parámetros no pueden ser de opcion múltiple por ejemplo, y aunque este método era suficiente en la mayoría de casos, tenía sus limitaciones y llevaba más trabajo.

Ahora no obstante, podemos por fin filtrar con un único filtro distintas bases de datos siempre que haya una relación establecida entre las mismas. Vamos a ver como.

domingo, 28 de agosto de 2016

Novedades en Tableau 10 (I): Análisis cluster (clustering)


Tal vez sea una de las novedades que la comunidad de Tableau esperaba con más ganas después de que se anunciara en una de las últimas conferencias: la posibilidad de realizar un análisis cluster de forma nativa en Tableau sin necesidad de utilizar ninguna aplicación de terceros. Pero ¿en qué consiste un análisis cluster? básicamente se trata de un método de estadística multivariante que clasifica un conjunto de elementos (datos) en un número reducido de grupos (clusters) de forma que los elementos que pertenezcan a un mismo grupo sean muy similares entre sí y diferentes de los elementos de otro grupo.
El método utilizado por Tableau para realizar el análisis cluster es el de k-medias (k-means), validando el número de clusters por medio del índice Calinski-Harabasz. A mayor valor del índice más cohesión existe dentro de un cluster (menos varianza intra-cluster) y más diferenciación entre cada uno de los clusters (mayor varianza inter-cluster). Para los que estén más interesados en conocer los detalles de como realiza Tableau el análisis, podéis consultar este enlace o este otro.

¿Cómo realizar un análisis cluster en Tableau?

miércoles, 17 de agosto de 2016

La visualización como elemento esencial tras el análisis de datos: 11 libros recomendados

Ayer vi un tweet de Gemma Muñoz haciendo referencia a este post suyo con sus libros recomendados sobre analítica y datos. Varios de ellos ya los conocía al menos de oídas y otros han sido un interesante descubrimiento ya que tienen bastante buena pinta. Especialmente porque no es fácil encontrar buenos libros sobre análisis predictivo y análisis de datos.
Por mi experiencia, la mayoría o son muy generales sin aportar demasiado valor (enfocados a lectores que quieren saber "de que va esto") o son tan específicos que tratan sobre cómo utilizar una versión concreta de un software específico (sin tratar de explicar la lógica detrás de un tipo concreto de análisis: por qué, para qué, etc.). De hecho tengo pensando comprar en los próximos dias varios de los libros que Gemma recomienda confiando en que sean tan buenos como parecen.

Tras un par de tweets, Gemma me pidió alguna recomendación mía. Aunque de primeras tuve la tentación de centrar la recomendación en libros de análitica, tras darle un par de vueltas pensé que sería aún más interesante completar la lista con la parte a la que muchas veces damos menos  (o ninguna) importancia tras el análisis de datos: cómo visualizarlos. En un mundo en el que cada vez estamos más expuestos (y acostumbrados a ver) a datos, gráficos y números, cada vez es más importante saber cómo visualizarlos de la mejor forma posible, que tipo de gráfico funciona mejor en cada caso y como facilitar que el usuario reciba el mensaje que queremos transmitir. Así que aquí va mi lista como complemento de la de Gemma.

Primero algunos clásicos de Stephen Few. Para quien no le conozca, Stephen es desde hace muchos años una eminencia en la visualización y comunicación de datos cuantitativos. Sus libros suelen contar con algunos apartados similares, por lo que posiblemente no es necesario leerse todos ellos y con un par será suficiente. Puede que algunas cosas nos parezcan básicas o evidentes. Pero tener claro que tipo de gráfico utilizar según los datos que queramos presentar, como y por qué es algo que debemos plantearnos constantemente, y son cosas de las que por desgracia practicamente nadie se preocupa:

- Signal

En seguno lugar, algunos libros adicionales sobre visualización, con algunas pinceladas de teoría del color o cómo capta información el cerebro. Alguno de ellos no está sólo centrado en la visualización gráfica tradicional, sino que también cubre visualizaciones más infográficas más típicas en el periodismo de datos. Dos de ellos son de Alberto Cairo, uno de los mayores expertos en visualización de información que tenemos en España:


Y en tercer lugar, algunos libros para comenzar, mejorar y dominar la que para mi es la mejor herramienta para visualización de datos y creación de informes dinámicos y dashboards: Tableau. Especialmente por su facilidad de aprendizaje, reducido coste (incluso con versión gratuita aunque más limitada), una amplia comunidad muy involucrada y ofreciendo funcionalidades adicionales en cada versión:


¡A leer!

Ya está aquí Tableau 10



Ayer por fin Tableau lanzó Tableau 10. Posiblemente una de las versiones más esperadas de Tableau y con algunas novedades más que interesantes, entre las que se encuentran:
  1. Filtros aplicables a distintas bases de datos (para mi la gran novedad, que facilitará mucho el trabajo en el día a día evitando tener que realizar la misma función a través de parámetros, con las limitaciones que esto conllevaba).
  2. Análisis cluster incluido de forma nativa.
  3. Buscador de elementos (básicamente se trata de una casilla de búsqueda donde podremos buscar elementos en una visualización. Especialmente útil cuando queremos resaltar un elemento concreto en diagramas de dispersión o visualizaciones con un número elevado de datos)
  4. Personalización de territorios en mapas.
  5. Posibilidad de utilizar grupos en cálculos personalizados.
  6. Unión entre bases de datos.
  7. Conexión con hojas de cálculo de Google.
  8. Modificación integral del formato del libro de trabajo.
  9. Diseño específico según el dispositivo utilizado para la visualización.
  10. Versión de Tableau Mobile para Android.
Para mi estas son las 10 novedades más interesantes. Espero tener tiempo durante las próximas semanas para ir comentando todas ellas una por una.

viernes, 12 de agosto de 2016

Como usar en Tableau datos de latitud y longitud para mapear datos

Una de las funciones que más sorprenden y llaman la atención cuando se empieza a utilizar Tableau es la capacidad de visualizar datos geolocalizados a través de mapas. En muchas ocasiones, Tableau reconoce automáticamente datos numéricos de latitud y longitud automáticamente siendo increiblemente sencillo crear un mapa con nuestros datos.

No obstante, Tableau no siempre reconoce automáticamente una variable como latitud o longitud si no tiene el formato adecuado (numérico) y está etiquetado de forma correcta (latitud y longitud), pero podemos modificar rápidamente las preferencias de dichos campos para que Tableau los utilice como datos que debe tratar como datos geográficos.