Cada gráfico trata de contar una historia sobre los datos, pero a menudo surgen problemas para tratar de contar esa historia. En ocasiones el gráfico está incompleto, otras veces es engañoso y frecuentemente es confuso o simplemente incorrecto.
En este post, te damos algunos consejos para lograr un acertado mapeo de datos en tus visualizaciones.
Primer Pilar: Los atributos de los datos
Antes de desarrollar un gráfico, ¿has considerado con qué tipo de datos estás trabajando?
Datos cuantitativos
-Ratio (costo $10, $20, $30 o edad 10 años, 20 años, 30 años)
Datos sobre los que se pueden realizar operaciones aritméticas (agregar, dividir, etc.)
-Intervalos (temperatura -5 °, 10°, 25° u hora 1 a.m., 5 a.m., 9 a.m.)
Datos con un valor establecido sobre los que no pueden realizar todas las operaciones aritméticas
Datos cualitativos
-Ordinal (tamaño pequeño, mediano, grande o posición 1er lugar, 2do lugar, 3er lugar)
Datos con una clasificación fija con una distancia indeterminada entre los valores
-Nominal (deportes, fútbol americano de la NFL vs. fútbol inglés o Notebook frente a PC de escritorio)
Datos donde se puede distinguir entre valores, pero no ordenarlos
Con base en estas clasificaciones, los métodos de agregación y visualización de datos deben ajustarse en consecuencia.
Por ejemplo para mapear los datos de cantidad de autos fabricados, teniendo las cifras de fabricación año a año, tiene sentido hacerlo siguiendo el orden de los años y no por el valor más alto de unidades fabricadas. En general, lo ideal es que los datos ordinales se clasifiquen por orden en el eje X.
Algunos usos a tener en cuenta:
Segundo Pilar: Codificación Visual
Ya hemos identificado un proceso para determinar qué tipo de datos tenés y el eje para asignarlos. Ahora tenemos que encontrar la mejor manera de mostrar visualmente los datos usando colores, formas, tamaños y posición.
Según la investigación sobre la percepción gráfica publicada en 1984 por William S. Cleveland y Robert McGill todos tienen diferentes percepciones de las visualizaciones, pero hay algunos pasos simples que todos podemos seguir basados en qué marcador visual es más o menos preciso.
Estas son opciones básicas de visualización:
Por ejemplo, si observamos ejemplos de datos de relación, la diferencia entre puntos de datos es el más preciso.
El orden de precisión de estos marcadores según el artículo de Cleveland y McGill es el siguiente:
- Posición a lo largo de una escala común
- Posición a lo largo de escalas no alineadas
- Longitud, dirección, ángulo
- Area
- Volumen, curvatura
- Sombreado, saturación del color
En este caso, la posición es el marcador más preciso seguido de la longitud y el ángulo, lo que tiene sentido si está mapeando datos como costo, edad, años. Si se tratase de mapear esos ejemplos usando color, ¿cómo determinarías el valor del color verde oscuro si te dijera que el verde claro representa $ 1,000?
Son muchos los factores a considerar pero acá van algunos buenos consejos:
-Para datos nominales: Ningún valor es más importante que el siguiente. Mientras que la posición es la mejor opción, los círculos y cuadrados pueden ser útiles para mostrar sus datos.
-Para datos ordinales: como se trata de asignar datos con una clasificación inherente, los tonos claros y oscuros del sombreado enfatizarán aún más la importancia de los datos.
-Para datos de intervalo / relación: se busca mapear valores numéricos, por lo tanto, la mejor manera de medir esos valores es a través de posición o longitud.
Tercer Pilar: Uso
El último paso del proceso de visualización de datos tiene que ver con su uso y responde a la pregunta ¿Qué querés ver en tus datos?
Cada vez que asignamos datos a una visualización, la cuestión clave a tener en cuenta es: ¿qué se está tratando de mostrar al usuario?
Lo que buscamos es desarrollar un gráfico que demuestre valor y logre su propósito de una manera fácilmente reconocible.
En la guía de visualización de Qlik podrás ver cuales son los gráficos más adecuados para realizar comparaciones, para identificar y comparar partes de un total, para distribuir una variable entre otras y para relacionar datos. ¡No dejés de bajarla!