Como hacer un diagrama de caja en Excel
Resumen del recurso
Objetivo
Otra forma de caracterizar una distribución o una muestra es a través de un diagrama de caja (también conocido como diagrama de caja y bigotes ). Específicamente, un diagrama de caja proporciona una representación pictórica de las siguientes estadísticas: máximo, percentil 75 , mediana (percentil 50 ) , media, percentil 25 y mínimo.
Los diagramas de caja son especialmente útiles cuando se comparan muestras y se prueba si los datos se distribuyen simétricamente.
Herramienta de análisis de datos de estadísticas reales
Para generar un diagrama de caja, puede usar la opción Diagrama de caja de la herramienta de análisis de datos Estadísticas descriptivas y normalidad que se encuentra en el Paquete de recursos de estadísticas reales, como se describe en el siguiente ejemplo. Consulte también Capacidades de gráficos especiales para saber cómo crear el diagrama de caja manualmente utilizando las capacidades de gráficos de Excel.
Ejemplo 1 : una empresa de investigación de mercado pide a 30 personas que evalúen tres marcas de tabletas mediante un cuestionario. Las 30 personas se dividen al azar en 3 grupos de 10 personas cada uno, donde el primer grupo evalúa la Marca A, el segundo evalúa la Marca B y el tercero evalúa la Marca C. La Figura 1 resume los puntajes del cuestionario de estos grupos.
Figura 1 – Datos de muestra
Para generar los diagramas de caja para estos tres grupos, presione Ctrl-m y seleccione la herramienta de análisis de datos Estadísticas descriptivas y normalidad. Aparecerá un cuadro de diálogo como se muestra en la Figura 4 de Herramientas de estadísticas descriptivas. Seleccione la opción Diagrama de caja e inserte A3:C13 en el Rango de entrada. Marque Encabezados incluidos con los datos y desmarque Usar versión exclusiva del cuartil.
El gráfico resultante se muestra en la Figura 2.
Figura 2 – Diagrama de caja
Salida de gráfico de caja
Tenga en cuenta también que la herramienta de análisis de datos también genera una tabla, que puede estar ubicada detrás del gráfico. Para aquellos que estén interesados, esta tabla contiene la información de la Figura 3, como se explica más detalladamente en Capacidades de gráficos especiales .
Para cada muestra, el diagrama de caja consta de una caja rectangular con una línea que se extiende hacia arriba y otra que se extiende hacia abajo (generalmente llamadas bigotes). La caja en sí está dividida en dos partes. En particular, el significado de cada elemento en el diagrama de caja se describe en la Figura 3.
Elemento | Sentido |
Parte superior del bigote superior | Valor máximo de la muestra |
parte superior de la caja | percentil 75 de la muestra |
Línea a través de la caja | mediana de la muestra |
Fondo de la caja | percentil 25 de la muestra |
Parte inferior del bigote inferior | mínimo de la muestra |
× marcadores | Media de la muestra |
Figura 3 – Elementos del diagrama de caja
Hay dos versiones de esta tabla, dependiendo de si activa o desactiva el campo Usar versión exclusiva del cuartil . Si está marcado, se usa la versión QUARTILE.EXC de los percentiles 25 y 75 (o QUARTILE_EXC para usuarios de Excel 2007), mientras que si este campo no está marcado, se usa la versión QUARTILE.INC (o equivalente, QUARTILE). Consulte Funciones de clasificación en Excel para obtener más detalles sobre la diferencia entre estas dos versiones.
En el diagrama de caja de la Figura 2, podemos ver que las puntuaciones de la Marca C tienden a ser más altas que las de las otras marcas y las de la Marca B tienden a ser más bajas. También vemos que la distribución de la Marca A es bastante simétrica al menos en el rango entre el 1er y el 3er cuartil , aunque hay cierta asimetría para valores más altos (o potencialmente hay un valor atípico). Las marcas B y C parecen menos simétricas. Debido al bigote superior largo (especialmente con respecto a la caja), la marca B puede tener un valor atípico (consulte Valores atípicos y robustez para ver una discusión sobre los valores atípicos).
Otra indicación de simetría es si el marcador × de la media coincide con la mediana.
Representación Alternativa
También podemos convertir el diagrama de caja en una representación horizontal de los datos (como se muestra en la Figura 4) eliminando primero los marcadores de las medias (haciendo clic en cualquiera de estos marcadores y presionando la tecla de retroceso) y luego haciendo clic en el gráfico y seleccionando Insertar > Gráficos|Barra > Barra apilada .
Figura 4 – Diagrama de caja horizontal
Diagrama de caja con valores de datos negativos
Cuando un conjunto de datos tiene uno o más valores negativos, el eje y se desplazará hacia arriba en la cantidad de -MIN(R1). Aquí, R1 es el rango de datos que contiene los datos. Por lo tanto, si R1 oscila entre -10 y 20, el rango en el gráfico oscilará entre 0 y 30.
Ejemplo 2 : Cree el diagrama de caja para los datos en la Figura 5.9.1 donde la celda B11 se cambia a -300 y la versión exclusiva de la función de cuartil.
El procedimiento es el mismo que para el Ejemplo 1, excepto que esta vez marcamos la opción Usar versión exclusiva del cuartil . La salida se muestra en la Figura 5.
La diferencia clave es que dado que el valor de datos más pequeño es -300 (el valor en la celda F13), todos los valores del gráfico de caja se desplazan hacia arriba en 300. Esto es evidente al notar que la cola inferior para la Marca B está en 0 en lugar de – 300 (y esa celda G6 contiene 0 en lugar de -300).
Figura 5 – Diagrama de caja para datos negativos
Tenga en cuenta que se muestran dos ejes y. El de la izquierda se basa en el desplazamiento de 300 unidades, mientras que el de la derecha muestra las unidades correctas.
Eliminando un eje y
Puede eliminar el eje y de la izquierda siguiendo los siguientes pasos:
- Seleccione el eje y a la izquierda y luego haga clic con el botón derecho.
- Elija la opción Format Axis… del menú que aparece.
- Cuando aparezca el menú de opciones como se muestra en la Figura 6, cambie la opción Posición de la etiqueta de Siguiente al eje a Ninguno .
Figura 6: eliminar el eje y izquierdo
Tenga en cuenta que si cambia alguno de los elementos de datos, el gráfico de caja seguirá siendo correcto, aunque el eje y derecho no cambiará y seguirá reflejando los datos originales, por lo que deberá confiar en el eje y izquierdo ( puede quitar el eje y derecho como se describe arriba para el eje y izquierdo).
Más información sobre diagramas de caja
Consulte Diagramas de caja con valores atípicos para ver cómo generar diagramas de caja en Excel que también muestran explícitamente los valores atípicos. Se describen las dos versiones siguientes:
- Una capacidad de gráficos de Excel que está disponible para las versiones de Excel a partir de Excel 2016
- Una versión extendida de la herramienta de análisis de datos Real Statistics descrita anteriormente. Esta herramienta está disponible incluso para versiones de Excel anteriores a Excel 2016.
Consulte Capacidades de gráficos especiales para saber cómo crear un diagrama de caja manualmente, utilizando solo las capacidades de gráficos de Excel.
Recurso que puede ser de tu interés: Plantilla de diagrama de caja y bigote en Excel
Referencia
Wikipedia (2012) Diagrama de caja
https://en.wikipedia.org/wiki/Box_plot