Un gráfico de caja es un gráfico que se utiliza para mostrar información en forma de distribución dibujando diagramas de caja para cada uno de ellos. Esta distribución de datos se basa en cinco conjuntos (mínimo, primer cuartil, mediana, tercer cuartil y máximo).
Diagramas de caja en Lenguaje de programación R
Los diagramas de caja se crean en R usando el diagrama de caja() función.
Sintaxis: diagrama de caja (x, datos, muesca, ancho de variable, nombres, principal)
Parámetros:
x: este parámetro se establece como un vector o una fórmula. datos: este parámetro establece el marco de datos. muesca: este parámetro es la etiqueta del eje horizontal. varwidth: este parámetro es un valor lógico. Establezca como verdadero para dibujar el ancho del cuadro en proporción al tamaño de la muestra. principal: este parámetro es el título del gráfico. nombres: este parámetro son las etiquetas de grupo que se mostrarán debajo de cada diagrama de caja.
Creando un conjunto de datos
Para entender cómo podemos crear un diagrama de caja:
- Usamos el conjunto de datos mtcars.
- Miremos las columnas mpg y cyl en mtcars.
R
primavera y primavera mvc
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Producción:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Creando el diagrama de caja
Creando el gráfico Boxplot.
- Tome los parámetros necesarios para hacer un diagrama de caja.
- Ahora dibujamos una gráfica de la relación entre mpg y cil.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Producción:

Diagrama de caja en R
Diagrama de caja usando muesca
Para dibujar un diagrama de caja usando una muesca:
- Con la ayuda de Notch, podemos descubrir cómo coinciden entre sí las medianas de diferentes grupos de datos.
R
mysql crear usuario
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Producción:

Diagrama de caja en R
columna: Utiliza un vector de colores (my_colors) para cambiar el color de relleno de los cuadros.
fronteras: Establece el color de los bordes del cuadro en negro.
muesca: Para ilustrar los intervalos de confianza, se agrega una muesca a los cuadros.
ancho de muesca: Gestiona el ancho de las muescas.
médico: Hace que el color de la línea mediana sea blanco.
batidor: Establece el color de los bigotes en negro con el comando whiskcol.
cajawex: Modifica el ancho de las cajas.
superar : establece las formas de los valores atípicos en círculos sólidos.
resultado: Cambia el color de los valores atípicos a negro.
Diagrama de caja múltiple
Aquí estamos creando múltiples diagramas de caja. Los datos individuales para los que se requiere una representación de diagrama de caja se basan en la función.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
conjunto de hash java
>
Producción:

Múltiples diagramas de caja en R
- En este código, comenzamos enumerando las variables en el vector de variables para las que deseamos hacer diagramas de caja. Agregué mpg, disp, hp y wt en este ejemplo, pero puedes cambiar esta lista para adaptarla a tus necesidades.
- Luego, el diseño del gráfico se crea utilizando la función par y la sintaxis mfrow = c(1, longitud(variables)), que genera una cuadrícula con una fila y tantas columnas como variables haya en el vector de variables.
- Usamos la función boxplot dentro del bucle para generar un diagrama de caja para cada variable. La función get(var) extrae dinámicamente los valores de columna coincidentes del conjunto de datos. Usando la configuración dada, modificamos el aspecto de cada diagrama de caja.