En este artículo, discutiremos cómo podemos crear un trama de conteo usando la biblioteca seaborn y cómo se pueden usar los diferentes parámetros para inferir resultados a partir de las características de nuestro conjunto de datos.
Biblioteca Seaborn
La biblioteca seaborn es ampliamente utilizada entre los analistas de datos, la galaxia de gráficos que contiene proporciona la mejor representación posible de nuestros datos.
La biblioteca seaborn se puede importar a nuestro entorno de trabajo usando:
import seaborn as sns
Analicemos ahora por qué utilizamos el diagrama de conteo y cuál es el significado de sus parámetros.
Trama de conteo
El gráfico de conteo se utiliza para representar la ocurrencia (recuentos) de la observación presente en la variable categórica.
Utiliza el concepto de gráfico de barras para la representación visual.
Parámetros-
Los siguientes parámetros se especifican cuando creamos un gráfico de conteo, tengamos una breve idea de ellos:
Veamos ahora cuáles son las diferentes formas de representar nuestros atributos.
En el primer ejemplo, crearemos un diagrama de conteo para una sola variable. Hemos tomado los 'consejos' del conjunto de datos para implementar lo mismo.
1. El valor cuenta para una sola variable
Ejemplo -
mapa hash
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show()
Producción:
En el siguiente ejemplo, usaremos el parámetro de tono y crearemos un gráfico de conteo.
El siguiente programa ilustra lo mismo:
2. Representar dos variables categóricas utilizando el parámetro de tono
Ejemplo -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show()
Producción:
En el siguiente ejemplo, consideraremos el eje y y crearemos un gráfico de conteo horizontal.
El siguiente programa ilustra lo mismo:
3. Creando Parcelas Horizontales
Ejemplo -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show()
Producción:
tabla ascii java
Veamos ahora cómo las paletas de colores pueden mejorar la presentación de nuestros datos.
En el siguiente ejemplo, usaremos el parámetro 'paleta'.
El siguiente programa ilustra lo mismo:
4. Usar paletas de colores
Aporte-
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show()
Producción:
En el siguiente ejemplo, usaremos el parámetro color y veremos cómo funciona.
El siguiente programa ilustra lo mismo:
5. Usando un parámetro 'color'
Ejemplo -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show()
Producción:
Ahora usaremos el parámetro 'saturación' y veremos cómo afecta la representación de nuestros datos.
El siguiente programa ilustra lo mismo:
6. Usando el parámetro 'saturación'
Ejemplo -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show()
Producción:
Y finalmente en el último ejemplo usaremos los parámetros ancho de línea y color de borde.
Ejemplo -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show()
Producción: