logo

Marco de datos de Pandas.describe()

El método describe() se utiliza para calcular algunos datos estadísticos como percentil, media y enfermedad de transmisión sexual de los valores numéricos de la Serie o DataFrame. Analiza series numéricas y de objetos y también los conjuntos de columnas del DataFrame de tipos de datos mixtos.

Sintaxis

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parámetros

    percentil:Es un parámetro opcional que es un tipo de datos similar a una lista de números que deben estar entre 0 y 1. Su valor predeterminado es [.25, .5, .75], que devuelve los percentiles 25, 50 y 75.incluir:También es un parámetro opcional que incluye la lista de tipos de datos mientras describe el DataFrame. Su valor predeterminado es Ninguno.excluir:También es un parámetro opcional que excluye la lista de tipos de datos al describir DataFrame. Su valor predeterminado es Ninguno.

Devoluciones

Devuelve el resumen estadístico de la Serie y DataFrame.

derivados parciales en látex

Ejemplo 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Producción

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Ejemplo2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Producción

10 de 100.00
 count 4 unique 3 top q freq 2 dtype: object 

Ejemplo3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Producción

 categorical count 3 unique 3 top u freq 1 

Ejemplo4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Producción

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0