logo

Método Pandas DataFrame corr()

pandas marco de datos.corr() se utiliza para encontrar la correlación por pares de todas las columnas en Pandas Dataframe en Python. Cualquier Yaya Los valores se excluyen automáticamente. Para ignorar cualquier valor no numérico, utilice el parámetro numeric_only = True. En este artículo, aprenderemos sobre el método DataFrame.corr() en Pitón .

Sintaxis del método Pandas DataFrame corr()

Sintaxis: DataFrame.corr(self, método=’pearson’, min_periods=1, numeric_only = False)



Parámetros:

  • método :
    • Pearson: coeficiente de correlación estándar.
    • kendall: coeficiente de correlación de Kendall Tau
    • lancero: correlación de rango de lancero
  • min_periodos: Número mínimo de observaciones necesarias por par de columnas para obtener un resultado válido. Actualmente solo está disponible para la correlación de Pearson y Spearman
  • numeric_only: si solo se van a operar o no los valores numéricos. Está configurado en Falso de forma predeterminada.

Devoluciones: recuento: y: marco de datos

Método corr() de correlaciones de datos de Pandas

Una buena correlación depende del uso, pero es seguro decir que tienes al menos 0,6 (o -0,6) para considerarla una buena correlación. Un ejemplo sencillo para mostrar cómo funciona la correlación en Pitón .



Python3






import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

>

>

Producción

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Creando un marco de datos de muestra

Imprimiendo las primeras 10 filas del Dataframe.

Nota: La correlación de una variable consigo misma es 1. Para obtener un vínculo al archivo CSV utilizado en el código, haga clic en aquí

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

sistema operativo de red
>

>

Producción

Correlaciones de datos de Pandas

Ejemplos del método Python Pandas DataFrame corr()

Encuentre correlación entre las columnas usando el método de Pearson

Aquí, estamos usando la función corr() para encontrar la correlación entre las columnas en el marco de datos usando el método 'Pearson'. Solo tenemos cuatro columnas numéricas en el marco de datos. El marco de datos de salida se puede interpretar como para cualquier celda, la correlación de la variable de fila con la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación de una variable consigo misma es 1. Por esa razón, todos los valores de la diagonal son 1,00.

Python3




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

>

Producción

Correlaciones de datos de Pandas

Encuentre correlación entre las columnas usando el método Kendall

Utilice la función Pandas df.corr() para encontrar la correlación entre las columnas del marco de datos utilizando el método 'kendall'. El marco de datos de salida se puede interpretar como para cualquier celda, la correlación de la variable de fila con la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación de una variable consigo misma es 1. Por esa razón, todos los valores de la diagonal son 1,00.

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

>

>

reemplazar un color en gimp

Producción

marco de datos.corr