pandas marco de datos.corr() se utiliza para encontrar la correlación por pares de todas las columnas en Pandas Dataframe en Python. Cualquier Yaya Los valores se excluyen automáticamente. Para ignorar cualquier valor no numérico, utilice el parámetro numeric_only = True. En este artículo, aprenderemos sobre el método DataFrame.corr() en Pitón .
Sintaxis del método Pandas DataFrame corr()
Sintaxis: DataFrame.corr(self, método=’pearson’, min_periods=1, numeric_only = False)
Parámetros:
- método :
- Pearson: coeficiente de correlación estándar.
- kendall: coeficiente de correlación de Kendall Tau
- lancero: correlación de rango de lancero
- min_periodos: Número mínimo de observaciones necesarias por par de columnas para obtener un resultado válido. Actualmente solo está disponible para la correlación de Pearson y Spearman
- numeric_only: si solo se van a operar o no los valores numéricos. Está configurado en Falso de forma predeterminada.
Devoluciones: recuento: y: marco de datos
Método corr() de correlaciones de datos de Pandas
Una buena correlación depende del uso, pero es seguro decir que tienes al menos 0,6 (o -0,6) para considerarla una buena correlación. Un ejemplo sencillo para mostrar cómo funciona la correlación en Pitón .
Python3
import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())> |
>
>
Producción
Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>
Creando un marco de datos de muestra
Imprimiendo las primeras 10 filas del Dataframe.
Nota: La correlación de una variable consigo misma es 1. Para obtener un vínculo al archivo CSV utilizado en el código, haga clic en aquí
Python3
# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]> |
sistema operativo de red
>
>
Producción

Ejemplos del método Python Pandas DataFrame corr()
Encuentre correlación entre las columnas usando el método de Pearson
Aquí, estamos usando la función corr() para encontrar la correlación entre las columnas en el marco de datos usando el método 'Pearson'. Solo tenemos cuatro columnas numéricas en el marco de datos. El marco de datos de salida se puede interpretar como para cualquier celda, la correlación de la variable de fila con la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación de una variable consigo misma es 1. Por esa razón, todos los valores de la diagonal son 1,00.
Python3
# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)> |
>
>
Producción

Encuentre correlación entre las columnas usando el método Kendall
Utilice la función Pandas df.corr() para encontrar la correlación entre las columnas del marco de datos utilizando el método 'kendall'. El marco de datos de salida se puede interpretar como para cualquier celda, la correlación de la variable de fila con la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación de una variable consigo misma es 1. Por esa razón, todos los valores de la diagonal son 1,00.
Python3
# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)> |
>
>
reemplazar un color en gimp
Producción
