OBTENGA VALORES ÚNICOS DE UNA COLUMNA EN PANDAS DATAFRAME

La función única() elimina todos los valores duplicados en una columna y devuelve un valor único para varios valores iguales. En este artículo, discutiremos cómo podemos obtener valores únicos de una columna en Marco de datos de Pandas .

Crear un marco de datos de Pandas con elementos duplicados

Cree un marco de datos de Pandas de muestra con un diccionario de listas, digamos que los nombres de las columnas son A, B, C, D y E con elementos duplicados.

matriz de cadenas programación c

Python3

# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

A continuación se muestran algunos ejemplos mediante los cuales podemos obtener los valores únicos de una columna en este marco de datos.

Obtenga los valores únicos de la columna 'B'
Obtenga los valores únicos de la columna 'E'
Obtener el número de valores únicos en una columna
Usando set() para eliminar valores duplicados de una columna
Usando los métodos pandas.concat() y Unique()
Usando Series.drop_duplicates()

Obtenga los valores únicos de la columna 'B'

En este ejemplo, estamos recuperando e imprimiendo los valores únicos de la columna 'B' usando el unique()> método. Los valores únicos resultantes son['B1', 'B2', 'B3', 'B4']>.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

jtextfield

Producción

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Obtenga los valores únicos de los pandas en la columna 'E'

En este ejemplo, creamos un DataFrame de pandas a partir de un diccionario y luego recuperamos los valores únicos de la columna 'E' usando elunique()>método. Los valores únicos resultantes son['E1']>.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

Producción

array(['E1'], dtype=object)>

Obtener el número de valores únicos en una columna

En este ejemplo, creamos un DataFrame de pandas a partir de un diccionario y luego calculamos e imprimimos el número de valores únicos en la columna 'C', excluyendo los valores NaN. El resultado es 3, lo que indica que hay tres valores únicos en la columna 'C'.

bash si declaración

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

Producción

3>

Eliminar valores duplicados de una columna usando set()

En este ejemplo, creamos un DataFrame de pandas a partir de un diccionario y luego usamos el set()>función para extraer valores únicos de la columna 'C', eliminando duplicados. El conjunto resultante,{'C1', 'C2', 'C3'}>, representa los valores únicos en la columna 'C'.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

Producción

{'C1', 'C2', 'C3'}>

Usando los métodos pandas.concat() y Unique()

En este ejemplo, creamos un DataFrame de pandas a partir de un diccionario y luego concatenamos valores únicos de todas las columnas usando pd.concat()> . La matriz NumPy resultante, cuando se imprime, muestra todos los valores únicos de las columnas 'A' a 'E'.

cómo saber si alguien te bloqueó en android

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

Producción

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Usando Series.drop_duplicates()

En este ejemplo, creamos un DataFrame de pandas a partir de un diccionario y eliminamos duplicados de las columnas 'A' y 'D' usando el drop_duplicates()>método . El DataFrame resultante, cuando se imprime, muestra los valores únicos en las columnas 'A' y 'D', con valores NaN donde se eliminaron duplicados de 'D'.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

reemplazar todo en cadena java

Producción

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>