logo

Formas de filtrar Pandas DataFrame por valores de columna

Filtrar un DataFrame de Pandas mediante valores de columna es una operación común cuando se ejecuta información en Python. Puede utilizar varios métodos y técnicas para lograrlo. Aquí hay numerosas formas de filtrar un Pandas DataFrame a través de valores de columna.

En esta publicación, veremos diferentes formas de filtrar Pandas Dataframe por valores de columna. Primero, creemos un marco de datos:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Producción:

Marco de datos

Seleccionar filas de Pandas Dataframe en función del valor de una columna particular usando el operador '>', '=', '=', '<=', '!='.

Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que el 'Porcentaje' es mayor que 75 usando [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Producción:

marco de datos de salida

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que el 'Porcentaje' es mayor que 70 usando lugar[ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Producción:

marco de datos de salida-1

Seleccionar aquellas filas de Pandas Dataframe cuyo valor de columna está presente en la lista usando tú() método del marco de datos.

Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que 'Stream' está presente en la lista de opciones usando [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Producción:

marco de datos de salida-2

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que 'Stream' está presente en la lista de opciones usando lugar[ ] .

Pitón




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Producción:

marco de datos de salida-3

Seleccionar filas de Pandas Dataframe en función de las condiciones de varias columnas utilizando el operador '&'.

Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que 'Edad' es igual a 22 y 'Transmisión' está presente en la lista de opciones usando [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Producción:

marco de datos de salida-4

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que 'Edad' es igual a 22 y 'Transmisión' está presente en la lista de opciones usando lugar[ ] .

Python3




java para tipos de bucle

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Producción:

marco de datos de salida-5