Filtrar un DataFrame de Pandas mediante valores de columna es una operación común cuando se ejecuta información en Python. Puede utilizar varios métodos y técnicas para lograrlo. Aquí hay numerosas formas de filtrar un Pandas DataFrame a través de valores de columna.
En esta publicación, veremos diferentes formas de filtrar Pandas Dataframe por valores de columna. Primero, creemos un marco de datos:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe :
'>, dataframe)> |
>
>
Producción:

Seleccionar filas de Pandas Dataframe en función del valor de una columna particular usando el operador '>', '=', '=', '<=', '!='.
Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que el 'Porcentaje' es mayor que 75 usando [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>, rslt_df)> |
>
>
Producción:

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que el 'Porcentaje' es mayor que 70 usando lugar[ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Producción:

Seleccionar aquellas filas de Pandas Dataframe cuyo valor de columna está presente en la lista usando tú() método del marco de datos.
Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que 'Stream' está presente en la lista de opciones usando [ ] .
Python3
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Producción:

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que 'Stream' está presente en la lista de opciones usando lugar[ ] .
Pitón
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Producción:

Seleccionar filas de Pandas Dataframe en función de las condiciones de varias columnas utilizando el operador '&'.
Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que 'Edad' es igual a 22 y 'Transmisión' está presente en la lista de opciones usando [ ] .
Python3
options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Producción:

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que 'Edad' es igual a 22 y 'Transmisión' está presente en la lista de opciones usando lugar[ ] .
Python3
java para tipos de bucle
options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Producción:
