Analicemos cómo eliminar una o varias columnas en Pandas Dataframe. Para eliminar una columna de un Marco de datos de Pandas O eliminar una o varias columnas en un Pandas Dataframe se puede lograr de varias maneras.
Suelte una o varias columnas en Pandas Dataframe
Existen varios métodos para eliminar una o varias columnas en Pandas Dataframe. Estamos analizando algunos métodos de uso general para eliminar una o varias columnas en Pandas Dataframe, que son los siguientes:
- Usando el método df.drop()
- Usando iloc[] Método
- Usando df.ix() método
- Usando df.loc[] Método
- Usando el método iterativo
- Usando Marco de datos.pop() Método
Crear un marco de datos
Primero creamos un marco de datos simple con un diccionario de listas, digamos que los nombres de las columnas son A B C D E . En este artículo, cubriremos 6 métodos diferentes para eliminar algunas columnas de Pandas DataFrame.
Pitón # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df> Producción :
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E2 2 A3 B3 C3 D3 E3 3 A4 B4 C4 D4 E4 4 A5 B5 C5 D5 E5>
Columna de caída de marco de datos en Pandas usando el método df.drop()
Ejemplo 1: En este ejemplo, eliminamos columnas individuales específicas como usa el siguiente código pandas para crear un DataFrame a partir de un diccionario y luego elimina la columna 'A' usando eldrop>método conaxis=1>. Sin embargo, es importante tener en cuenta que el DataFrame original ('df') permanece sin cambios a menos que elinplace=True>Se utiliza el parámetro o el resultado se asigna nuevamente a 'df'.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)> Producción :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Ejemplo 2: En este ejemplo, elimine varias columnas específicas, ya que el siguiente código utiliza Pandas para crear un DataFrame a partir de un diccionario y luego elimina las columnas 'C' y 'D' usando eldrop>método conaxis=1>. Sin embargo, tenga en cuenta que el DataFrame original ('df') permanece sin cambios a menos que el resultado se asigne nuevamente oinplace=True>se utiliza. Alternativamente, la misma operación se puede realizar usandodf.drop(columns=['C', 'D'])>.
Pitón
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])> Producción :
A B E 0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>
Ejemplo 3: En este ejemplo, elimine columnas según el índice de columnas, ya que el siguiente código crea un Pandas DataFrame a partir de un diccionario y elimina tres columnas ('A', 'E', 'C') según sus posiciones de índice utilizando el método `drop` con ` eje = 1`. Se muestra el DataFrame modificado y los cambios se realizan en su lugar (`inplace=True`).
Pitón # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df> Producción :
B D 0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>
Columnas desplegables de marco de datos en Pandas usando el método df.iloc[]
En este ejemplo Elimine columnas entre columnas iniciales y finales específicas, ya que el siguiente código utiliza Pandas para crear un DataFrame a partir de un diccionario y luego elimina todas las columnas entre los índices de columna 1 a 3 usando eldrop>método conaxis=1>. Los cambios se realizan en el lugar (inplace=True>) y se muestra el DataFrame modificado.
algoritmo knnPitón
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df> Producción:
A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>
Pandas elimina columnas del marco de datos utilizando el método df.ix()
En este ejemplo Elimine columnas entre nombres de columnas específicos como el siguiente código, usando Pandas, crea un DataFrame a partir de un diccionario y elimina todas las columnas entre los nombres de columna 'B' a 'D' usando eldrop>método conaxis=1>. Sin embargo, el DataFrame original ('df') permanece sin cambios a menos que el resultado se asigne nuevamente oinplace=True>se utiliza.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)> Producción :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Pandas elimina columnas del marco de datos utilizando el método df.loc[]
En este ejemplo, elimine columnas entre nombres de columnas específicos como usos del siguiente código pandas para crear un DataFrame a partir de un diccionario y luego elimina todas las columnas entre los nombres de columna 'B' y 'D' usando eldrop>método conaxis=1>. El DataFrame modificado no se vuelve a asignar a ninguna variable y el DataFrame original permanece sin cambios.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)> Producción :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Nota: Loc() e iloc() diferentes son iloc() que excluyen el elemento de rango de la última columna.
Pandas elimina columnas de Datafram utilizando el método iterativo
En este ejemplo, elimine columnas entre nombres de columnas específicos, ya que el siguiente código crea un Pandas DataFrame a partir de un diccionario e itera a través de sus columnas. Para cada columna, si la letra 'A' está presente en el nombre de la columna, esa columna se elimina del DataFrame. Se muestra el DataFrame modificado resultante.
Pitón # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df> Producción :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Columna de caída de marco de datos en Pandas usando el método Dataframe.pop()
En este ejemplo, Eliminación de una columna específica de un DataFrame, el código demuestra cómo eliminar una columna específica ('B') de un DataFrame de Pandas creado a partir de un diccionario. Utiliza el pop> método y se muestra el DataFrame modificado resultante.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df> Producción:
A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>