logo

Concatenación de pandas

Pandas es capaz de combinar objetos Series, DataFrame y Panel a través de diferentes tipos de lógica de conjuntos para los índices y la funcionalidad de álgebra relacional.

El concat() La función es responsable de realizar la operación de concatenación a lo largo de un eje en el DataFrame.

Sintaxis:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parámetros:

    objetos:Es una secuencia o mapeo de series u objetos DataFrame.
    Si pasamos un dict en el DataFrame, entonces las claves ordenadas se usarán como argumento de claves, y los valores se seleccionarán en ese caso. Si hay algún no objeto presente, se eliminará a menos que sean ninguno, y en este caso, un Error de valor será levantado.eje:Es un eje para concatenar.unirse:Responsable del manejo de índices en otro eje.unirse_ejes:Una lista de objetos de índice. En lugar de realizar la lógica de conjunto interna o externa, se utilizan índices específicos para el otro eje (n-1).ignorar_índice:bool, valor predeterminado Falso
    No utiliza los valores de índice en el eje de concatenación, si es verdadero. El eje resultante se etiquetará como 0, ..., n - 1.

Devoluciones

Se devuelve una serie cuando concatenamos todas las Series a lo largo del eje (eje=0). En caso de que objetos contiene al menos un DataFrame, devuelve un DataFrame.

sistema operativo de red

Ejemplo 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Producción

 0 p 1 q 0 r 1 s dtype: object 

Ejemplo2: En el ejemplo anterior, podemos restablecer el índice existente usando el índice_ignorar parámetro. El siguiente código demuestra el funcionamiento de índice_ignorar .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Producción

 0 p 1 q 2 r 3 s dtype: object 

Ejemplo 3: Podemos agregar un índice jerárquico en el nivel más externo de los datos usando el llaves parámetro.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Producción

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Ejemplo 4: Podemos etiquetar las claves de índice usando el nombres parámetro. El siguiente código muestra el funcionamiento del parámetro de nombres.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Producción

hacer que el script sea ejecutable
 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Concatenación usando anexar

El método append se define como un atajo útil para concatenar la serie y el marco de datos.

Ejemplo:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Producción

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88