Marco de datos de Pandas Es una estructura de datos etiquetada bidimensional como una tabla con filas y columnas. El tamaño y los valores del DataFrame son mutables, es decir, se pueden modificar.
DataFrame se utiliza principalmente en análisis y manipulación de datos. Le permite almacenar datos en forma tabular, como una base de datos SQL, MS Excel o Google Sheets, lo que facilita la realización de operaciones aritméticas con los datos.
Es el objeto Pandas más utilizado. El Función de marco de datos () se utiliza para crear un DataFrame en Pandas. También puedes crear Pandas DataFrame de varias formas.
Sintaxis de Pandas Dataframe()
pandas.DataFrame(datos, índice, columnas)
obtener la fecha actual en java
Parámetros:
- datos : Es un conjunto de datos a partir del cual se creará un DataFrame. Puede ser una lista, un diccionario, un valor escalar, una serie y una matriz, etc.
- índice : Es opcional, de forma predeterminada el índice del DataFrame comienza desde 0 y termina en el último valor de datos (n-1). Define explícitamente la etiqueta de la fila.
- columnas : Este parámetro se utiliza para proporcionar nombres de columnas en el DataFrame. Si el nombre de la columna no está definido de forma predeterminada, tomará un valor de 0 a n-1.
Devoluciones:
- Objeto de marco de datos
Ahora que hemos hablado sobre la función DataFrame(), veamos diferentes formas de crear un DataFrame:
Diferentes formas de crear marcos de datos en Python
Hay varias maneras de crear un Marco de datos de Pandas en Pitón . Puede crear un DataFrame con los siguientes métodos:
- Cree Pandas DataFrame usando la función DataFrame()
- Crear Pandas DataFrame a partir de una lista de listas
- Cree Pandas DataFrame desde el diccionario de ndarray/list
- Cree Pandas DataFrame a partir de la lista de diccionarios
- Crear Pandas DataFrame a partir de un diccionario de series
- Creando DataFrame usando la función zip()
- Crear un DataFrame demostrando explícitamente la etiqueta de índice
Cree un marco de datos vacío usando el método DataFrame()
DataFrame en Python se puede crear mediante la función DataFrame() del Biblioteca de pandas . Simplemente llame a la función con el constructor DataFrame para crear un DataFrame.
Ejemplo : Crear un DataFrame vacío usando la función DataFrame() en Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Producción:
Empty DataFrame Columns: [] Index: []>
Crear DataFrame a partir de listas de listas
Para crear un Pandas DataFrame desde un lista de listas, puede utilizar la función pd.DataFrame(). Esta función toma una lista de listas como entrada y crea un DataFrame con la misma cantidad de filas y columnas que la lista de entrada.
Ejemplo : Crear DataFrame a partir de listas de listas usando el método DataFrame()
Python3
alfabeto por numero
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Producción:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Crear marco de datos a partir del diccionario de ndArray/Lists
Para crear un DataFrame desde un diccionario de rayos ndar /lists, todas las matrices deben tener la misma longitud. Si se pasa un índice, entonces la longitud del índice debe ser igual a la longitud de las matrices.
Si no se pasa ningún índice, de forma predeterminada, el índice será rango (n), donde n es la longitud de la matriz.
Ejemplo : Creación de DataFrame a partir de un diccionario de ndarray/lists
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Producción:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Nota: Al crear un DataFrame usando un diccionario, las claves del diccionario serán nombres de columnas de forma predeterminada. También podemos proporcionar nombres de columnas explícitamente utilizando el parámetro de columna.
Crear marco de datos a partir de la lista de diccionarios
Pandas DataFrame se puede crear pasando listas de diccionarios como datos de entrada. De forma predeterminada, las claves del diccionario se tomarán como columnas.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Producción:
a b c 0 1 2 3 1 10 20 30>
Otro ejemplo es crear un Pandas DataFrame pasando listas de diccionarios y índices de fila .
lista de clasificación java
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Producción:
b c a first 2 3 NaN second 20 30 10.0>
Crear DataFrame a partir de un diccionario de series
Para crear un DataFrame a partir de un diccionario de serie , se puede pasar un diccionario para formar un DataFrame. El índice resultante es la unión de todas las series de pasados indexados.
Ejemplo: Creando un DataFrame a partir de un diccionario de series.
Python3
polimorfismo
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Producción:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Crear DataFrame usando la función zip()
Se pueden fusionar dos listas utilizando el función zip() . Ahora, cree el Pandas DataFrame llamando a la función pd.DataFrame().
Ejemplo: Creando DataFrame usando la función zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Producción:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Cree un DataFrame demostrando explícitamente la etiqueta de índice
Para crear un DataFrame proporcionando la etiqueta de índice explícitamente, puede utilizar el parámetro de índice del constructor pd.DataFrame(). El parámetro de índice toma una lista de etiquetas de índice como entrada, y el DataFrame usará estas etiquetas para las filas del DataFrame.
Ejemplo: Crear un DataFrame demostrando explícitamente la etiqueta de índice
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
javafx en eclipse
>
Producción:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Conclusión
Python Pandas DataFrame es similar a una tabla con filas y columnas. Es una estructura de datos bidimensional y es muy útil para el análisis y manipulación de datos.
En este tutorial, analizamos varias formas de crear un Pandas DataFrame. Con este tutorial, podrá manejar cualquier requisito complejo de creación de DataFrame.