logo

¿Cómo imprimir un Pandas DataFrame completo en Python?

La visualización de datos es la técnica utilizada para brindar información sobre los datos utilizando señales visuales como gráficos, tablas, mapas y muchos otros. Esto es útil ya que ayuda a comprender fácilmente y de forma intuitiva grandes cantidades de datos y, por lo tanto, a tomar mejores decisiones al respecto. Cuando utilizamos una gran cantidad de impresión de un conjunto de datos, se trunca. En este artículo, veremos cómo imprimir el archivo completo. Marco de datos de Pandas o Serie sin Truncamiento.

Imprima un DataFrame de Pandas completo en Python

De forma predeterminada, el marco de datos completo no se imprime si la longitud excede la longitud predeterminada; la salida se trunca como se muestra a continuación:

Python3






import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> # Loading irirs dataset> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> display(df)>

>

>

Producción:

Hay 4 métodos para imprimir todo el dataframe de pandas:

  • Utilice el método to_string()
  • Utilice el método pd.option_context()
  • Utilice el método pd.set_options()
  • Utilice el método pd.to_markdown()

Método 1: usar to_string()

Si bien este método es el más simple de todos, no es recomendable para conjuntos de datos muy grandes (del orden de millones) porque convierte todo el marco de datos en un objeto de cadena, pero funciona muy bien para marcos de datos de tamaño del orden de miles.

Sintaxis: DataFrame.to_string(buf=Ninguno, columnas=Ninguno, col_space=Ninguno, encabezado=Verdadero, índice=Verdadero, na_rep='NaN', formateadores=Ninguno, float_format=Ninguno, index_names=Verdadero, justificar=Ninguno, max_rows=Ninguno, max_cols=Ninguno, show_dimensions=False, decimal='.', line_width=Ninguno)

Ejemplo: En este ejemplo, estamos usando elload_iris>función de scikit-learn para cargar el conjunto de datos de Iris, luego crea un DataFrame de pandas (df>) que contiene las características del conjunto de datos y, finalmente, convierte todo el DataFrame en una representación de cadena usando to_string()> y lo muestra.

Python3




import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Convert the whole dataframe as a string and display> display(df.to_string())>

sincronización de hilos
>

>

Producción:

Método 2: usar pd.option_context()

Pandas permite cambiar la configuración a través del contexto_opción() método y establecer_opción() métodos. Ambos métodos son idénticos con la diferencia de que luego uno cambia la configuración de forma permanente y el primero lo hace sólo dentro del alcance del administrador de contexto.

Sintaxis: pandas.option_context(*argumentos)

Ejemplo: En este ejemplo, estamos utilizando el conjunto de datos Iris de scikit-learn, crea un DataFrame de pandas (df>) con opciones de formato especificadas e imprime el DataFrame dentro de un contexto temporal donde la configuración de visualización, como el máximo de filas, columnas y precisión, se modifica solo para el ámbito local.

Python3




import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # The scope of these changes made to> # pandas settings are local to with statement.> with pd.option_context(>'display.max_rows'>,>None>,> >'display.max_columns'>,>None>,> >'display.precision'>,>3>,> >):> >print>(df)>

>

>

Producción:

Método 3: usar pd.set_option()

Este método es similar al método pd.option_context() y toma los mismos parámetros que los discutidos para el método 2, pero a diferencia de pd.option_context() su El alcance y el efecto se encuentran en todo el script, es decir, todas las configuraciones de los marcos de datos se cambian permanentemente.

Para restablecer explícitamente el uso del valor pd.reset_option('todos') Se debe utilizar el método para revertir los cambios.

Sintaxis: pandas.set_option(pat, valor)

Ejemplo: Este código modifica las opciones de visualización globales de pandas para mostrar todas las filas y columnas con ancho y precisión ilimitados para el DataFrame dado (df>). Luego restablece las opciones a sus valores predeterminados y muestra el DataFrame nuevamente, lo que ilustra la restauración de la configuración predeterminada.

Python3

tamaño del vector c ++

pruebas de compatibilidad




import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Permanently changes the pandas settings> pd.set_option(>'display.max_rows'>,>None>)> pd.set_option(>'display.max_columns'>,>None>)> pd.set_option(>'display.width'>,>None>)> pd.set_option(>'display.max_colwidth'>,>->1>)> # All dataframes hereafter reflect these changes.> display(df)> print>(>'**RESET_OPTIONS**'>)> # Resets the options> pd.reset_option(>'all'>)> display(df)>

>

>

Producción:

Método 4: usar to_markdown()

Este método es similar al método to_string() ya que también convierte el marco de datos en un objeto de cadena y también le agrega estilo y formato.

Sintaxis: DataFrame.to_markdown(buf=Ninguno, modo=’wt’, index=True, **kwargs)

Ejemplo: Este código utiliza el conjunto de datos Iris de scikit-learn para crear un DataFrame de pandas (df>), y luego imprime una representación Markdown formateada del DataFrame usando el to_markdown()>método .

Python3




import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=>data.feature_names)> # Converts the dataframe into str object with formatting> print>(df.to_markdown())>

>

>

Producción: