¿Cómo recupera programáticamente el número de columnas en un marco de datos de pandas? Esperaba algo como:
df.num_columns
¿Cómo recupera programáticamente el número de columnas en un marco de datos de pandas? Esperaba algo como:
df.num_columns
Respuestas:
Al igual que:
import pandas as pd
df = pd.DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
len(df.columns)
3
df.shape
es mejor? Supongo que no llama a una función, sino que solo lee el atributo de la memoria.
Alternativa:
df.shape[1]
( df.shape[0]
es el número de filas)
Si la variable que contiene el marco de datos se llama df, entonces:
len(df.columns)
da el número de columnas.
Y para aquellos que quieren el número de filas:
len(df.index)
Para una tupla que contiene el número de filas y columnas:
df.shape
len(df)
te daría las filas?
Esto funcionó para mí len (list (df)).
La función df.info () le dará un resultado similar al siguiente. Si está utilizando el método read_csv de Pandas sin parámetro sep o sep con ",".
raw_data = pd.read_csv("a1:\aa2/aaa3/data.csv")
raw_data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5144 entries, 0 to 5143
Columns: 145 entries, R_fighter to R_age
Hay varias opciones para obtener el número de columna y la información de la columna, como:
verifíquelos.
local_df = pd.DataFrame (np.random.randint (1,12, size = (2,6)), columnas = ['a', 'b', 'c', 'd', 'e', 'f ']) 1. local_df.shape [1] -> Tupla de retorno de atributo de forma como (fila y columnas) (0,1).
local_df.info () -> El método info devolverá información detallada sobre el marco de datos y sus columnas, como el recuento de columnas, el tipo de datos de las columnas, el recuento de valores no nulos, el uso de memoria por el marco de datos
len (local_df.columns) -> el atributo columnas devolverá el objeto índice de las columnas del marco de datos y la función len devolverá el total de columnas disponibles.
local_df.head (0) -> el método head con el parámetro 0 devolverá la primera fila de df, que en realidad no es más que el encabezado.
Asumiendo que el número de columnas no es más de 10. Para diversión en bucle: li_count = 0 para x en local_df: li_count = li_count + 1 print (li_count)
df.shape
da una tupla con (n_rows, n_columns)