Me gustaría leer varios archivos csv de un directorio en pandas y concatenarlos en un gran DataFrame. Sin embargo, no he podido resolverlo. Esto es lo que tengo hasta ahora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Supongo que necesito ayuda dentro del ciclo for ???
big_frame = pd.concat(dfs, ignore_index=True)
? De todos modos, una vez que tenga una lista de marcos de datos, deberá iterar sobre la lista y concat abig_frame
dfs
ahora, por lo que algo así for df in dfs: big_frame.concat(df, ignore_index=True)
debería funcionar, también podría intentarlo en append
lugar de concat
también.
concat
debería manejar una lista de DataFrames tan bien como lo hiciste. Creo que este es un muy buen enfoque.
dfs
lista, no desea reemplazar la líneadata = pd.read_csv(filename)
condfs.append(pd.read_csv(filename)
. Entonces necesitarías recorrer la lista yconcat
, no creoconcat
que funcione en una lista dedf
s.