Me gustaría leer varios archivos csv de un directorio en pandas y concatenarlos en un gran DataFrame. Sin embargo, no he podido resolverlo. Esto es lo que tengo hasta ahora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Supongo que necesito ayuda dentro del ciclo for ???
big_frame = pd.concat(dfs, ignore_index=True)? De todos modos, una vez que tenga una lista de marcos de datos, deberá iterar sobre la lista y concat abig_frame
dfsahora, por lo que algo así for df in dfs: big_frame.concat(df, ignore_index=True)debería funcionar, también podría intentarlo en appendlugar de concattambién.
concatdebería manejar una lista de DataFrames tan bien como lo hiciste. Creo que este es un muy buen enfoque.
dfslista, no desea reemplazar la líneadata = pd.read_csv(filename)condfs.append(pd.read_csv(filename). Entonces necesitarías recorrer la lista yconcat, no creoconcatque funcione en una lista dedfs.