f = open(fname,'r')
lines = f.readlines()[1:]
['a', 'b', 'c'][1:]
=>['b', 'c']
de more-itertools
como se indica en ? Escuché sobre esto en
Si desea la primera línea y luego desea realizar alguna operación en el archivo, este código será útil.
with open(filename , 'r') as f:
first_line = f.readline()
for line in f:
# Perform some operations
Si el corte podría funcionar en iteradores ...
from itertools import islice
with open(fname) as f:
for line in islice(f, 1, None):
f = open(fname).readlines()
firstLine = f.pop(0) #removes the first line
for line in f:
Para generalizar la tarea de leer varias líneas de encabezado y mejorar la legibilidad, usaría el método de extracción. Supongamos que desea tokenizar las tres primeras líneas decoordinates.txt
para usar como información de encabezado.
Name,Longitude,Latitude,Elevation, Comments
String, Decimal Deg., Decimal Deg., Meters, String
Euler's Town,7.58857,47.559537,0, "Blah"
Faneuil Hall,-71.054773,42.360217,0
Yellowstone National Park,-110.588455,44.427963,0
Luego, la extracción del método le permite especificar qué desea hacer con la información del encabezado (en este ejemplo simplemente tokenizamos las líneas del encabezado en función de la coma y la devolvemos como una lista, pero hay espacio para hacer mucho más).
def __readheader(filehandle, numberheaderlines=1):
"""Reads the specified number of lines and returns the comma-delimited
strings on each line as a list"""
for _ in range(numberheaderlines):
yield map(str.strip, filehandle.readline().strip().split(','))
with open('coordinates.txt', 'r') as rh:
# Single header line
#print next(__readheader(rh))
# Multiple header lines
for headerline in __readheader(rh, numberheaderlines=2):
print headerline # Or do other stuff with headerline tokens
['Name', 'Longitude', 'Latitude', 'Elevation', 'Comments']
['String', 'Decimal Deg.', 'Decimal Deg.', 'Meters', 'String']
Si coordinates.txt
contiene otro encabezado, simplemente cambie numberheaderlines
. Lo mejor de todo es que está claro lo que __readheader(rh, numberheaderlines=2)
está haciendo y evitamos la ambigüedad de tener que averiguar o comentar por qué el autor de la respuesta aceptada utiliza next()
en su código.
Si desea leer varios archivos CSV a partir de la línea 2, esto funciona de maravilla
for files in csv_file_list:
with open(files, 'r') as r:
next(r) #skip headers
rr = csv.reader(r)
for row in rr:
#do something
(Esto es parte de la respuesta de Parfait a una pregunta diferente)
# Open a connection to the file
with open('world_dev_ind.csv') as file:
# Skip the column names
# Initialize an empty dictionary: counts_dict
counts_dict = {}
# Process only the first 1000 rows
for j in range(0, 1000):
# Split the current line into a list: line
line = file.readline().split(',')
# Get the value for the first column: first_col
first_col = line[0]
# If the column value is in the dict, increment its value
if first_col in counts_dict.keys():
counts_dict[first_col] += 1
# Else, add to the dict and set value to 1
counts_dict[first_col] = 1
# Print the resulting dictionary
y almacenarlo como una variable