¿Cuándo es mejor usar en zip
lugar de itertools.izip
?
zip
función de Python 3 es la de Python 2 izip
. En general, Python 3 cambió la mayoría de las funciones para usar iteradores, como rango, filtro, funciones de dictado, etc.
¿Cuándo es mejor usar en zip
lugar de itertools.izip
?
zip
función de Python 3 es la de Python 2 izip
. En general, Python 3 cambió la mayoría de las funciones para usar iteradores, como rango, filtro, funciones de dictado, etc.
Respuestas:
Cuando sepa que querrá que se construya la lista completa de elementos (por ejemplo, para pasar a una función que modificaría esa lista en el lugar). O cuando quiere forzar que los argumentos a los que está pasando zip()
sean evaluados por completo en ese punto específico.
izip
solo reutiliza tuple
si tuple
se lanzó antes de que comience la siguiente iteración, por lo que no le proporciona nada. Dicho esto, cualquier pérdida también es trivial, por lo que estoy de acuerdo en que hay pocas razones para no usarlo de forma izip
exclusiva, terminando con list
si necesita un list
; en realidad se puede hacer esto de la manera "correcta" mediante la adición from future_builtins import zip
al código Py2, lo que deja claro zip
en izip
(la preparación para la transición AP3).
zip
calcula toda la lista a la vez, izip
calcula los elementos solo cuando se le solicita.
Una diferencia importante es que 'zip' devuelve una lista real, 'izip' devuelve un 'objeto izip', que no es una lista y no admite funciones específicas de la lista (como la indexación):
>>> l1 = [1, 2, 3, 4, 5, 6]
>>> l2 = [2, 3, 4, 5, 6, 7]
>>> z = zip(l1, l2)
>>> iz = izip(l1, l2)
>>> isinstance(zip(l1, l2), list)
True
>>> isinstance(izip(l1, l2), list)
False
>>> z[::2] #Get odd places
[(1, 2), (3, 4), (5, 6)]
>>> iz[::2] #Same with izip
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'itertools.izip' object is unsubscriptable
Entonces, si necesita una lista (y no un objeto similar a una lista), simplemente use 'zip'.
Aparte de esto, 'izip' puede ser útil para guardar memoria o ciclos.
Por ejemplo, el siguiente código puede salir después de algunos ciclos, por lo que no es necesario calcular todos los elementos de la lista combinada:
lst_a = ... #list with very large number of items
lst_b = ... #list with very large number of items
#At each cycle, the next couple is provided
for a, b in izip(lst_a, lst_b):
if a == b:
break
print a
el uso zip
habría calculado todas las (a, b)
parejas antes de ingresar al ciclo.
Además, si lst_a
y lst_b
son muy grandes (por ejemplo, millones de registros), se zip(a, b)
creará una tercera lista con doble espacio.
Pero si tienes listas pequeñas, quizás zip
sea más rápido.
En 2.x, cuando necesita una lista en lugar de un iterador.
itertools.izip()
excepto donde las ganancias serían puramente estadísticas.
lst = zip(lst_a, lst_b)
permite lst[1]
o len(lst)
. Sin embargo, ilst = itertools.izip(lst_a, lst_n)
fallará al intentarlo ilst[1]
o len(ilst)
.
La biblioteca itertools proporciona "iteradores" para funciones comunes de Python. De los documentos de itertools, "Como zip () excepto que devuelve un iterador en lugar de una lista". La I en izip () significa "iterador".
Los iteradores de Python son una secuencia de "carga diferida" que ahorra memoria sobre la lista normal en memoria. Por lo tanto, usaría itertools.izip (a, b) cuando las dos entradas a, b sean demasiado grandes para guardarlas en la memoria al mismo tiempo.
Busque los conceptos de Python relacionados con el procesamiento secuencial eficiente:
"generators" & "yield"
"iterators"
"lazy loading"
zip
, demasiado obvia pero aún digna de ser señalada, es que losizip
retornos y lositerator
cuales se pueden atravesar solo una vez. es decirii = izip(a,b) ; f(ii) ; g(ii)
, en , aquí[]
se pasa una lista vacíag
.