Estoy usando BeautifulSoup y analizando algunos HTML.
Obtengo ciertos datos de cada HTML (usando el bucle for) y agrego esos datos a una lista determinada.
El problema es que algunos de los HTML tienen un formato diferente (y no tienen los datos que quiero en ellos) .
Entonces, estaba tratando de usar el manejo de excepciones y agregar valor null
a la lista (debería hacer esto ya que la secuencia de datos es importante).
Por ejemplo, tengo un código como:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
y algunos de los enlaces no tienen ninguno <dd class='title'>
, así que lo que quiero hacer es agregar una cadena null
a la lista.
Aparece el error:
list index out of range.
Lo que he intentado es agregar algunas líneas como esta:
if not dlist[1]:
newlist.append('null')
continue
Pero no funciona. Todavía muestra error:
list index out of range.
¿Qué debo hacer al respecto? ¿Debería utilizar el manejo de excepciones? ¿O hay alguna forma más fácil?
¿Alguna sugerencia? ¡Cualquier ayuda sería genial!
None
está claramente más limpio, el OP quiere'null'
en este caso.