Estoy usando BeautifulSoup y analizo algunos HTML.Quiero hacer una excepción del 'índice de la lista fuera de rango'.
Obtengo cierta información de cada HTML (usando for loop) y agrego esa información a una cierta lista.
El problema es que algunos de los HTML tienen un formato diferente (y no tienen los datos que quiero en ellos).
lo tanto, yo estaba tratando de usar el control de excepciones y agregar valor null
a la lista (. Debería hacer esto ya que la secuencia de datos es importante)
Por ejemplo, tengo un código como:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
y algunos de los enlaces no tienen ningún <dd class='title'>
, así que lo que quiero hacer es agregar una cadena null
a la lista en su lugar.
El error aparece:
list index out of range.
lo que he hecho probado es añadir algunas líneas de la siguiente manera:
if not dlist[1]:
newlist.append('null')
continue
Pero no funciona. Todavía muestra el error:
list index out of range.
¿Qué debo hacer al respecto? ¿Debería usar el manejo de excepciones? o hay alguna manera más fácil?
¿Alguna sugerencia? ¡Cualquier ayuda sería realmente genial!
@JhonIntriagoThoth: Mientras que 'None' es claramente más limpio, el OP quiere' 'nulo'' en este caso. – ThiefMaster