Buscar enlace específico w/beautifulsoup

Hola No puedo encontrar la manera de encontrar enlaces que comiencen con cierto texto para mi vida. findall ('a') funciona bien, pero es demasiado. Solo quiero hacer una lista de todos los enlaces que comienzan con http://www.nhl.com/ice/boxscore.htm?id=Buscar enlace específico w/beautifulsoup

¿Alguien me puede ayudar?

Muchas gracias

Fuente

2011-10-11 Jen Scott

Primero abra un documento de prueba y abrir el analizador con BeautifulSoup:

>>> from BeautifulSoup import BeautifulSoup 
>>> doc = '<html><body><div><a href="something">yep</a></div><div><a href="http://www.nhl.com/ice/boxscore.htm?id=3">somelink</a></div><a href="http://www.nhl.com/ice/boxscore.htm?id=7">another</a></body></html>' 
>>> soup = BeautifulSoup(doc) 
>>> print soup.prettify() 
<html> 
<body> 
    <div> 
    <a href="something"> 
    yep 
    </a> 
    </div> 
    <div> 
    <a href="http://www.nhl.com/ice/boxscore.htm?id=3"> 
    somelink 
    </a> 
    </div> 
    <a href="http://www.nhl.com/ice/boxscore.htm?id=7"> 
    another 
    </a> 
</body> 
</html>

A continuación, podemos buscar todas las <a> etiquetas con un atributo href comenzando con http://www.nhl.com/ice/boxscore.htm?id=. Se puede utilizar una expresión regular para ello:

>>> import re 
>>> soup.findAll('a', href=re.compile('^http://www.nhl.com/ice/boxscore.htm\?id=')) 
[<a href="http://www.nhl.com/ice/boxscore.htm?id=3">somelink</a>, <a href="http://www.nhl.com/ice/boxscore.htm?id=7">another</a>]

Fuente

2011-10-11 21:35:44 jterrace

Wow gracias. Supongo que la documentación de beautifulsoup presupone fluidez en Regex. Gracias por mostrarme que –

@JenScott Si esto respondió su pregunta, debe aceptarlo. – serk

Bien, pero ¿y si el nombre de su atributo se llama "clase"? – Wajih

puede que no necesite BeautifulSoup ya que su búsqueda es específica

>>> import re 
>>> links = re.findall("http:\/\/www\.nhl\.com\/ice\/boxscore\.htm\?id=.+", str(doc))

Fuente

2016-05-02 16:05:36 Emma

Buscar enlace específico w/beautifulsoup

Respuesta

Cuestiones relacionadas