Mi nivel python es Novato. Nunca he escrito un raspador web o rastreador. He escrito un código python para conectarme a una API y extraer los datos que deseo. Pero para algunos de los datos extraídos, quiero obtener el género del autor. Encontré este sitio web http://bookblog.net/gender/genie.php
, pero a la baja hay una aplicación disponible. Me preguntaba cómo escribir un pitón para enviar datos al formulario en la página y extraer los datos de retorno. Sería de gran ayuda si pudiera obtener alguna orientación sobre esto.Presentar datos a través del formulario web y extraer los resultados
Ésta es la forma dom:
<form action="analysis.php" method="POST">
<textarea cols="75" rows="13" name="text"></textarea>
<div class="copyright">(NOTE: The genie works best on texts of more than 500 words.)</div>
<p>
<b>Genre:</b>
<input type="radio" value="fiction" name="genre">
fiction
<input type="radio" value="nonfiction" name="genre">
nonfiction
<input type="radio" value="blog" name="genre">
blog entry
</p>
<p>
</form>
resultados página dom:
<p>
<b>The Gender Genie thinks the author of this passage is:</b>
male!
</p>
intenté hacer easy_install lxml.html pero obteniendo el siguiente error easy_install lxml.html Buscando lxml.html Leyendo http://pypi.python.org/simple/lxml .html/ No se pudo encontrar la página de índice para 'lxml.html' (¿quizás mal escrito?) Índice de escaneo de todos los paquetes (esto puede llevar un tiempo) Lectura http://pypi.python.org/simple/ No paquetes locales o enlaces de descarga encontrados para lxml.html error: No se pudo encontrar la distribución adecuada para Requirement.parse ('lxml.html') –
En una importación de módulo, si dos nombres tienen un '.' entre ellos, significa que el el segundo nombre está dentro del nombre anterior. El módulo que desea instalar es lxml. – Acorn
gracias me di cuenta después de poner el comentario. Gracias agianl –