Quiero borrar algunos datos de la siguiente URL usando Python. http://www.hankyung.com/stockplus/main.php?module=stock&mode=stock_analysis_infomation&itemcode=078340Raspado de datos generados mediante JavaScript usando Python
Se trata de un resumen de la información de la empresa.
Lo que quiero raspar no se muestra en la primera página. Al hacer clic en la pestaña llamada "재무 제표", puede acceder al estado financiero. Y la pestaña llamada clic en "현금 흐름표', se puede acceder a "Cash Flow".
quiero raspar los "Flujo de fondos".
Sin embargo, los datos de flujo de efectivo es generado por el javascript, a través de la URL. el siguiente enlace es que el URL que está oculto, http://stock.kisline.com/compinfo/financial/main.action?vhead=N&vfoot=N&vstay=&omit=&vwidth=
datos de flujo de caja se genera mediante la presentación de algún valor de opción y de la galleta a esta URL.
Como se percibe, itemcode = 078.340 en el primer link significa el código de valores y hay tantas como 1680 acciones que quiero recopilar datos de flujo de efectivo. hormiga lo convierte en una estructura de bucle.
¿Hay una buena manera de raspar los datos de flujo de efectivo? Probé el tratamiento con scrapy pero es difícil lidiar con mi otro código de rascado que ya estoy usando.
¿Los datos son extraídos por ajax del servidor o se almacenan en html de alguna manera (como dentro de la variable JS o en 'data-')? – Tadeck
¿Los términos de servicio le permiten hacer eso? – luke14free
Tadeck, los datos se extraen del servidor. – trigger