necesito una fuente de Java crwaler basado en la web abierta que puedo extender por comparación de precios? ¿Cómo hago la comparación de precios? ¿Hay algún código fuente abierto para eso?rastreador Web de comparación de precios
Respuesta
Echa un vistazo a la cosecha web, usted tiene que usar es un poco extraño y peculiar sintaxis para el procesamiento de páginas web, pero debe ser bastante para extenderlo a hacer un poco de comparación de precios:
Esta aplicación parece realmente genial y fácil de usar, pero desafortunadamente en realidad el rendimiento (por mis medidas) es bastante malo. – javamonkey79
¿Alguna razón por la que no puede obtener sus datos de uno de los cientos de sitios de comparación de precios que ya existen? Parece que sería más fácil eliminar nextag o froogle o lo que sea, en lugar de escribir un rastreador para raspar miles de millones de sitios web de tiendas.
Thx para la respuesta. Sí, ya he revisado la cosecha web. Sí, también tuve ideas acerca de simplemente raspar sitios de comparación de precios. Entonces debería ser por un rastreador ¿no? A continuación, ¿los sitios de comparación de precios le permiten crwal sus sitios? ¿Me estoy perdiendo de algo? Si es simple todo lo que necesita es crwal 10-20 sitios web ¿verdad? – yeskay
Construir algo que raspa la información de precios de un gran número de sitios diferentes va a ser mucho trabajo, ya sea que se deshaga de las propias tiendas o de los sitios de comparación existentes.
El diseño de la página web de cada persona será diferente, lo que requiere que configure su rastreador por separado para cada una.
Algunos sitios web pueden presentar la información de precios de manera que dificultan el raspado; p.ej. usando AJAX.
Algunos propietarios de sitios web van a poner las páginas relevantes en sus archivos robots.txt
para decirle que se mantenga alejado. Y si ignoras eso, hay varias cosas que pueden hacer para hacerte la vida más difícil.
Raspar muchos sitios web de personas sin permiso es probable que lo haga impopular. Podría atraer amenazas de demandas, o demandas reales de personas que perciben que está perjudicando su modelo comercial. U otras respuestas ...
¿Estás seguro de que quieres hacer esto? ¿¿De Verdad??
Nadie quiere que su sitio para obtener sobrecargado sin obtener ningún beneficio. Creo que deberías crear un rastreador para tu necesidad. Sin embargo, tenga en cuenta que la mayoría de ellos pueden bloquearlo o hacer que sus respuestas sean más lentas. debe comportarse como si no fuera uno y comer su ancho de banda ...
Alguien aquí escribió sobre los problemas legales. Los problemas legales no son simples. Stephen C escribió sobre pleitos pero eso va en ambos sentidos. Existe un gran cuerpo de leyes relacionadas con la conducta anticompetitiva. Si alguien quiere que sus precios no sean informados porque están involucrados en la fijación de precios o haciendo afirmaciones falsas, entonces los sitios web se enfrentan a severas penalidades. La ley no es algo para citar trivialmente. Puede fijar precios en google y ver las grandes multas ya impuestas a innumerables empresas.
- 1. rastreador web en ruby
- 2. trampas legales o éticas para el rastreador web?
- 3. Hacer un rastreador web/araña
- 4. experto rastreador ejemplo F # Web
- 5. simple rastreador web en C#
- 6. rastreador web que puede interpretar JavaScript
- 7. Comparación de Clojure Web marcos
- 8. ¿Un rastreador/araña de web C++ muy simple?
- 9. Factor de cortesía típico para un rastreador web?
- 10. ¿Mejor rastreador de gráficos web para mayor velocidad?
- 11. Rastreador de errores simple no basado en la web
- 12. rastreador web Python con base de datos MySQL
- 13. Ruby, Mongodb, Anemone: rastreador web con posible pérdida de memoria?
- 14. rastreador en appengine
- 15. Etiqueta adecuada para un rastreador web Solicitudes HTTP
- 16. ¿Existe algún rastreador web extensible y simplemente extensible?
- 17. ¿Cómo escribir un rastreador?
- 18. ¿Cómo puedo manejar Javascript en un rastreador web Perl?
- 19. ¿es posible escribir un rastreador web en javascript?
- 20. API para obtener precios de gas
- 21. ¿Planes y aplicación genérica de precios?
- 22. RegEx para precios?
- 23. Algoritmo de agrupamiento del filtro de precios
- 24. Algoritmo del esquema de precios de Fogbugz
- 25. Rastreador de errores/problemas de HTML liviano
- 26. Solicitud de rastreador Bittorrent, formato de info_hash
- 27. Qt fijación de precios (la más actualizada)
- 28. Desactivación transitoria a precios de modo
- 29. ¿Cómo puede un rastreador web Perl seguir una devolución de datos de ASP.NET?
- 30. ¿Conoces algún rastreador de errores instantáneo/independiente?
No rastrear las páginas web usted mismo. Solo genera dolor y problemas (tanto en el código como en términos legales). Debe ponerse en contacto con proveedores de listas de precios para obtener más información sobre sus servicios web públicos y luego hacer uso de ellos. – BalusC
@BalusC problema (términos legales)? como y por qué ? – Lite