Exception in thread "main" java.lang.IllegalArgumentException: Fetcher: No agents listed in 'http.agent.name' property.
at org.apache.nutch.fetcher.Fetcher.checkConfiguration(Fetcher.java:1166)
at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1068)
at org.apache.nutch.crawl.Crawl.run(Crawl.java:135)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawl.main(Crawl.java:54)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:616)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
Cada vez que ejecuto ./nutch crawl urls -dir crawl -depth 3 -topN 5. nutch decide lanzar este error. Tengo mi nutch-site.xml & nutch-default.xml configurado con.Nutch No hay agentes listados en 'http.agent.name'
<property>
<name>http.agent.name</name>
<value>blah</value>
</property>
Hizo la descripción para facilitar su lectura. Pero no veo dónde más se puede especificar el nombre del agente. si alguien tiene algún consejo, estaría agradecido.
Muchas gracias este fue el problema! Editando los archivos incorrectos. – LinuxBill
Parece que la lista de correo no funciona. Intento suscribirme a la lista de correo nutch unas cuantas veces, pero fallé. – janwen