tika

2011-05-31 9 views
6

Estoy tratando de índice mediante solicitud basada rizotika

la solicitud es

curl "http://localhost:8080/solr1/update/extract?literal.id=who.pdf&uprefix=attr_&fmap.content=attr_content&commit=true" -F "[email protected]/root/apache-solr-3.1.0/docs/who.pdf" 

En la presentación de la solicitud, que estoy recibiendo este error,

Error report</title><style><!--H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}HR {color : #525D76;}--></style> </head><body><h1>HTTP Status 400 - ERROR:unknown field 'ignored_meta'</h1><HR size="1" noshade="noshade"><p><b>type</b> Status report</p><p><b>message</b> <u>ERROR:unknown field 'ignored_meta'</u></p><p><b>description</b> <u>The request sent by the client was syntactically incorrect (ERROR:unknown field 'ignored_meta').</u></p><HR size="1" noshade="noshade"><h3>Apache Tomcat/6.0.18</h3></body></html>r 

Respuesta

13

Su problema es debido al hecho de que el controlador predeterminado para ExtractingRequestHandler definido en solrconfig.xml coloca todos los campos extraídos no identificados de Tika en campos llamados 'ingored_XXXXX'.

Para solucionar esto, sólo tiene que añadir a su configuración Solr un nombre de campo 'ignored_ *' como esto:

<dynamicField name="ignored_*" type="ignored"/> 

No se olvide de añadir también el tipo ignorado si la elimina del valor predeterminado configuración:

<fieldtype name="ignored" stored="false" indexed="false" multiValued="true" class="solr.StrField" /> 

Esto evitará que su Solr se bloquee cuando los campos de índice de Tika que Solr desconozca.

+1

gracias hice lo mismo ... olvidé poner el campo dinámico ... fue exactamente lo mismo que mencionaste ... y bueno de eso ahora estamos obteniendo muy buen resultado después de integrar con tika ... gracias jens –

+0

@naveengupta si funciona deberías aceptarlo como una respuesta. – kamaci

Cuestiones relacionadas