2010-10-04 13 views
6

Necesito encontrar si una palabra es verbo o sustantivo o que es a la vezencontrar sustantivo y un verbo en Stanford analizador

Por ejemplo, la palabra es "buscar" puede ser tanto sustantivo y un verbo, pero Stanford analizador da NN etiqueta ...

¿Hay alguna forma de que stanford parser le dé a esa "búsqueda" el sustantivo y el verbo?

código que yo uso ahora

public static String Lemmatize(String word) { 
    WordTag w = new WordTag(word); 
    w.setTag(POSTagWord(word)); 
    Morphology m = new Morphology(); 
    WordLemmaTag wT = m.lemmatize(w); 

    return wT.lemma(); 
} 

o debería utilizar cualquier otro software para hacerlo? por favor sugiérame gracias de antemano

Respuesta

8

El analizador de Stanford adivina la etiqueta de palabra parcial basada en estadísticas de contexto. Realmente debería pasar una oración completa para determinar si, en esa oración, "buscar" es un sustantivo o un verbo.

No necesita un analizador completo solo para obtener etiquetas de voz parcial. El Stanford POS Tagger es suficiente; también incluye la clase Morphology, pero también tiene en cuenta el contexto.

Si quiere todas las etiquetas de voz parcial que puede tomar una palabra en inglés, sin dar contexto, entonces WordNet es probablemente una mejor opción. Tiene varias interfaces Java, incluidas JWNL y JWI.

1

El analizador de Stanford analiza palabras en el contexto de una oración. Para usar su ejemplo de "búsqueda", en cualquier oración dada, "buscar" será un sustantivo o un verbo, pero no tanto un sustantivo como un verbo en la misma oración.

Lo que estás buscando es una búsqueda en el diccionario. He encontrado varios diccionarios en línea que le brindarán la información que está buscando. Aquí hay un ejemplo del Free Online Dictionary para la palabra "búsqueda".

Resulta que "búsqueda" puede ser un sustantivo, verbo, verbo intransitivo y verbo transitivo.

No pude encontrar una interfaz de programación de aplicaciones (API) que le proporcione el mismo tipo de información que la que se encuentra en la página web del Diccionario en línea gratuito. Si su lista de vocabulario es limitada, puede construir su propia API.

+1

hay una API para Wordnik que básicamente proporcionaría eso: http://www.wordnik.com/developers – ealdent

+0

Gracias por encontrar el enlace. –

3

WordNet es lo que quiere. Proporciona una API para un léxico inglés con posibles partes de la oración, sinónimos, sentidos de las palabras, relaciones de Hypernym/Hyponym y más.

Consulte Yawni para obtener una gran API de WordNet puro-Java.

Cuestiones relacionadas