Tengo un texto del que quiero extraer los sintagmas nominales. Puedo obtener fácilmente el analizador tipeado para el texto que tengo, pero ¿cómo puedo extraer las frases nominales en el texto?Extracción de sintagmas nominales de un archivo de texto usando stanford tipeado analizador
Respuesta
Puede utilizar Stanford Core NLP para el etiquetado POS. Puede encontrar un código de muestra en http://nlp.stanford.edu/software/corenlp.shtml#Usage que podría ser un buen punto de partida para la experimentación. Debería dar tokenize, split y pos como propiedades. Esto genera una lista de tokens con sus etiquetas correspondientes.
Toda la lista de etiquetas se puede ver en http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html. Todas las etiquetas de nombres comenzarían con NN. Al realizar este control, obtendrás los tokens necesarios.
Pruebe también link. No estoy seguro de si stanford pos tagger y el etiquetador disponible en el corenlp son iguales o no, pero encontré este enlace para ser más útil.
Después del etiquetado PoS, tendrá que detectar patrones como este (Adjetivo | Sustantivo) * (Preposición del sustantivo)? (Adjetivo | Sustantivo) * Sustantivo
Pruebe este link para obtener más información sobre la detección de frase de sintonía.
Puede extraer frases nominales de Tree usando el siguiente código. Se supone que usted ha analizado frase almacenada en de análisis (es decir, análisis sintáctico se emite de clase LexicalizedParser método apply)
public static List<Tree> GetNounPhrases()
{
List<Tree> phraseList=new ArrayList<Tree>();
for (Tree subtree: parse)
{
if(subtree.label().value().equals("NP"))
{
phraseList.add(subtree);
System.out.println(subtree);
}
}
return phraseList;
}
- 1. Extracción de términos con relevancia contextual (frases nominales) del texto en un proyecto .NET
- 2. Fragmentar un texto con el Stanford-PNL
- 3. encontrar sustantivo y un verbo en Stanford analizador
- 4. extracción de texto Itextsharp
- 5. Resolver la correferencia usando Stanford CoreNLP - incapaz de cargar el analizador modelo
- 6. cómo llegar relación entre las palabras con PNL Stanford analizador
- 7. Extracción de la url de texto usando java
- 8. Java - PDFBox - Extracción de texto
- 9. ¿Lees un archivo de texto usando Node.js?
- 10. Jsoup - la extracción de texto
- 11. Extracción de texto de HTML Java
- 12. Uso de Stanford CoreNLP
- 13. Extracción de la primera línea de un archivo de texto en C#
- 14. Atributos nominales en LibSVM
- 15. stanford nlp tokenizer
- 16. Extracción atributo de sólo lectura en un directorio usando C#
- 17. Extracción de imágenes/imágenes dentro de un archivo de Excel (xls) usando PHP
- 18. Extracción simple de texto PDF en Android?
- 19. Cómo asignar un objeto tipeado dinámicamente
- 20. Extracción de características semánticas/estilísticas del texto
- 21. Extracción de una tabla de un archivo de volcado mysql.sql
- 22. extracción Plazo: Generatings etiquetas fuera de texto
- 23. Extracción de sustantivos y verbos del texto
- 24. ¿Cómo recorre cada línea en un archivo de texto usando un archivo de lote de Windows?
- 25. stanford core nlp java output
- 26. La extracción de datos desde un simple archivo XML
- 27. ¿La mejor manera de extraer texto de un archivo de texto de 1.3GB usando PHP?
- 28. ¿Cómo encriptar un archivo de texto usando C?
- 29. ¿Cómo escribo en un archivo de texto usando AppleScript?
- 30. para enviar un archivo de texto al servidor usando javascript
me han tratado de conseguir Stanford escribió analizador, pero todavía se pregunta qué etiquetas se representa la frase nominal! –
U necesita herramientas de PNL. mira esta pregunta http://stackoverflow.com/questions/1889675/extract-nouns-from-text-java –
¿Por qué estás usando un analizador de dependencias en primer lugar? Un generador de árbol de análisis sintáctico normal parece ser el camino para conseguir lo que quieres. –