¿Alguien sabe qué es un chunker en el contexto del procesamiento de texto y cuál es su uso?¿Qué es un chunker en Procesamiento de lenguaje natural?
Respuesta
De acuerdo con these slides, la fragmentación es una alternativa al análisis sintáctico que proporciona una estructura sintáctica parcial de una oración, con una profundidad de árbol limitada, en oposición a un análisis completo.
Es más limitado que el análisis completo, pero es suficiente cuando se trata de extraer o ignorar información y, por lo tanto, se utiliza muchas veces, ya que es más rápido y más sólido que el análisis sintáctico.
Mucha más información está disponible en las diapositivas.
Otros enlaces:
Es un tipo muy simplista de análisis, llamados shallow parsing. El proyecto cuenta con un módulo OpenNLP chunker disponible, y se puede ver su documentation para un ejemplo de fragmentación en la acción
No estoy en desacuerdo personal con las otras respuestas, pero Juraksky & Martin dar una definición ligeramente diferente. Para ellos, fragmentación es específicamente el tipo de análisis superficial en el que no hay frases recursivas.
Un ejemplo que dan es la frase "el vuelo desde Denver". Un análisis que sería no generado por un chunker es "[NP el vuelo [PP de [NP Denver]]]" porque implica una gramática con NP-recursividad.
- 1. Procesamiento de lenguaje natural en Ruby
- 2. Binarización en procesamiento de lenguaje natural
- 3. Paquete de procesamiento de lenguaje natural
- 4. Procesamiento del lenguaje natural en PHP
- 5. ARFF para el procesamiento del lenguaje natural
- 6. Procesamiento de lenguaje natural: ¿encuentra obscenidades en inglés?
- 7. Solución de procesamiento de lenguaje natural en Java?
- 8. API para procesamiento de lenguaje natural en Android
- 9. ¿Qué es una buena biblioteca de lenguaje natural para parafrasear?
- 10. corrección de procesamiento de lenguaje natural para palabras combinadas
- 11. Procesamiento del lenguaje natural - Ideas para proyectos para principiantes
- 12. Kit de herramientas de procesamiento de lenguaje natural para .NET
- 13. Python vs Java para procesamiento de lenguaje natural
- 14. ¿Hay una buena biblioteca de procesamiento de lenguaje natural?
- 15. Biblioteca de procesamiento de lenguaje natural para etiquetado automático (.NET)
- 16. El mejor camino para ingresar al procesamiento del lenguaje natural
- 17. Palabras en lenguaje natural en inglés
- 18. Lenguaje de comandos de lenguaje natural
- 19. En el procesamiento del lenguaje natural, ¿cuál es el propósito de la fragmentación?
- 20. Procesamiento del Lenguaje Natural Algoritmo para el estado de ánimo de un correo electrónico
- 21. Lista de herramientas de procesamiento del lenguaje natural en cuanto a Sentiment Analysis - ¿Cuál te recomiendas
- 22. Generación de lenguaje natural en PHP
- 23. ¿Qué es un buen (lenguaje natural) esquema de nombres para las interfaces de pertenencia o propiedad
- 24. ¿Hay algún tipo de biblioteca estadística de procesamiento de lenguaje natural para Haskell?
- 25. Subtipos para los tipos de lenguaje natural
- 26. Detección y/o identificación de falacia lógica con procesamiento de lenguaje natural
- 27. Buscando estructura de oraciones de lenguaje natural
- 28. Generador de lenguaje natural para fechas (Java)
- 29. Últimos buenos lenguajes y libros para el procesamiento del lenguaje natural, los conceptos básicos
- 30. Representación del lenguaje natural como RDF