En el procesamiento del lenguaje natural, ¿cuál es el propósito de la fragmentación?En el procesamiento del lenguaje natural, ¿cuál es el propósito de la fragmentación?
Respuesta
Chunking también se denomina análisis superficial y es básicamente la identificación de partes del discurso y frases cortas (como frases nominales). Part of speech tagging le dice si las palabras son sustantivos, verbos, adjetivos, etc., pero no le da ninguna pista sobre la estructura de la oración o frases en la oración. A veces es útil tener más información que solo las partes del discurso de las palabras, pero no es necesario el árbol de análisis completo que obtendría al analizar.
Un ejemplo de cuándo la fragmentación podría ser preferible es Named Entity Recognition. En NER, su objetivo es encontrar entidades con nombre, que tienden a ser sustantivo frases (aunque no siempre), por lo que le gustaría saber que presidente Barack Obama se encuentra en la siguiente frase:
El presidente Barack Obama criticó a las compañías de seguros y los bancos al exhortar a sus seguidores a presionar al Congreso para que respalde sus movimientos para modernizar el sistema de salud y revisar las regulaciones financieras. (source)
Pero no necesariamente te importa que sea el sujeto de la oración.
La fragmentación también se ha utilizado con bastante frecuencia como un paso de preproceso para otras tareas como la traducción automática basada en ejemplos, la comprensión del lenguaje natural, la generación de habla y otros.
Para "fragmentación de texto" en el procesamiento del lenguaje natural, consulte here (probablemente desee todas las conferencias de esta serie como una especie de "NLP 101" ...): abarca una serie de tareas como buscar grupos de nombres , encontrar grupos de verbos y completar frases de particiones -> fragmentos de varios tipos. ¡La conferencia cuya URL he citado entra en más detalles!
¿Responder en otro castillo? Probablemente debería hacerse un comentario en lugar de una respuesta. –
Agrupando palabras en frases correlacionadas sintácticamente (fragmentos). NB: el etiquetado IOB se puede usar para indicar los límites de los fragmentos.
- 1. ARFF para el procesamiento del lenguaje natural
- 2. Procesamiento del lenguaje natural en PHP
- 3. El mejor camino para ingresar al procesamiento del lenguaje natural
- 4. Binarización en procesamiento de lenguaje natural
- 5. ¿Qué es un chunker en Procesamiento de lenguaje natural?
- 6. Paquete de procesamiento de lenguaje natural
- 7. Procesamiento de lenguaje natural en Ruby
- 8. ¿Cuál es el propósito del lenguaje de programación Scala?
- 9. Lista de herramientas de procesamiento del lenguaje natural en cuanto a Sentiment Analysis - ¿Cuál te recomiendas
- 10. Procesamiento del lenguaje natural - Ideas para proyectos para principiantes
- 11. API para procesamiento de lenguaje natural en Android
- 12. Procesamiento de lenguaje natural: ¿encuentra obscenidades en inglés?
- 13. Últimos buenos lenguajes y libros para el procesamiento del lenguaje natural, los conceptos básicos
- 14. Solución de procesamiento de lenguaje natural en Java?
- 15. Procesamiento del Lenguaje Natural Algoritmo para el estado de ánimo de un correo electrónico
- 16. ¿Hay una buena biblioteca de procesamiento de lenguaje natural?
- 17. corrección de procesamiento de lenguaje natural para palabras combinadas
- 18. ¿Cuál es el propósito del prototipo?
- 19. ¿Cuál es el propósito del archivo vshost.exe?
- 20. ¿Cuál es el propósito del control VisitorIdentification?
- 21. ¿Cuál es el propósito del transformador IdentityT?
- 22. ¿Cuál es el propósito del Producto -> Limpiar en Xcode?
- 23. ¿Cuál es el propósito del modificador -m?
- 24. Kit de herramientas de procesamiento de lenguaje natural para .NET
- 25. ¿Cuál es el propósito del pase indefinido?
- 26. ¿Cuál es el propósito del método Thread.SpinWait?
- 27. ¿Cuál es el propósito del uso?
- 28. Python vs Java para procesamiento de lenguaje natural
- 29. ¿Cuál es el propósito del doble implicar?
- 30. Biblioteca de procesamiento de lenguaje natural para etiquetado automático (.NET)
También puede consultar el capítulo 13 (Análisis sintáctico) Sección 5 (Análisis Parcial) de Procesamiento de Habla y Lenguaje (http://www.cs.colorado.edu/~martin/slp.html). – anno