Estoy trabajando en un corpus holandés y quiero saber si NLTK tiene gramática holandesa incrustada en él para que pueda analizar mis oraciones? En general, ¿NLTK solo funciona en inglés? Sé que tiene el copora holandés Alpino, pero no hay ninguna indicación de que las funciones (como el análisis mediante CFG) estén hechas también para holandés. Graciasgramática holandesa en python's NLTK
Respuesta
No tengo una respuesta directa, pero al combinar la información proveniente de las dos páginas siguientes, debería poder encontrarla. Here you can find an overview of the high-level parsing interface en NLTK. Los analizadores requieren un modelo, que de estar presente se enumeraría en la página para la documentación del data packages that ships with nltk.
Como ya sabe, Alpino Dutch Treebank se envía junto con NLTK, por lo que en el peor de los casos, usted debe poder aprender un modelo usted mismo (la API del analizador también proporciona recursos de aprendizaje).
Espero que ayude de alguna manera.
Esta es una respuesta a mi correo de Steven Bird uno de los autores del libro NLTK:
NLTK puede funcionar para analizar holandesa si proporciona las reglas gramaticales. Consulte el libro NLTK para obtener orientación: http://www.nltk.org/book Puede utilizar el corpus Alpino para desarrollar la gramática (o para entrenar un analizador estadístico). Si su interés principal es es obtener oraciones sintácticas de holandés, le recomiendo que intente encontrar un analizador existente en lugar de desarrollar el suyo propio.
Al final terminé usando el analizador Alpino que es muy fuerte y está escrito en Prolog, pero logré portar (la versión binaria) en python.
- 1. ¿Cómo se pide Pythons glob.glob?
- 2. ¿Cómo obtengo un conjunto de reglas de gramática de Penn Treebank usando Python y NLTK?
- 3. etiquetado personalizado con nltk
- 4. Gramática Lisp en yacc
- 5. NLTK en IronPython de WPF
- 6. Tweet Classifier Feature-Selection NLTK
- 7. Tokenizing unicode usando nltk
- 8. Gramática AS3: Más precisa
- 9. C# ANTLR gramática?
- 10. Restricciones de selección de Wordnet en NLTK
- 11. Entrenamiento HMM no supervisado en NLTK
- 12. ¿Qué palabra lectora debo usar en nltk?
- 13. Modelado de temas en MALLET vs NLTK
- 14. /fechas como terminales en NLTK analizador
- 15. Algoritmos NLTK MEGAM Max Ent en Windows
- 16. NLTK y detección de idioma
- 17. Analizando una gramática sin contexto en Python
- 18. Gramática C en código fuente GCC
- 19. Gramática en Google Web Speech API
- 20. la conversión de una gramática en LL (1) gramática: algunos problemas
- 21. gramática Cima del bucle infinito
- 22. Sintaxis de Gramática y Lingüística
- 23. API de comprobación de gramática?
- 24. Python's NLTK vs. Librerías Java relacionadas?
- 25. TF-IDF Uso simple - NLTK/Scikit Learn
- 26. Cómo entrenar incrementalmente un clasificador nltk
- 27. NLTK - ¿Cuándo se debe normalizar el texto?
- 28. Ejemplos prácticos de uso de NLTK
- 29. NLTK piensa que los imperativos son sustantivos
- 30. Creando un nuevo corpus con NLTK