Soy un estudiante graduado de Literatura, y he estado revisando el libro de O'Reilly en Natural Language Processing (nltk.org/book). Se ve increíblemente útil. He jugado con todos los textos de ejemplo y tareas de ejemplo en el Capítulo 1, como concordancias. Ahora sé cuántas veces Moby Dick usa la palabra "ballena". El problema es que no puedo descifrar cómo hacer estos cálculos en uno de mis propios textos. Encontré información sobre cómo crear mi propio corpus (Capítulo 2 del libro de O'Reilly), pero no creo que eso sea exactamente lo que quiero hacer. En otras palabras, quiero ser capaz de hacer¿Cómo creo mi propio texto NLTK a partir de un archivo de texto?
import nltk
text1.concordance('yellow')
y obtener los lugares donde la palabra 'amarillo' se utiliza en mi texto. Por el momento, puedo hacer esto con los textos de ejemplo, pero no con los míos.
Soy muy nuevo en python y en programación, así que esto es muy emocionante, pero muy confuso.
excelente. Solo estaba tratando de responder a esta pregunta yo mismo; muy contenta de haber tropezado con tu (auto) respuesta. - Otro becario de literatura – cforster
Para que esto funcione, primero necesitaba descargar "punkt": nltk.download ('punkt') –
¿Qué hace el rU? Encontrado: f = abrir ('myfile.txt', 'rU') # rU significa "leer", y maneja terminaciones de línea – ProfVersaggi