Necesito tomar un archivo de texto de entrada con una palabra. Entonces necesito encontrar los lemma_names, la definición y los ejemplos del synset de la palabra usando wordnet. He revisado el libro: "Procesamiento de texto de Python con el libro de cocina NLTK 2.0" y también "Procesamiento de lenguaje natural usando NLTK" para ayudarme en esta dirección. Aunque he entendido cómo se puede hacer esto con el terminal, no puedo hacer lo mismo con un editor de texto.Para buscar sinónimos, definiciones y oraciones de ejemplo usando WordNet
Por ejemplo, si el texto de entrada tiene la palabra "pasmado", la salida tiene que ser de esta manera:
Flabbergasted (verbo) flabbergast, aturdir, tazón sobre - superar con asombro; "¡Esto aturde la mente!" (adjetivo) estupefacto, estupefacto, estupefacto, estupefacto, estupefacto, mudo, mudo, como estupefacto por el asombro y la sorpresa; "un círculo de la policía quedó estupefacto por su negativa a haber visto el accidente"; "los concejales estupefactos estaban mudos"; "Estaba asombrado por la noticia de su promoción"
¡Los sintonizadores, definiciones y oraciones de ejemplo se obtienen directamente de WordNet!
Tengo el siguiente fragmento de código:
from __future__ import division
import nltk
from nltk.corpus import wordnet as wn
tokenizer = nltk.data.load('tokenizers/punkt/english.pickle')
fp = open("inpsyn.txt")
data = fp.read()
#to tokenize input text into sentences
print '\n-----\n'.join(tokenizer.tokenize(data))# splits text into sentences
#to tokenize the tokenized sentences into words
tokens = nltk.wordpunct_tokenize(data)
text = nltk.Text(tokens)
words = [w.lower() for w in text]
print words #to print the tokens
for a in words:
print a
syns = wn.synsets(a)
print "synsets:", syns
for s in syns:
for l in s.lemmas:
print l.name
print s.definition
print s.examples
me da el siguiente resultado:
flabbergasted
['flabbergasted']
flabbergasted
synsets: [Synset('flabbergast.v.01'), Synset('dumbfounded.s.01')]
flabbergast
boggle
bowl_over
overcome with amazement
['This boggles the mind!']
dumbfounded
dumfounded
flabbergasted
stupefied
thunderstruck
dumbstruck
dumbstricken
as if struck dumb with astonishment and surprise
['a circle of policement stood dumbfounded by her denial of having seen the accident', 'the flabbergasted aldermen were speechless', 'was thunderstruck by the news of his promotion']
¿Hay una manera de recuperar la parte del discurso junto con el grupo de nombres lemma?
Si se vuelva a conectar a SO, usted debe aceptar Andrey respuesta, esp. ya que él no solo respondió, sino que también respondió a sus comentarios para ayudarlo. –