¿Hay alguna manera de conseguir la palabra base en lugar de la palabra raíz para detener el uso de la PNL en R?palabra de base derivados en lugar de la palabra raíz derivada en I
Código:
> #Loading libraries
> library(tm)
> library(slam)
>
> #Vector
> Vec=c("happyness happies happys","sky skies")
>
> #Creating Corpus
> Txt=Corpus(VectorSource(Vec))
>
> #Stemming
> Txt=tm_map(Txt, stemDocument)
>
> #Checking result
> inspect(Txt)
A corpus with 2 text documents
The metadata consists of 2 tag-value pairs and a data frame
Available tags are:
create_date creator
Available variables in the data frame are:
MetaID
[[1]]
happi happi happi
[[2]]
sky sky
>
¿Puedo obtener base de la palabra "feliz" (palabra de base) en lugar de "happi" (palabra de raíz) para "happies happyness happys" utilizando R.
no estoy seguro acerca de R específicamente, pero en general necesita un analizador morpológico, por ejemplo, puede obtener este sistema operativo uno: http://seman.svn.sourceforge.net/viewvc/seman/trunk/Docs/Morph_UNIX.txt ? revision = 124 & view = markup –
Lo más probable es que no le interesen los tallos, sino un lematizador. hmmm podría compartir con ustedes mi propio lematizador abierto para inglés si así lo requieren. pero está escrito en python ... – alvas