Me gustaría preguntar si es posible extraer sustantivo + sustantivo o (adj | noun) + sustantivo en el paquete R openNLP? Es decir, me gustaría utilizar el filtrado lingüístico para extraer frases nominales candidatas. ¿Podrías dirigirme cómo hacerlo? Muchas gracias.Extrayendo sustantivo + sustantivo o (adj | noun) + sustantivo de Texto
Gracias por las respuestas. Aquí está el código:
library("openNLP")
acq <- "Gulf Applied Technologies Inc said it sold its subsidiaries engaged in
pipeline and terminal operations for 12.2 mln dlrs. The company said
the sale is subject to certain post closing adjustments,
which it did not explain. Reuter."
acqTag <- tagPOS(acq)
acqTagSplit = strsplit(acqTag," ")
acqTagSplit
qq = 0
tag = 0
for (i in 1:length(acqTagSplit[[1]])){
qq[i] <-strsplit(acqTagSplit[[1]][i],'/')
tag[i] = qq[i][[1]][2]
}
index = 0
k = 0
for (i in 1:(length(acqTagSplit[[1]])-1)) {
if ((tag[i] == "NN" && tag[i+1] == "NN") |
(tag[i] == "NNS" && tag[i+1] == "NNS") |
(tag[i] == "NNS" && tag[i+1] == "NN") |
(tag[i] == "NN" && tag[i+1] == "NNS") |
(tag[i] == "JJ" && tag[i+1] == "NN") |
(tag[i] == "JJ" && tag[i+1] == "NNS"))
{
k = k +1
index[k] = i
}
}
index
lector puede referirse índice de en acqTagSplit hacer sustantivo + sustantivo o (adj | sustantivo) + sustantivo extractation. (El código no es óptimo pero funciona. Si tiene alguna idea, hágamelo saber)
Además, todavía tengo un problema.
Justeson y Katz (1995) proponen otra filtrado lingüística para extraer candidatos frases nominales:?
((Adj | Sustantivo) + | ((Adj | Sustantivo) (Noun-Prep)) (Adj | Sustantivo)) Sustantivo
No puedo entender bien su significado. ¿Podría hacerme un favor para explicarlo o transformar esa representación en el lenguaje R.? Muchas gracias.
Publicada lo que creo que es una solución limpia. Su solicitud posterior es una extensión considerable de la pregunta original. Creo que deberías cerrar esta y hacer otra pregunta. –
@DWin: Creo que no. Solo agrega algunas condiciones adicionales. Además, traducir eso a R sería una pregunta para los mineros de texto, no para los programadores. Sugiero que ssuhan lea el artículo de Justeson y Katz para entender su significado. –
@Joris: ¿Hubo un par de nuevos operadores "+" y "?" que no entendí Pensé que podrían traducir a regex de alguna manera, sin embargo, desconocido para mí, y la cita no estaba disponible en una búsqueda web. Así que pensé que el envío de publicaciones sería un mejor enfoque, ya que la OP original y mi esfuerzo de racionalización respondieron a la pregunta original. –