Я хотел бы спросить, возможно ли извлечь из существительного + существительное или (прилаг. | Существительное) + существительное в пакете R openNLP? То есть я хотел бы использовать лингвистическую фильтрацию для извлечения фраз-кандидатов из имен существительных.Не могли бы вы указать мне, как это сделать?Большое спасибо.
Спасибо за ответы.Вот код:
library("openNLP")
acq <- "Gulf Applied Technologies Inc said it sold its subsidiaries engaged in
pipeline and terminal operations for 12.2 mln dlrs. The company said
the sale is subject to certain post closing adjustments,
which it did not explain. Reuter."
acqTag <- tagPOS(acq)
acqTagSplit = strsplit(acqTag," ")
acqTagSplit
qq = 0
tag = 0
for (i in 1:length(acqTagSplit[[1]])){
qq[i] <-strsplit(acqTagSplit[[1]][i],'/')
tag[i] = qq[i][[1]][2]
}
index = 0
k = 0
for (i in 1:(length(acqTagSplit[[1]])-1)) {
if ((tag[i] == "NN" && tag[i+1] == "NN") |
(tag[i] == "NNS" && tag[i+1] == "NNS") |
(tag[i] == "NNS" && tag[i+1] == "NN") |
(tag[i] == "NN" && tag[i+1] == "NNS") |
(tag[i] == "JJ" && tag[i+1] == "NN") |
(tag[i] == "JJ" && tag[i+1] == "NNS"))
{
k = k +1
index[k] = i
}
}
index
Считыватель может сослаться index на acqTagSplit для извлечения существительного + существительного или (прил | существительного) + извлечения существительного.(Код не оптимален, но работает. Если у вас есть идея, пожалуйста, дайте мне знать.)
Кроме того, у меня все еще есть проблема.
Justeson и Katz (1995) предложили еще одну лингвистическуюфильтрация для извлечения фраз кандидатов существительных:
((Adj | Существительное) + | ((Adj | Существительное) (Существительное-Подготовка)?) (Adj | Существительное) ) Существительное
Я не могу хорошо понять его значение.Не могли бы вы сделать мне одолжение, чтобы объяснить это или преобразовать такое представление в язык R.Большое спасибо.