Вы можете использовать spacyr
, который является R-оболочкой для пакета Python spaCy
.
Примечание: вам придется
library(spacyr)
spacy_initialize(python_executable = '/path/to/python')
Тогда для ваших терминов:
Terms <- data.frame(Term = c("unit",
"determine",
"generate",
"digital",
"mount",
"control",
"position",
"input",
"output",
"user"), stringsAsFactors = FALSE)
Используйте функцию spacy_parse()
, чтобы пометить ваши термины и добавить их к вашему фрейму данных:
Terms$POS_TAG <- spacy_parse(Terms$Term)$pos
Результат:
Term POS_TAG
1 unit NOUN
2 determine VERB
3 generate VERB
4 digital ADJ
5 mount VERB
6 control NOUN
7 position NOUN
8 input NOUN
9 output NOUN
10 user NOUN