Как завершить составленный корпус из словаря, используя функцию stemCompletion (пакет tm) - PullRequest
0 голосов
/ 31 мая 2019

Я использую пакет tm для анализа текста восстановительных данных, Чтение данных во фрейм данных, преобразование в объект Корпус, применение различных методов для очистки данных с использованием более низких значений provWhitespace, удаление слов-заглушек и т. Д.

Взятыеобъекта Corpus для stemCompletion.

Выполненный stemDocument с использованием функции tm_map, слова моего объекта были получены

получил ожидаемые результаты.

Когда я запускаю операцию stemCompletion с использованием функции tm_map,он не работает и получил ошибку ниже

corp <- VCorpus (VectorSource (ccm_1 $ abstract)) </p>

corp Метаданные: специфичные для корпуса: 0, уровень документа (проиндексированный): 0Содержание: документы: 644

corp1 <- tm_map (corp, stemDocument) </p>

corp2 <- tm_map (corp1, content_transformer (stemCompletion), словарь = corp, lazy = TRUE) </p>

corp2 [[3]] $ content

[1] NA

Как устранить эту ошибку?

...