Анализ настроений PDF-файлов в R - PullRequest
0 голосов
/ 17 января 2019

Я использую пакет «SentimentAnalysis» для анализа PDF-файла, но его последующую страницу за страницей, а не в целом.

Я читаю PDF-файлы, используя пакет "pdftools", ниже приведен код:

Затем я использую «sentimentAnalysis», чтобы получить чувство того же самого, но оно приходит как:

install.packages ( "PDFTools") библиотека (PDFTools) pdf_file = file.path ("E: / IIM B FPM / Term 6 / CF-2 / RBI Articles", "010116.pdf") text = pdf_text (pdf_file)

install.packages ( "SentimentAnalysis") библиотека (SentimentAnalysis)

a = SentimentAnalysis :: analySentiment (text, language = "english") SentimentAnalysis :: convertToBinaryResponse (а)

Фактический результат:

WordCount   SentimentGI NegativityGI    PositivityGI

1 181 положительный 0,11049724 0,1381215 2 262 положительных 0.11832061 0,2099237 3 265 положительных 0,17358491 0,2301887 4 233 положительных 0,09012876 0,1459227 5 201 положительный 0,07960199 0,1542289 6 203 положительных 0,11330049 0,1477833 7 237 положительных 0,0464135 0,185654 8 228 положительных 0,10526316 0,1973684 9 75 положительный 0,13333333 0,3333333

Ожидаемый результат:

WordCount SentimentGI NegativityGI PostivityGI


Это должен быть только один, поскольку это один документ. это дает ответы для каждой страницы в документе.

В документе 9 страниц.

Подскажите, пожалуйста, как действовать

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...