Я использую пакет «SentimentAnalysis» для анализа PDF-файла, но его последующую страницу за страницей, а не в целом.
Я читаю PDF-файлы, используя пакет "pdftools", ниже приведен код:
Затем я использую «sentimentAnalysis», чтобы получить чувство того же самого, но оно приходит как:
install.packages ( "PDFTools")
библиотека (PDFTools)
pdf_file = file.path ("E: / IIM B FPM / Term 6 / CF-2 / RBI Articles", "010116.pdf")
text = pdf_text (pdf_file)
install.packages ( "SentimentAnalysis")
библиотека (SentimentAnalysis)
a = SentimentAnalysis :: analySentiment (text, language = "english")
SentimentAnalysis :: convertToBinaryResponse (а)
Фактический результат:
WordCount SentimentGI NegativityGI PositivityGI
1 181 положительный 0,11049724 0,1381215
2 262 положительных 0.11832061 0,2099237
3 265 положительных 0,17358491 0,2301887
4 233 положительных 0,09012876 0,1459227
5 201 положительный 0,07960199 0,1542289
6 203 положительных 0,11330049 0,1477833
7 237 положительных 0,0464135 0,185654
8 228 положительных 0,10526316 0,1973684
9 75 положительный 0,13333333 0,3333333
Ожидаемый результат:
WordCount SentimentGI NegativityGI PostivityGI
Это должен быть только один, поскольку это один документ. это дает ответы для каждой страницы в документе.
В документе 9 страниц.
Подскажите, пожалуйста, как действовать