Удаление абзацев в txt файле с помощью R - PullRequest
0 голосов
/ 03 августа 2020

Используя функцию readLines (), я импортировал текстовый файл, в котором хранятся предложения в нескольких абзацах, например:

sentence1. sentence2. sentence3.

sentence4. sentence5.

sentence6. sentence7.
 

Для дальнейшего анализа я хотел бы применить функцию sentiment_by () к моему импортированный txt файл. Когда я это делаю, я получаю значения тональности для каждого абзаца, а не для всего текстового файла. Поэтому я хочу удалить абзацы в текстовом файле, чтобы получить только один коэффициент тональности. Для этого мне нужно преобразовать свой текстовый файл так, чтобы текст выглядел следующим образом:

sentence1. sentence2. sentence3. sentence4. sentence5. sentence6. sentence7.

Если бы я запустил функцию sentiment_by () для этого фрагмента текста, это дало бы один коэффициент для весь текст. Есть ли способ преобразовать текст, удалив абзацы в R, прежде чем продолжить анализ?

1 Ответ

0 голосов
/ 03 августа 2020

Если каждый абзац, который вы захватываете, является вектором символов, вы можете убрать табуляции и новые строки (и другие пробельные символы, если необходимо). .

...