У меня есть список текстовых файлов в моем каталоге, все из которых являются документами с несколькими параграфами. Я хочу прочитать эти документы и провести анализ настроений.
Например, у меня есть один текстовый документ data/hello.txt
с текстом, как показано ниже:
"Hello world.
This is an apple.
That is an orange"
Я прочитал документ, как показано ниже (также может быть несколько документов):
docs <- VCorpus(DirSource('./data/hello.txt'))
Когда я смотрю на содержимое документа docs[[1]]$content
Кажется, что это символьный вектор.
[1] "hello world" "this is apple." ""
[4] "That is an orange. " ""
У меня вопрос, как я могу читать в этих документах, чтобы в каждом документе абзацы объединялись в одну символьную строку, чтобы я мог использовать ее для анализа настроений. (VCorpus из тм пакета)
Большое спасибо.