R сравнил слова между документами - PullRequest
0 голосов
/ 08 ноября 2018

У меня есть два текста, которые я конвертирую в пакет слов.Одна сумка слов для текста 1, одна сумка слов для текста 2.

Я пытаюсь найти способ сопоставить слова обоих документов вместе, чтобы понять, насколько они различны.

Один из способов, которым я думал, - это иметь два барплота один над другим и видеть, в каких словах (количестве слов) они совпадают и в чем они отличаются.

Мне удалось запустить простой гистограмму изруководство здесь http://www.sthda.com/english/wiki/text-mining-and-word-cloud-fundamentals-in-r-5-simple-steps-you-should-know (см. последний график)

но теперь у меня есть два столбчатых графика, которые я не могу напрямую сравнить.

Я думал, например, собрать слова вместена том же участке.Либо в виде двух гистограмм одна над другой, либо создайте некоторую двумерную кластеризацию, показывающую области слов, в которых два документа различны, но также их перекрывающиеся области.

Какой пакет вы предложите, и процедуру для сравнения таких двух пакетов слов?Спасибо, Алекс

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...