У меня есть два текста, которые я конвертирую в пакет слов.Одна сумка слов для текста 1, одна сумка слов для текста 2.
Я пытаюсь найти способ сопоставить слова обоих документов вместе, чтобы понять, насколько они различны.
Один из способов, которым я думал, - это иметь два барплота один над другим и видеть, в каких словах (количестве слов) они совпадают и в чем они отличаются.
Мне удалось запустить простой гистограмму изруководство здесь http://www.sthda.com/english/wiki/text-mining-and-word-cloud-fundamentals-in-r-5-simple-steps-you-should-know (см. последний график)
но теперь у меня есть два столбчатых графика, которые я не могу напрямую сравнить.
Я думал, например, собрать слова вместена том же участке.Либо в виде двух гистограмм одна над другой, либо создайте некоторую двумерную кластеризацию, показывающую области слов, в которых два документа различны, но также их перекрывающиеся области.
Какой пакет вы предложите, и процедуру для сравнения таких двух пакетов слов?Спасибо, Алекс