Я использую функцию pairwise_cor для генерации корреляций слов в тексте. Проблема в том, что выходные данные содержат повторяющиеся строки, если учитывать комбинацию двух столбцов. Я хочу отфильтровать дублирующиеся строки.
Вот чрезвычайно упрощенный пример:
item1 <- c("dog", "cat", "horse", "cow", "chicken", "sheep")
item2 <- c("cat", "dog", "cow", "horse", "sheep", "chicken")
correlation <- c(2,2,3,3,4,4)
df <- cbind.data.frame(item1, item2, correlation)
df
item1 item2 correlation
1 dog cat 2
2 cat dog 2
3 horse cow 3
4 cow horse 3
5 chicken sheep 4
6 sheep chicken 4
Таким образом, строки 1 и 2 одинаковы, только с триггерами item1 и item2. И то же самое для строк 3 и 4, а также для строк 5 и 6.
Я хочу, чтобы выходной кадр данных после фильтрации был:
item1 item2 correlation
1 dog cat 2
2 horse cow 3
3 chicken sheep 4
Это не просто вопрос использования unique (), по крайней мере, я могу понять.