У меня есть таблица с ключевыми словами, связанными со статьями, выглядит так:
article_id keyword
1 A
1 B
1 C
2 A
2 B
2 D
3 E
3 F
3 D
Мне нужно получить сводную таблицу:
A B C D E F
A - 2 1 1 0 0
B - - 1 1 0 0
C - - - 0 0 0
D - - - - 1 1
E - - - - - 1
F - - - - - -
Это означает, чтопара (A, B)
встречается в двух статьях (# 1 и # 2), пара (A, C)
встречается только в одной статье (# 1) и т. д.
Какой самый питонский способ сделать это?
Я пробовал сводные таблицы Pandas, но пока безуспешно.Просто не могу понять, как связать ключевые слова и идентификаторы статей.
Этот вопрос Создать матрицу смежности для двух столбцов в панде. не решает проблему.