Как получить количество общих слов для каждого столбца (матричный формат) в кадре данных pandas - PullRequest
0 голосов
/ 30 марта 2020

У меня есть фрейм данных с 16 столбцами и 2500 строками, и каждый столбец содержит 2500 разных слов. Я хочу рассчитать количество общих слов, которые соответствуют каждому столбцу. Результат может быть в форме путаницы. Как мы можем сделать это с pandas?

1 Ответ

0 голосов
/ 30 марта 2020

Ваш вопрос немного сбивает с толку, но я думаю, это то, что вы имеете в виду:

from itertools import combinations

confustion_matrix = pd.DataFrame(index=df.columns, columns=df.columns)

for col1, col2 in [*combinations(df.columns, 2)]:
     confustion_matrix.loc[col1, col2] = len(set(df[col1]).intersection(set(df[col2]))
     confustion_matrix.loc[col2, col1] = len(set(df[col1]).intersection(set(df[col2]))
...