У меня есть фрейм данных с 12 столбцами (категории лекарств), где одинаковые значения (название категории лекарств) могут появляться в разных столбцах.
DRG01 DRG02 ... DRG11 DRG12
0 AMOXYCILLIN ORAL SOLIDS AMOEBICIDES ORAL SOLIDS ... NaN NaN
1 VITAMIN DROPS NaN ... NaN NaN
2 AMOXYCILLIN ORAL SOLIDS ANTIHISTAMINES ORAL LIQ ... NaN NaN
3 AMOEBICIDES ORAL LIQUID NaN ... NaN NaN
... ... ... ... ... ...
81531 NaN NaN ... NaN NaN
[81532 rows x 12 columns]
Моя цель - создать матрицу (2D-массив) - со строками и столбцами, состоящими из уникальных названий категорий лекарств (игнорирование / удаление значений NaN). Значением ячеек будет количество раз, когда эти названия категорий лекарств появляются вместе в строке. По сути, я пытаюсь достичь чего-то, как показано ниже:
AMOXYCILLIN ORAL SOLIDS AMOEBICIDES ORAL SOLIDS ANTIHISTAMINES ORALLIQ VITAM..
AMOXYCILLIN ORAL SOLIDS 0 1 1 0
AMOEBICIDES ORAL SOLIDS 1 1 0 0
ANTIHISTAMINES ORAL LIQ 1 0 0 0
VITAMIN DROPS 0 0 0 1
.....
.....