Есть несколько таких файлов:
sample_a.txt содержащий:
a
b
c
sample_b.txt содержащий:
b
w
e
sample_ c .txt содержащий:
a
m
n
Я хочу сделать матрицу отсутствия / присутствия вот так:
a b c w e m n
sample_a 1 1 1 0 0 0 0
sample_b 0 1 0 1 1 0 0
sample_c 1 0 0 0 0 1 1
Я знаю грязный и глупый способ решить эту проблему: составить список всех возможных букв в этих файлах, а затем итеративно сравнить каждую строку каждого файла с этой «библиотекой», заполнить окончательную матрицу по индексу. Но я думаю, есть более разумное решение. Есть идеи?
Upd: файлы sample могут иметь разную длину.