Попробуйте использовать частотный дикт.Если ваши столбцы можно просматривать как список списков:
data = [[0, "text samle 1"], [0, "text sample 2"], [1, "text sample 3"]]
... тогда вы можете:
fd0 = dict()
fd1 = dict()
for list_item in data:
associated_value = list_item[0]
#note the split(' ') splits the string into a list of words
for word in list_item[1].split(' '):
if associated_value == 0:
fd0[word] = 1 if word not in fd0 else fd0[word] + 1
elif associated_value == 1:
fd1[word] = 1 if word not in fd1 else fd1[word] + 1
В конце цикла ваш fd0 должен иметь частоту для метки0 и fd1 должны иметь частоту для метки 1.