У меня есть фрейм данных (называемый corpus
) с одним столбцом (tweet
) и 2 строками:
['check, tihs, out, this, bear, love, jumping, on, this, plant']
['i, can, t, bear, the, noise, from, that, power, plant, it, make, me, jump']
У меня есть список (называемый vocab
) уникальных слов в столбце :
['check',
'tihs',
'out',
'this',
'bear',
'love',
'jumping',
'on',
'plant',
'i',
'can',
't',
'the',
'noise',
'from',
'that',
'power',
'it',
'make',
'me',
'jump']
Я хочу добавить новый столбец для каждого слова в словаре. Я хочу, чтобы все значения для новых столбцов были равны нулю, за исключением случаев, когда tweet
содержит слово, и в этом случае я хочу, чтобы значение столбца слова было 1.
Поэтому я попытался запустить код ниже:
for word in vocab:
corpus[word] = 0
corpus.loc[corpus["tweet"].str.contains(word), word] = 1
... и была отображена следующая ошибка:
"None of [Float64Index([nan, nan], dtype='float64')] are in the [index]"
Как я могу проверить, содержит ли твит слово, а затем, если да, установите значение нового столбца для слова до 1?