Добрый день, это своего рода странный вопрос, поэтому я постараюсь объяснить его настолько хорошо, насколько смогу.
У меня 2 входа, несколько твитов в списке ['tweet 1', 'tweet 2',...]
и словарь с{'word1': value1;'word 2': value2;...}
.
Представьте, что первый твит выглядит так:
«Я люблю есть картошку»
И из 500 слов в словаре естьэто значение для
{...; 'love': 3; ...; 'potato': -1; ...}.
Theслова «я», «еда» не включены в этот словарь.Таким образом, для каждого твита, который у меня есть, мне нужно искать, какие слова НЕ включены в него, чтобы дать им оценку значения твита.
Пример: я люблю есть картошку = 2
, поэтому
Я = 2
Еда = 2
Я начал с этого:
tweet=[]
values={}
for list in tweet:
divided_tweet=list.split()
и получить счетЯ использую это
[sum(valores.get(j, 0) for j in i.split()) for i in divided_tweet]
Подводя итог, мне нужно искать каждый твит, каждое слово, которого нет в словаре, чтобы дать ему значение.
Распечатка должна быть:
'I':2
'eating':2
(следующий твит)
'Inexistent word #3':'score of tweet #2'
'Inexistent word #4':'score of tweet #2'
'Inexistent word #5':'score of tweet #2'
...
И так далее
Может ли кто-нибудь мне помочь?
Спасибо
PD: есть отрицательные и положительные значения