Я думаю, нужно boolean indexing
с ~
для обратного условия с isin
для фильтрации списка слов с str.len
для фильтрации по длина слов и, если необходимо, условия цепочки на |
:
autores_atuais = pd.DataFrame({'Ementa':['Estado','another','be','de','def','bax']})
print (autores_atuais)
Ementa
0 Estado
1 another
2 be
3 de
4 def
5 bax
m1 = autores_atuais['Ementa'].isin(['Estado','another','next'])
m2 = autores_atuais['Ementa'].str.len() < 3
s = autores_atuais.loc[~(m1 | m2), 'Ementa']
print (s)
4 def
5 bax
Name: Ementa, dtype: object
Аналогичная альтернатива с &
для AND
и обратным первым условием на ~
и вторым на >=
:
m1 = ~autores_atuais['Ementa'].isin(['Estado','another','next'])
m2 = autores_atuais['Ementa'].str.len() >= 3
s = autores_atuais.loc[m1 & m2, 'Ementa']
print (s)
4 def
5 bax
Name: Ementa, dtype: object
wordcloud = WordCloud().generate(' '.join(s))