Вы можете сделать explode
, затем get_dummies
, sum
по level
, затем sum
по столбцам, если строка возвращает значение больше 2, мы должны выбрать
df[df["A"].explode().str.get_dummies().\
sum(level=0).gt(0).reindex(columns=word_list).sum(axis=1).ge(2)]
Или мыможно сделать sklearn.MultiLabelBinarizer
from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()
s=pd.DataFrame(mlb.fit_transform(df['A']),columns=mlb.classes_, index=df.index)
df[s.sum(axis=1).gt(1)]