Вы можете сгенерировать новый фрейм данных, который объединяет слова, которые являются синонимами, и суммирует их количество.
Чтобы найти синонимы слов, вы можете использовать PyDictionary .
Затем вы можете вместе преобразовать фрейм данных в клубные синонимы. Например, если у вас есть:
"Not Cheap" = 4
"Costly" = 0
"Expensive" = 10
, вы можете преобразовать его в:
"Not Cheap/Costly/Expensive" = 14
Очевидно, что таким образом вы теряете некоторую информацию, но для ваших целей это может быть лучше подходит.