Вам нужно будет использовать библиотеку НЛП, такую как gensim. Вы можете следовать первому примеру на странице TF-IDF .
В основном вы хотите использовать столбец «Комментарий» в качестве корпуса, а затем рассчитать TF-IDF для каждогострока в этом столбце.
from gensim.models import TfidfModel
from gensim.corpora import Dictionary
doc_list = []
for comment in df['comment']:
doc_list.append(comment)
dct = Dictionary(doc_list)
corpus = [dct.doc2bow(line) for comment in df['comment']]
model = TfidfModel(corpus)
Затем вы можете перебрать свой корпус и найти значения TF-IDF. В этом коде могут быть некоторые неточности, так как я не могу тестировать некоторое время, но общая идея должна работать :).