Как найти и удалить слова, которые имеют низкие и высокие значения idf? - PullRequest
0 голосов
/ 15 мая 2019

Я нахожу фильтрующие слова на основе их значений idf. У меня есть 36k слов в списке, и у меня есть значения idf 24k слов из списка. Теперь, как мне сопоставить каждое слово с их значениями idf, чтобы оно сталолегко фильтровать.

Я сохранил все уникальные слова (36 КБ) из кадра данных, и у меня есть значения IDF 24 из них

a=list(project_data['final_input_text'].str.split(' ', expand=True).stack().unique())

Я ожидаю, что слова сопоставлены с их значениями IDF,либо в словаре, либо в фрейме данных

...