Рассчитать TFIDF из CSV-ввода - PullRequest
       10

Рассчитать TFIDF из CSV-ввода

0 голосов
/ 31 октября 2019

У меня есть CSV, который содержит как показано ниже.

Владелец, Комментарии Owner1, Python - это фильм ужасов 2000 года, созданный для телевидения, режиссер Ричард Клэбо

Owner2, Python, изгреческое слово (πύθων / πύθωνας), является родом неядовитых питонов

Владелец3, Colt Python - это револьвер калибра .357 Magnum, ранее производимый Colt's. .

.

.

.

Мне нужно найти TFIDF из трех лучших слов в комментариях для каждого владельца.

Вывод должен выглядеть следующим образом:

TFID владельца 1:

Слово: фильмы TF-IDF: 0,00997

Слово: TF-IDF для телевидения: 0,00665

Может кто-нибудь предложить мне код или алгоритм для этой проблемы?

...