Расчет ИДФ - PullRequest
       30

Расчет ИДФ

0 голосов
/ 05 сентября 2018

Привет, я играл с TFIDF и смог выработать TF. Я хочу разработать IDF сейчас, взяв журнал общего количества документов / нет документов с термином t в нем.

Моя проблема в том, что мои данные сохранены в кадре данных. Столбец под названием N_grams содержит все мои термины в документе

Doc   N_grams
0     ['a', 'I was', 'going'....]
1     ['I', 'love', 'the', 'sunshine', 'in summer']
...

Как вы предлагаете мне получить число документов с термином t в нем?

...