Как сопоставить значения TFIDF с оригинальными словами - PullRequest
1 голос
/ 13 мая 2019

Я следовал этому примеру для вычисления TFIDF каждого слова в моих документах.Однако мой окончательный вывод выглядит примерно так (что, очевидно, нормально, поскольку я использую HashingTF):

(262144,[24856,31066,96984,119418,143328,176968,193347,223999,243191,245270,250475],[2.3513752571634776,1.9459101490553132,1.9459101490553132,2.3513752571634776,1.4350845252893227,2.3513752571634776,2.3513752571634776,1.9459101490553132,3.8918202981106265,1.9459101490553132,2.3513752571634776])
(262144,[21028,31066,71524,72609,116873,140075,142830,155149,222394,226568,245044],[1.9459101490553132,1.9459101490553132,1.6582280766035324,2.3513752571634776,2.3513752571634776,1.9459101490553132,1.9459101490553132,2.3513752571634776,1.9459101490553132,1.252762968495368,1.9459101490553132])

Существует ли какой-либо API, который сопоставляет слово со значением TFIDF, пожалуйста?

...