Я должен создать набор данных из некоторых текстовых файлов, записав их как векторы функций.
Примерно так:
doc1: 1,0.45 6,0.001 94,0.1 ...
doc2: 3,0.5 98,0.2 ...
...
каждая позиция вектора представляет слово, а оценка дается чем-то вроде TF-IDF.
Знаете ли вы какую-нибудь библиотеку / инструмент / что-нибудь для этого? (Java лучше)