Я пытаюсь реализовать векторизацию текстового файла ... Я создал словарь (уникальные слова во всех документах) ... Какой лучший способ реализовать это в Java?
Например -
В моем словаре есть следующие слова - {w1, w2, w3, w4}
И у меня есть 2 документа, каждый из которых имеет подмножество слов в словаре. Мне нужно записать в текстовый файл матрицу в виде -
1,3,4,0
0,0,2,1
Здесь каждая строка представляет документ, а значения представляют вхождение каждого слова в документ.
Можете ли вы предложить мне наиболее эффективный способ реализовать это на Java?