Мне нужно рассчитать частоту всех терминов внутри документа. Как я могу это сделать ? я не прошу коды. Я просто прошу совета. На самом деле я делаю некоторые вычисления сходства между документом и запросом. Я рассчитал частоту термина для запроса. Но я не знаю, как рассчитать частоту крачек для КАЖДОГО слова в документе. Кто-нибудь может направить меня? Спасибо за Ваше внимание.
Да, используйте HashMap для сохранения значений и просмотра файла, вы можете использовать Сканер
Вы можете использовать HashMap, где ключ - это ваш термин, а значение - его частота.Каждый раз, когда вы видите термин, вы увеличиваете значение.После того, как файл готов, у вас есть ваши номера.
В Java вам обязательно стоит остаться с HashMap<String, Integer>. Термины будут ключами HashMap, а термин - значением частоты.
HashMap<String, Integer>