Так что в настоящее время я работаю с использованием SecondString для нечеткого сопоставления строк, где у меня есть большой словарь для сравнения (с каждой записью в словаре связан связанный неуникальный идентификатор).В настоящее время я использую hashMap для хранения этого словаря.
Когда я хочу выполнить нечеткое сопоставление строк, я сначала проверяю, находится ли строка в hashMap, а затем перебираю все остальные потенциальные ключи, вычисляя сходство строк и сохраняя пару k, v/ с с наибольшим сходством.В зависимости от того, какой словарь я использую, это может занять много времени (12330 - 1800035 записей).Есть ли способ ускорить это или сделать это быстрее?В настоящее время я пишу функцию / таблицу памятки как способ ускорить это, но может ли кто-нибудь еще придумать лучший способ улучшить скорость этого?Может быть, другая структура или что-то еще, что я скучаю.
Большое спасибо заранее,
Натан