Я пишу настольный пользовательский интерфейс (.Net WinForms), чтобы помочь фотографу очистить метаданные своего изображения. Есть список из 66k + фраз. Кто-нибудь может предложить хороший открытый компонент с открытым исходным кодом .NET, который я могу использовать, который использует какой-то алгоритм для определения потенциальных кандидатов для консолидации? Например, могут быть две или более записи, которые на самом деле являются одним и тем же словом или фразой, которые отличаются только пробелом или пунктуацией или даже небольшим неправильным написанием. В конечном счете, приложение будет полагаться на пользователя для объединения фраз, но наличие эффективного способа автоматического поиска потенциальных кандидатов окажется бесценным.