Алгоритм сравнения строк без золотого стандарта ("BEST"). Существует довольно много строковых алгоритмов подобия , основанных на различных предположениях. Мера подобия принимает две строки и возвращает число, указывающее, насколько похожи строки.
Используя меру сходства, вы можете сравнить, насколько равны данные строки всем строкам в вашем массиве. Сходство - это число, и вы можете легко выбрать строку с наилучшим соответствием, даже , если данная строка и строка в массиве не идентичны .
Также можно ввести порог отсечки , например, если ни одна строка не похожа достаточно на данную строку, ваш алгоритм может обнаружить это.
Популярной мерой сходства является расстояние Левенштейна , где подсчитывается количество изменений, дополнений и удалений символов для перехода от одной строки к другой.
Расстояние Левенштейна можно легко вычислить в c #, см., Например, эту ссылку для примера кода.