Я ищу сортировку элементов в списке или массиве на основе их визуального сходства.Например, для строк ниже:
MyStrings=["Hello","Reed","Hell","Olleh","Red","Hello2"]
Я бы ожидал, что отсортированный список будет:
["Hello","Hell","Hello2","Red","Reed","Olleh"]
Обратите внимание, что мое желание выполнено, если подобные элементы находятся рядом друг с другом.,Например, приведенный ниже может также работать совершенно нормально:
["Red","Reed","Hell","Hello","Hello2,"Olleh"]
Я знаю, что функция расстояния Левенштейна в сочетании с функцией сортировки может быть полезной, но я открыт для любых других предложений.
Я бы дал дополнительный контекст, но вы можете спокойно их игнорировать, если это излишне усложнит ситуацию.Эти строки являются атрибутами элемента, который будет находиться на оси X модели регрессии.Поскольку они не имеют числового характера, мне нужно иметь логический способ сортировки и размещения их по оси X.Если они перечислены случайным образом, ожидаемая тенденция по оси Y не будет реализована для работы модели.Я также рассматриваю возможность подачи этих элементов в нейронную сеть.Но опять-таки, отображение строки в числовые значения становится очень важным.На мой взгляд, функция отображения все равно должна будет применять ту же логику сортировки аналогичным образом.Я был бы очень признателен за понимание этой проблемы