Сортировка строк в Python на основе визуального сходства - PullRequest
0 голосов
/ 22 ноября 2018

Я ищу сортировку элементов в списке или массиве на основе их визуального сходства.Например, для строк ниже:

MyStrings=["Hello","Reed","Hell","Olleh","Red","Hello2"]

Я бы ожидал, что отсортированный список будет:

["Hello","Hell","Hello2","Red","Reed","Olleh"]

Обратите внимание, что мое желание выполнено, если подобные элементы находятся рядом друг с другом.,Например, приведенный ниже может также работать совершенно нормально:

["Red","Reed","Hell","Hello","Hello2,"Olleh"]

Я знаю, что функция расстояния Левенштейна в сочетании с функцией сортировки может быть полезной, но я открыт для любых других предложений.

Я бы дал дополнительный контекст, но вы можете спокойно их игнорировать, если это излишне усложнит ситуацию.Эти строки являются атрибутами элемента, который будет находиться на оси X модели регрессии.Поскольку они не имеют числового характера, мне нужно иметь логический способ сортировки и размещения их по оси X.Если они перечислены случайным образом, ожидаемая тенденция по оси Y не будет реализована для работы модели.Я также рассматриваю возможность подачи этих элементов в нейронную сеть.Но опять-таки, отображение строки в числовые значения становится очень важным.На мой взгляд, функция отображения все равно должна будет применять ту же логику сортировки аналогичным образом.Я был бы очень признателен за понимание этой проблемы

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...