Как узнать, какой набор списков наиболее похож на оригинальный? - PullRequest
1 голос
/ 24 октября 2011

Я пытаюсь получить числа из некоторых упорядоченных списков, например, список может быть 'ABCD E', а другой: 'CBEADHGFIJ K'

Итак, у меня есть некоторые доверенные данные, которые являютсянабор упорядоченных списков, каждый из которых связан со строкой, и я пытаюсь оценить, какой автоматический способ является лучшим для извлечения тех же списков по заданной строке, чтобы список соответствовал (или был максимально похож) списку того же самогоСтрока в моих надежных данных.

У меня нет сильных знаний в области статистики, я надеялся, что вы сможете сослаться на методы, которые я могу использовать, и ссылки или ресурсы, которые помогут мне понять, как их реализовать.

1 Ответ

1 голос
/ 19 мая 2012

Решение будет зависеть от вашего представления о сходстве. Одной из популярных мер подобия является расстояние Левенштейна (количество добавлений, удалений и модификаций букв, необходимых для получения одной строки из другой).

...