Sketch -
Разработка списка функций, уменьшающих размер английской строки.Упорядочить функции от наименее до самых непонятных.
Для каждой строки в v1
неоднократно применяйте функцию затемнения, пока она больше не сможет уменьшить размер строки, а затем переходите к следующей функции.
Когда желаемый размер x
достигнуто, убедитесь, что уменьшенная строка уникальна по отношению к строкам уже в v2
.Если это так, добавьте его к v2
, если нет, продолжайте применять функции затемнения.
Ниже приведены некоторые идеи для функций уменьшения размера, субъективно упорядоченных от наименьшего к наиболее скрывающему.(Случайный выбор предназначен для увеличения вероятности того, что уменьшенная строка будет уникальной.)
- Заменить случайное вхождение символов двух пробелов на один пробел
- Заменить случайное вхождениепунктуации с последующим пробелом с одним пробелом
- Удалить случайное слово из одного символа, которое также является членом списка уничтожений (например, "I", "a")
- Удалить двапроизвольное символьное слово, которое также является членом списка уничтожений (например, «an», «of»)
- Удаление произвольного трехсимвольного слова, которое также является членом списка уничтожений (например, «the»), "и")
- Заменить слово из пяти или более слов словом, состоящим из первых трех и последнего символа (например, «число» становится «numr», «цвета» становится «colrs»)
- Удалить гласный в случайном порядке
- Удалить слово, которое встречается в большом количестве строк в v1.Идея состоит в том, что очень распространенные слова имеют низкое значение.
- Переведите слово / фразу в более короткое слово "номерной знак" на основе словаря (тезауруса) (например, http://www.baac.net/michael/plates/index.html) * 1034.*
(Примечание: для двух последних функций потребуется доступ к исходной неизмененной строке и соответствия между неизмененными и измененными словами.)