Процедуры для предложения альтернатив - PullRequest
2 голосов
/ 01 июля 2010

Мне было поручено разработать процедуру, которая будет предлагать альтернативные доменные имена для регистрации, если первоначально запрошенное доменное имя клиента уже зарегистрировано.

Первый шаг, который я думаю, состоит в том, чтобы разделить запрошенный домен обратно на биты, чтобы я мог найти альтернативные варианты.

например.mybigredtruck.com будет разбит на «мой», «большой», «красный» и «грузовик»

Тогда мне понадобится какой-то способ найти альтернативы для них.

Кто-нибудь знает какие-либо методы, компоненты / веб-сервисы, которые могут выполнять любые из этих функций.Любые идеи будут с благодарностью приняты.

Ответы [ 2 ]

1 голос
/ 10 июля 2010

Вот хорошее место, чтобы начать с подходящего алгоритма:

  • Получить словарь слов

  • Удаление неалфавитных символов из входная строка

  • Удалите расширение TLD из
    входная строка

  • Предполагается, что введенный текст написан правильно, чтобы сопоставить его с словарная статья; если это не так матч (в случае неограниченного составные слова) тогда попробуйте на один меньше символ в цикле, пока не совпадет. Храните матч, но ищите все другие матчи. Сделайте то же самое для остаток строки.

Правильное совпадение будет тем, где сопоставляются все подстроки полной входной строки, например, wwww.soilofgarden.com = 'ground of garden', а не 'так ?? сада '

0 голосов
/ 01 июля 2010

Наиболее распространенная реализация алгоритмов предложения, которую я видел, состоит в добавлении или добавлении соответствующих слов. Для доменных имен наиболее распространенным является изменение домена верхнего уровня (.com, .net, .gov и т. Д.).

Что касается разбиения строки без разделителя на наиболее вероятные английские слова, я думаю, что у вас может быть трудное время.

Поиск Google "mybigredtruck" не предлагает "мой большой красный грузовик" в качестве альтернативного поиска. Для меня это означает, что алгоритм чрезвычайно сложен, если он вообще существует.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...