Я думал об алгоритме, который в большинстве случаев должен был бы угадать значение английского домена .com.
Чтобы это работало, я хочу выполнитьтесты, в которых рассматриваются сильные и слабые стороны английского домена .com.
Простая система, основанная на точках, - это то, что я имел в виду, где каждому свойству домена можно придать определенный вес, чтобы оценить его важность.
Я имел в виду эти свойства:
длина символа домена
Например.изначально добавлено 20 баллов.Если домен содержит 4 или менее символов, очки не вычитаются.Для каждого дополнительного символа одна или несколько точек вычитаются на экспоненциальной основе (чем больше символов, тем выше штраф).
доменные символы
Например.изначально добавлено 20 баллов.Если домен только алфавитный, точки не вычитаются.Для каждого неалфавитного символа вычитается X точек (снова экспоненциальное увеличение).
слова доменного имени
Сканирование в большой автономной английской базе данных, включая неформальныеречь, напримерслова типа «твит» должны быть распознаны.
Вопрос 1: где я могу получить современный список английских слов для использования в таком приложении?Эти списки доступны бесплатно?Есть ли такие списки с неформальными словами?
Чем больше слов будет найдено для каждого символа, тем больше будет добавлено очков.Итак, домен с большим количеством символов по-прежнему не наберет много очков.
слова, уровень рекламы
Я считаю, что это сложно, но этодолжна быть причиной, чтобы отличать идеальные, но скучные домены от идеальных и интересных доменов.
Например, следующий домен, вероятно, не так ценен: www.peanutgalaxy.com
Алгоритм должен определять, чтоарахис и галактики не очень популярные темы в Интернете.Это всего лишь пример.
С другой стороны, домен, такой как www.shopdeals.com, должен подать сигнал к тесту обмана, поскольку магазины и предложения довольно популярны в Интернете.
Первоначально я хотел посмотреть, как часто эти ключевые слова являются ссылками в Интернете, предпочтительно с какой-либо базой данных.
Вопрос 2: эта логика ошибочна или это тест уровня рекламы?есть ли заслуга?
Вопрос 3: доступны ли такие «базы данных рекламы»?Или есть что-то еще, что может работать в автономном режиме?Проблема с напр.запрос к Google заключается в том, что для проверки требуется много запросов.
ошибки правописания доменного имени
Доменыкак "freemoneyz.com" и т. д., как правило, (обратите внимание, я делаю много предположений в этом посте, но я считаю, что это необходимо) не имеет значения из-за орфографических ошибок.
Вопрос 4: есть ли автономные API для проверки орфографических ошибок, желательно в javascript или в какой-либо базе данных, которую я могу использовать, чтобы взаимодействовать с самим собой.Или здесь также должен помочь список слов?
использование согласных, гласных и т. Д.
домен, который легко произносить (например,. Google) обычно гораздо более ценный, чем тот, который не является (например, Gkyld).
Вопрос 5: как можно проверить такую произношенность?Вы проверяете согласные, гласные и т. Д.?Что имеет ценный домен?Была ли какая-либо работа в этой области, где я должен искать?
Это то, что я придумал, что подводит меня к моим последним двум вопросам.1091 * Вопрос 6: можете ли вы назвать еще какие-то сильные или слабые стороны английского домена .com?Который?Как бы вы это реализовали?
Вопрос 7: считаете ли вы, что эта идея имеет какие-либо достоинства или все, или я слишком наивен?Что-нибудь, о чем я должен знать, читать или слышать?Предложения / комментарии
Спасибо!