Преобразование доменного имени в название компании? - PullRequest
16 голосов
/ 08 августа 2009

Есть ли способ / онлайн-сервис / база данных для преобразования доменного имени, такого как maxmind.com, в название компании "Max Mind Inc." ?

Если нет, то может ли кто-нибудь предложить логический программный подход к проблеме?

Я думал о следующих строках:

  1. Взять доменное имя
  2. Посетите веб-сайт - попробуйте найти название компании (не знаете, как, хотя?)
  3. Сделать Whois - если доступно название компании, используйте это (может не всегда работать)

Есть предложения?

Ответы [ 4 ]

16 голосов
/ 08 августа 2009

Волосатый вопрос!

Запрос WHOIS будет неэффективным в ряде случаев: общие серверы, Akamai или другие CDN, домены, не связанные с компанией, и т. Д. Я пришел из веб-агентства и могу сказать, что большой цифра) процент компаний, не заботящихся о владении всеми своими доменными именами - они разрешают веб-агентству заниматься этим, особенно в отношении небольших промо-сайтов.

Мой лучший совет будет такой. Получить домашнюю страницу или карту сайта, если доступно. Ищите символ авторского права. Это может быть в ограниченном количестве форм: «& copy;», «(c)», «©». Также в форме заявления обычно указывается либо «компания (с) год», либо «(с) год компания». От этого вы можете получить компанию.

Это не будет работать во всех случаях, но, вероятно, ваш лучший вариант.

6 голосов
/ 08 августа 2009

Я бы советовал предложение Sklivvz по крайней мере с проверкой тега заголовка и, если возможно, с записями Whois.

Если вы анализируете уведомление об авторских правах на stackoverflow.com, вы либо получаете «stackoverflow.com», либо «stackoverflow.com LLC», и это не имеет значения.

В примере maxmind.com, если вы анализируете официальное уведомление «Copyright © 2009 MaxMind, Inc.» вы либо получите «MaxMind» или «MaxMind, Inc.», если в сочетании с заголовком «Геолокация и предотвращение мошенничества в Интернете от MaxMind» единственное слово, которое появляется в обоих местах, - это MaxMind.

Также domaintools.com разбивает доменное имя на слова (хотя каждый может изменить его), вы можете проанализировать эту страницу и получить «настоящее» имя, некоторые примеры:

http://whois.domaintools.com/maxmind.com = Max Mind
http://whois.domaintools.com/dabbledb.com = Dabble Db
http://whois.domaintools.com/domaintools.com = Domain Tools
http://whois.domaintools.com/stackoverflow.com = Stack Overflow
http://whois.domaintools.com/joelonsoftware.com = Joel On Software

aboutus.org также может быть очень хорошим справочником при наличии:

http://aboutus.org/maxmind.com = MaxMind LLC 
http://aboutus.org/dabbledb.com = ...
http://aboutus.org/domaintools.com = DomainTools.com 
http://aboutus.org/stackoverflow.com = Stack Overflow AG
http://aboutus.org/joelonsoftware.com = Fog Creek Software Inc.
5 голосов
/ 20 июля 2015

Проверьте API Clearbit, который может получить название компании из доменного имени: https://clearbit.com/#features

Также на ум приходит LinkedIn.

0 голосов
/ 08 августа 2009

2) я думаю, что пункт 2 невозможен. заголовок страницы не всегда содержит название компании. и другие элементы могут быть в другом месте на странице (если на самом деле есть тег с названием компании, а не просто изображение). Интернет для такого поиска динамичен.

3) действительно ли есть страница компании без соответствующей записи в whois? Есть много доменов от частных лиц (без названия компании). блог на собственном домене - такой пример. Вы найдете имя зарегистрированного человека в whois, но не знаете, является ли этот человек автором страницы.

зачем вам такой сервис, а не только использование доменного имени?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...