Как мне найти все короткие URL, которые ссылаются на конкретный длинный URL? - PullRequest
0 голосов
/ 03 августа 2010

По сути, я хочу знать, сколько людей твитнули ссылку на URL-адрес, но, поскольку существуют десятки средств сокращения ссылок, я не вижу способа сделать это без доступа ко всем их URL-картам. Я нашел предыдущий вопрос здесь , но он был старше года и не имел новых ответов.

Итак, # 1, кто-нибудь знает сервис / API для этого?

И # 2, может кто-нибудь придумать способ выполнения этой задачи, кроме отправки длинного URL-адреса на все популярные сайты с сокращением ссылок?

PS- Я также открыт для комментариев о том, почему это невозможно или нецелесообразно.

Ответы [ 3 ]

3 голосов
/ 03 августа 2010

Вы можете выполнить поиск Google (или эквивалент через API) для любых страниц, которые ссылаются на вашу страницу.Это делается с помощью ключевого слова link:.Поэтому, если вы пытаетесь выяснить, сколько людей ссылаются на www.example.com (независимо от того, идет ли это через URL-адрес сокращенной ссылки), вы просто выполните поиск в Google по запросу link:www.example.com.

, например:http://www.google.com/search?q=link:www.example.com

Обратите внимание, что при этом будут найдены только проиндексированные страницы, поэтому страницы, которые не были просканированы, или страницы, которые сканируются нечасто, не будут отображаться в результатах до более поздней даты (еслина все).

0 голосов
/ 21 марта 2011

Итак, через несколько месяцев после того, как я задал этот вопрос, я наткнулся на решение аналогичного вопроса, то есть как узнать, сколько раз ссылка была опубликована на Facebook. Решение с помощью простого нового вызова API:

http://graph.facebook.com/http://stackoverflow.com

возвращает следующие данные json:

{
   "id": "http://stackoverflow.com",
   "shares": 1627
}
0 голосов
/ 03 августа 2010

Поскольку все сайты имеют разные алгоритмы сокращения URL-адресов, и это разные сайты, которые, скорее всего, не передают свои данные друг другу, как вы можете надеяться найти их все в одном или небольшом количестве запросов?

Все, что вы можете сделать, это просто перебор, и даже в этом случае это может быть бесполезно, если сайт содержит контент для создания нового значения для того же длинного URL-адреса (особенно если вы отправляете другой длинный адрес).URL-адрес формы, который отображается в то же место, например http://www.stackoverflow.com/, а не http://stackoverflow.com/).

Для того, чтобы это действительно заработало, должен быть сайт, который УЖЕ автоматически собирает всю эту информацию.с каждого сайта, на который добровольно звонят сайты с сокращением URL.И даже если вы написали такой сайт, который не учитывает уже существующие сайты с сокращением URL, у которых уже есть данные!

Короче говоря, я не вижу, как это возможно удаленно, если только я 'Я ошибаюсь, что где-то там есть такая база данных.

...