Как отслеживать URL с помощью Twitter Streaming API - PullRequest
11 голосов
/ 18 июля 2011

Я хочу отслеживать ссылки, используя потоковый API.В идеале я хотел бы определить "http://twitter.com" и получить все статусы, содержащие этот URL, как сокращенные (например, http://bit.ly/reXnK3), так и полные (http://twitter.com/dev/api/help.html).. Каким-либо образом я мог бы достичь этого? В настоящее время кажется, чтоМетод «track» не поддерживает URL. Или я что-то упустил?

ps Я знаю о API поиска и о BackType, но я бы предпочел использовать Streaming API, поскольку он работает в режиме реального времени и не работает.не имеет ограничений по скорости.

1 Ответ

2 голосов
/ 19 июня 2014

Параметр track находится в statuses / filter , и в результате вашего запроса обязательно должны быть ссылки, если ссылки находятся в Твиттере. Этот является примером того, что вы получаете из потока.Я думаю, что ваша проблема в том, что потоковый API не позволяет отслеживать URL-адреса как таковые, но позволяет отслеживать ключевые слова или пользователей по идентификатору пользователя.URL, который вы пытаетесь отследить, связан с каким-то ключевым словом?Можете ли вы проанализировать URL-адрес и использовать, скажем, как доменное имя, так и определенный URI как отдельные ключевые слова (например, в случае http://twitter.com/dev/api/help.html, могут помочь следующие ключевые слова: twitter.com, dev, api)?В этой стратегии много шума, но вы можете сохранить результаты в своей базе данных и затем запросить полный URL-адрес, который вы пытаетесь отслеживать.Документация о методе "track" выглядит следующим образом:

Текст полей Tweet и некоторых сущностей рассматривается для совпадений.В частности, текстовые атрибуты Tweet, extended_url и display_url для ссылок и мультимедиа, текста для хэштегов и screen_name для упоминаний пользователей проверяются на совпадения.

Я никогда не пробовал API потоковой передачи и чувствуюудобнее с поисковым API, но оба они, безусловно, должны давать схожие результаты.Попробуйте увеличить список ключевых слов через запятую, добавьте URL, который вы хотите отслеживать, как два ключевых слова (одно для доменного имени, другое для определенного URI), и вы должны получить что-то близкое к тому, что вы пытаетесьдостичь.По крайней мере, это то, что я бы сделал, если бы у меня была эта проблема, основываясь на том, что Twitter говорит в документации.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...