Потянув несколько страниц поисковых терминов из Twitter - PullRequest
0 голосов
/ 12 мая 2009

Я пытаюсь найти способ получить все твиты определенного поискового запроса через PHP и API поиска в Twitter.

Так что функциональность будет включать 1. Включите поисковый запрос 2. Потяните термины с каждой страницы. 3. Вытащить только новые термины из последнего поиска 4. Экспорт в БД или плоский файл.

Я довольно ясно все, кроме обхода нескольких страниц

Ответы [ 3 ]

5 голосов
/ 12 мая 2009

Twitter API принимает параметр номера страницы. В результатах атома есть элементы ссылки с атрибутами rel для следующего и предыдущего. Это будет вашим лучшим показателем того, стоит ли вам искать вторую страницу и так далее. Атрибут href этого тега даже скажет вам URL, который вы должны запросить.

Созданный вами запрос также принимает параметр since_id. Вы захотите сохранить самый большой номер идентификатора, который вы видите в своих ответах, и использовать его в последующих запросах, чтобы вам не нужно было фильтровать дубликаты.

Что касается хранения данных, ваш выбор, вероятно, лучше всего будет зависеть от того, что вы планируете делать с результатами ... если вы собираетесь делать какие-либо запросы, вам, вероятно, следует сохранить их в базе данных, т.е. MySQL. Если вы просто регистрируетесь, плоский файл должен подойти.

0 голосов
/ 12 мая 2009

API 1001 * для поиска в Twitter принимает параметр страницы:

# страница: Необязательно. Номер страницы (начиная с 1), чтобы вернуться, до макс. примерно 1500 результатов (на основе RPP * страница Примечание: есть ограничения по нумерации страниц.

* Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2
0 голосов
/ 12 мая 2009

API поиска имеет параметр page:

страница: необязательно. Номер страницы (начиная с 1) для возврата, максимум до 1500 результатов (на основе страницы rpp *. Примечание: существуют ограничения по нумерации страниц.

Пример: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2

Это помогает?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...