Как контролировать группу аккаунтов в твиттере - PullRequest
1 голос
/ 28 сентября 2011

Вот что я пытаюсь сделать. У меня есть список пользователей Twitter (2-3000), чьи твиты мне нужно отслеживать по ключевым словам.

Я подумал о двух решениях для реализации этого, но не думаю, что какое-то оптимальное.

1- Создайте личный список в твиттере, добавьте все учетные записи, которые я хочу отслеживать, и используйте список API для получения всех твитов

2 - используйте API поиска или потока, чтобы отслеживать все твиттеры по моим ключевым словам, а затем перепроверьте на моей стороне список пользователей, которые у меня есть.

Это единственные способы сделать это? Любая идея о том, как быть более эффективным?

Одна вещь, которую нужно иметь в виду, мне нужно сохранить список учетных записей, которые я контролирую, закрытыми. Каждый владелец счета может знать, что за ним следят, но не может знать, кто еще.

Ответы [ 2 ]

2 голосов
/ 28 сентября 2011

Да. Вот как бы я это сделал:

1) создать аккаунт в твиттере, который будет подписываться на всех этих людей

2) Я полагаю, что у вас есть какой-то список людей, сохраненных каким-то образом, проанализируйте / grep / отформатируйте эти данные, чтобы у вас был список всех их user_ids

3) создайте приложение для твиттера, которое вы сможете использовать

4) скачать любимые языки самая популярная твиттер библиотека

5) аутентифицировать пользователя с помощью приложения

6) создайте простую небольшую программу, которая читает ваш список из 2 и работает, следуя за этими пользователями. Перестаньте спать между этими вызовами, так как вы будете подвержены ограничению скорости.

6) создайте простую небольшую программу, которая читает ваш список из (2) и работает, добавляя каждого пользователя в личный список, создавая новый личный список каждый раз, когда вы нажимаете 500. На эти вызовы распространяется ограничение скорости, поэтому разбивайте или группируйте вызовы в течение необходимого временного окна

7) теперь вы просто запрашиваете вашу временную шкалу через API, и вас нет.

Ключевым моментом является 2, если у вас есть этот список в каком-то цифровом формате (текстовый файл, база данных, чьи-то подписчики) или каким-то образом можно рассчитать (читай: избегайте ручного поиска и следуйте), это должно быть очень просто.

Я использую java, вы можете сделать все на моих шагах + ваши требования к фильтрации с помощью scribe (библиотека auth) и gson (Json parser) несколькими способами. С точки зрения чистоты и эффективности, я думаю, что это подходит для краткости.

0 голосов
/ 29 сентября 2011

Вы также можете использовать потоковый API для отслеживания нескольких учетных записей с помощью параметра follow, а затем выполнять поиск по ключевому слову с вашей стороны. Это было бы намного эффективнее.

Вы также можете подписаться на людей с GET statuses / user_timeline , хотя это может быть только один пользователь за раз. Вы можете получить 200 сообщений в прошлом.

Я бы сделал потоковый API, но также написал бы некоторый код для использования user_timeline, в случае, если ваш прием потокового вещания когда-нибудь закончится, вы сможете быстро получить все, что пропустили.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...