Так что я не собираюсь писать весь код для вас, но вы абсолютно можете сделать то, что вы ищете, используя стандартные операторы Twitter
Вы можете использовать их для создания строки запроса ваших ключевых слов, чтобы получить то, что вы хотите, так что, скажем, вы хотели твиты, содержащие java, ruby и python вместе, вы бы сделали свой запрос
"java ruby python"
Теперь скажем, что вы хотели твиты, содержащие любое из этих слов, вы можете использовать логическое ИЛИ, например:
"java OR ruby OR python"
Конечно, теперь вы должны найти способ действительно использовать их. Для этого должен работать метод api.search()
. Я полагаю, что вы все еще можете использовать это самостоятельно, но это вообще обескураживает, теперь есть курсор. Это означает, что вам не нужно иметь дело с разделением твитов на нумерацию страниц; это все для вас!
Таким образом, фрагмент вашего кода, который выполняет поиск, будет выглядеть примерно так:
searchTerms = "java OR python OR ruby"
for tweet in tweepy.Cursor(api.search, q=searchTerms).items(10):
#whatever you need to do here
Таким образом, в приведенном выше примере tweepy.Cursor
по существу получает список объектов статуса (каждый объект - это, по сути, вся информация одного твита). Они содержат такие вещи, как текст твита, время его публикации, количество ретвитов и т. Д. Поэтому переменная tweet
в цикле for
- это отдельный объект статуса, из которого вы можете извлечь необходимые данные. .items()
в конце возвращает вам отдельные объекты статуса, а не страницу с ними. Вы можете указать число, чтобы определить, сколько твитов вы хотите вернуть.
Для большего количества примеров посмотрите здесь множество различных применений курсора там, которые должны дать вам представление о том, как он используется.
Некоторые другие полезные ссылки:
Документация по Tweepy Cursor - Коротко, но это даст вам суть курсора.
Документы по твипистому методу это дает вам информацию обо всех твиповых методах и позволяет узнать, какие поиски вы можете выполнить.
Надеюсь, это поможет. Желаем удачи в анализе настроений.