Twitter user_timeline, странное количество_статусов и несколько поздних твитов - PullRequest
0 голосов
/ 13 июля 2020

Мы используем twitter user_timeline api, чтобы получить последние 200 твитов для набора учетных записей twitter. Я заметил несколько странных проблем

  1. Несколько твитов поступили в систему через несколько часов после их фактического времени создания. Это означает, что человек пишет твит, через час мы запускаем api user_timeline для пользователя, мы не видим твит, через 8 часов мы запускаем временную шкалу и получаем твит. Означает ли это, что когда-то в твиттере может уйти несколько часов, чтобы проиндексировать твит и сделать доступным для временной шкалы api

  2. Иногда пользователь statuses_count уменьшается с каждым новым твитом для определенной учетной записи c. например, первый твит имеет statuses_count = 100, затем следующий твит, который был твитирован после первого, имеет statuses_count = 99. Это потому, что пользователь удалил некоторые твиты? Насколько надежен statuses_count?

Спасибо

1 Ответ

0 голосов
/ 13 июля 2020

API Twitter в конечном итоге согласован, поэтому я бы предположил, что для вызова временных шкал может происходить то, что за кулисами происходит некоторая синхронизация центра обработки данных, и что вы можете получить более старую копию данных в время звонка. Это также может быть из-за некоторого локального кеширования, но не ясно из вопроса, как вы построили свою систему. В большинстве случаев, когда я сталкивался с подобной проблемой, я мог предположить, что происходит. Если вы хотите получать твиты в более реальном времени, для этого оптимизирован потоковый API - REST API работает по-другому.

Что касается второго вопроса, опять же есть небольшая вероятность того, что это проблема согласованности, или это действительно могло быть из-за удаления твита. Различные элементы объекта твита (пользовательский объект, информация о мультимедиа, ссылки и т. Д. c) гидратированы из разных систем, поэтому они могут просто на мгновение не синхронизироваться c, или , твиты могут иметь удалено.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...