Макс Twitter ID? - PullRequest
       7

Макс Twitter ID?

2 голосов
/ 10 декабря 2010

Кто-нибудь случайно не знает, какой максимальный идентификатор пользователя в Твиттере?То есть к настоящему времени насчитывается около 200 миллионов пользователей, так будет ли диапазон идентификаторов от 1 до 200 миллионов?Я обнаружил, что в этом диапазоне некоторые идентификаторы не используются.

У меня есть сценарий Python, который в основном обращается к следующему URL:

"/1/statuses/user_timeline/" + str(user_id) + ".json?count=200"

Спасибо

Ответы [ 3 ]

3 голосов
/ 31 мая 2012

Twitter API говорит, что id - это целое число "больше 53 бит" , и что 64-битное целое безопасно для хранения этого значения.

Тем не менее, рекомендуется использовать строковое представление id_str «для безопасности» !?!

2 голосов
/ 10 декабря 2010

API Twitter не гарантирует, что user_id является монотонно увеличивающимся значением. Это просто «постоянный уникальный идентификатор, ссылающийся на объект» (из API docs ). Это означает, что они могут в будущем повторно использовать идентификаторы (удаленных пользователей) или даже распределять значения полуслучайным образом. Идентификаторы могут даже не назначаться последовательно.

Чтение слишком большого количества этого значения, например, указание количества зарегистрированных пользователей, вероятно, не очень надежно.

0 голосов
/ 10 декабря 2010

Никто не знает, что.

Были дискуссии по поводу того, сколько пользователей действительно имеет твиттер.

Было много тестов, а также исследование диапазонов идентификаторов и т. Д.

Результатом было то, что идентификаторы последовательно увеличивались в течение длительного времени, но затем имели регулярные промежутки около 10, а иногда также казались совершенно случайными.

Я не знаюнасколько точно эта информация была собрана, и цель была в другом, но я думаю, вы поняли.

С технической точки зрения я бы не ожидал ничего другого в такой большой сети, как твиттер.Я почти уверен, что идентификаторы заштрихованы, что означает, что они назначены в специальных областях или серверах.Так, например, если ваш идентификатор равен мудоло 17, я знаю, что должен посмотреть на этом самом сервере.Или в той самой стране.Или что-то в этом роде.

Или у сервера может быть свой собственный префикс или класс остатка для назначения идентификаторов, когда новый пользователь регистрируется, чтобы избежать проблем с репликацией.

Это также в большинстве случаев необычно или"не так круто", чтобы утечка информации, как это.Не спрашивайте меня, почему, это только мой опыт, что компании хотят показывать как можно меньше информации извне.

Это включает в себя отсутствие воспроизводимой системы увеличения идентификатора транспаранета.

Этотакже уязвимы для каких-либо вредоносных атак, нежелательных ползаний и тому подобного.

Итак, моя точка зрения.

Невозможно дать вам надежный ответ.И это не должно быть необходимо.Вы должны разработать приложение так, чтобы оно имело дело с любой возможной ситуацией.

Если вы хотите знать, насколько велика область поля базы данных, чтобы не возникали конфликты.

Я думаю, что целое число должно подойти длясейчас.(даже в 32-битных системах)

Но всегда будьте готовы к обновлению.

Особенно не думайте, что оно останется числовым.Это просто уникальная строка!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...