Я работаю над приложением, которое выполняет итерацию по массиву репозиториев github и определяет, какие пользователи github (хранящиеся в отдельной таблице) не помечали каждый репозиторий.
Эквивалентный запрос curl будет выглядеть следующим образом.
curl https://api.github.com/repos/<GITHUB_REPOSITORY>/stargazers?access_token=<ACCESS_TOKEN>
Выше будет возвращаться 30 пользователей github на страницу, которые пометили репозиторий, и мы можем увеличить его максимум до 100 на страницу какследует
curl https://api.github.com/repos/<GITHUB_REPOSITORY>/stargazers?access_token=<ACCESS_TOKEN>/?page=<PAGE_NUMBER>&per_page=100
Например, если в репо 540 звезд, я итерирую 6 раз, чтобы получить список имен пользователей github, которые сыграли главную роль.Это работает отлично для репозиториев с меньшим количеством звездочек (скажем, менее 5000).Однако, с увеличением количества звезд, я боюсь, что это может привести к сетевым проблемам, таким как удушение.Я запустил программу с репо со 100 000+ звездочек (хотя мои требования сравнительно меньше), и он вернул эту ошибку.
ERROR - Remote host closed the connection before initiating inbound response"
Может кто-нибудь сказать, пожалуйста, какой самый оптимальный способ получить списокимен пользователей GitHub без запуска в сети.