Используйте Python вместе с Github API для сбора данных из репозитория - PullRequest
0 голосов
/ 11 июня 2019

Я занимаюсь исследованием проекта, в котором python использует GitHub API для сбора информации о количестве звезд, участников, PR и проблем из репозитория (https://github.com/) и сохраняет его в CSV-файле.

Я пытаюсь использовать BeautifulSoup4, но метод API является более стабильным способом. Ниже приведен мой небольшой фрагмент. Я не уверен, как получить информацию о проблемах, поднятых некоторыми участниками компании v /s не компания (для проверки внешних участников), использующая github API (pygithub).

from github import Github
# using username and password
# or using an access token
g = Github("***************************")
for repo in g.get_user().get_repos():
    print(repo.name)

print("**********Get Current Repos**********")
user = g.get_user()
user.login
print(user.login)
repo = g.get_repo("<any-repo>/<any-repo>")
repo.name
print(repo.name)
print("********Get the Repo Topics**************")

repo = g.get_repo("<any-repo>/<any-repo>")
repo.get_topics()
print(repo.get_topics())

print("*****Get the Star Count*************")
repo = g.get_repo("<any-repo>/<any-repo>")
repo.stargazers_count
print(repo.stargazers_count)
print("********Get the Open Issues*********")
repo = g.get_repo("<any-repo>/<any-repo>")
open_issues = repo.get_issues(state='open')
for issue in open_issues:
    print(issue)

print("******Get the Branch Count*******")
repo = g.get_repo("<any-repo>/<any-repo>")
print(list(repo.get_branches()))

PS: я все еще noobie Python.

...