"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Python을 사용하여 Github 리포지토리 데이터를 검색하는 방법

Python을 사용하여 Github 리포지토리 데이터를 검색하는 방법

2024-11-08에 게시됨
검색:268

How to retrieve Github Repository Data using Python

귀하의 조직에 Github 저장소가 너무 많아서 보고, 대시보드 또는 감사 목적으로 각 저장소의 내용을 요약하고 기록하는 쉬운 방법이 필요합니까? Github API를 사용하여 바로 그 작업을 수행하는 빠른 스크립트는 다음과 같습니다.

기능:

  1. get_repo_info(소유자, 저장소):

    • GitHub 저장소 소유자의 사용자 이름(owner)과 저장소 이름(repo)을 가져옵니다.
    • GitHub의 API에 요청을 보내 저장소 정보를 가져옵니다.
    • 성공하면 저장소 정보를 JSON 객체로 반환하고, 오류가 있으면 None을 반환합니다.
  2. get_collaborators(collaborators_url):

    • 저장소의 공동작업자 목록에 대한 URL을 가져옵니다.
    • 협력자 목록을 가져오기 위한 요청을 보냅니다.
    • 협력자 사용자 이름 목록을 반환하거나, 오류가 발생하면 빈 목록을 반환합니다.
  3. get_언어(언어_url):

    • 저장소의 언어 데이터에 대한 URL을 가져옵니다.
    • 저장소에서 사용되는 프로그래밍 언어를 검색하라는 요청을 보냅니다.
    • 언어 목록을 반환하거나 오류가 있는 경우 빈 목록을 반환합니다.
  4. get_open_issues(소유자, 저장소):

    • 저장소 소유자의 사용자 이름(owner)과 저장소 이름(repo)을 가져옵니다.
    • 저장소에 있는 미해결 문제 목록을 검색하라는 요청을 보냅니다.
    • 미해결 이슈를 JSON 형식으로 반환하거나, 문제가 있는 경우 오류 메시지를 인쇄합니다.
  5. get_repo_data(repo_url):

    • 저장소 URL을 가져와 구문 분석하여 소유자 및 저장소 값을 가져온 다음 다른 함수를 호출하여 저장소에 대한 다양한 정보를 수집합니다.
    • 이름, 소유자, 가시성, 공동작업자, 언어, 공개 이슈, 마지막 활동을 포함한 저장소 정보를 컴파일하고 이를 구조화된 형식(사전)으로 반환합니다.
import json
import requests
from pymongo import MongoClient

# MongoDB setup (replace with your actual connection details)
client = MongoClient("mongodb://localhost:27017/")
db = client["github_repos"]  # Database name
collection = db["repos"]     # Collection name

def get_repo_info(owner, repo):
    url = f"https://api.github.com/repos/{owner}/{repo}"
    headers = {"Accept": "application/vnd.github json"}
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error: {response.status_code}")
        return None

def get_collaborators(collaborators_url):
    response = requests.get(collaborators_url)
    if response.status_code == 200:
        return [collaborator["login"] for collaborator in response.json()]
    else:
        return []

def get_languages(languages_url):
    response = requests.get(languages_url)
    if response.status_code == 200:
        return list(response.json().keys())
    else:
        return []

def get_open_issues(owner, repo):
    url = f"https://api.github.com/repos/{owner}/{repo}/issues?state=open"
    headers = {"Accept": "application/vnd.github json"}
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error: {response.status_code}")
        return []

def get_repo_data(repo_url):
    owner, repo = repo_url.split("/")[-2:]
    repo_info = get_repo_info(owner, repo)

    if repo_info:
        data = {
            "Github URL": repo_url,
            "Project name": repo_info["name"],
            "Project owner": repo_info["owner"]["login"],
            "List users with access": get_collaborators(repo_info["collaborators_url"].split("{")[0]),  # remove template part of URL
            "Programming languages used": get_languages(repo_info["languages_url"]),
            "Security/visibility level": repo_info["visibility"],
            "Summary": repo_info["description"],
            "Last maintained": repo_info["pushed_at"],
            "Last release": repo_info["default_branch"],
            "Open issues": get_open_issues(owner, repo),
        }

        # Insert the data into MongoDB
        collection.insert_one(data)
        print("Data inserted into MongoDB successfully.")

        return data
    else:
        return None

# Example usage
repo_url = "https://github.com/URL"
repo_data = get_repo_data(repo_url)

if repo_data:
    print(json.dumps(repo_data, indent=4))
릴리스 선언문 이 기사는 https://dev.to/techbelle/how-to-retrieve-github-repository-data-using-python-59g3?1에 복제되어 있습니다. 침해 내용이 있는 경우, [email protected]에 문의하여 삭제하시기 바랍니다. 그것
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3