」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > Better - 人工智慧驅動的程式碼審查器 GitHub Action

Better - 人工智慧驅動的程式碼審查器 GitHub Action

發佈於2024-11-08
瀏覽:698

代码审查对于维护标准和强调项目中代码的最佳实践始终至关重要。这不是一篇关于开发人员应该如何审查代码的文章,更多的是关于将一​​部分代码委托给 AI。

正如 Michael Lynch 在他的文章“如何像人类一样进行代码审查”中提到的那样——我们应该让计算机处理代码审查的无聊部分。虽然迈克尔强调格式化工具,但我想更进一步,让人工智能来解决这个问题。我的意思是,为什么不利用行业中人工智能的繁荣呢?

现在我并不是说应该使用人工智能来代替格式化工具和 linter。相反,它是用来捕捉人类可能错过的琐碎的东西。

这就是为什么我决定创建一个 github 操作,该操作的代码会审查拉取请求差异并使用 AI 生成建议。让我带您了解一下。

?笔记

  • 此 GitHub 操作现已在 GitHub 市场上提供。
  • 这是一个 javascript 操作 - 了解有关创建 javascript github 操作的更多信息。

获取差异

为了与 github API 交互,我使用了 octokit,它是一种 SDK 或客户端库,用于以惯用的方式与 github API 交互。

为了获得提出的拉取请求的差异,您需要传递带有值 application/vnd.github.diff 的 Accept 标头以及所需的参数。

async function getPullRequestDetails(octokit, { mode }) {
    let AcceptFormat = "application/vnd.github.raw json";

    if (mode === "diff") AcceptFormat = "application/vnd.github.diff";
    if (mode === "json") AcceptFormat = "application/vnd.github.raw json";

    return await octokit.rest.pulls.get({
        owner: github.context.repo.owner,
        repo: github.context.repo.repo,
        pull_number: github.context.payload.pull_request.number,
        headers: {
            accept: AcceptFormat,
        },
    });
}

如果您根本不熟悉 github actions,这里有 Victoria Lo 的 github actions 101 系列,这是一个很好的开始。

一旦获得差异,我就会解析它并删除不需要的更改,然后以如下所示的模式返回它:

/** using zod */
schema = z.object({
    path: z.string(),
    position: z.number(),
    line: z.number(),
    change: z.object({
        type: z.string(),
        add: z.boolean(),
        ln: z.number(),
        content: z.string(),
        relativePosition: z.number(),
    }),
    previously: z.string().optional(),
    suggestions: z.string().optional(),
})

忽略文件

忽略文件非常简单。用户输入列表需要以分号分隔的 glob 模式字符串。然后对其进行解析,与默认的忽略文件列表连接并进行重复数据删除。

**/*.md; **/*.env; **/*.lock;
const filesToIgnoreList = [
    ...new Set(
        filesToIgnore
            .split(";")
            .map(file => file.trim())
            .filter(file => file !== "")
            .concat(FILES_IGNORED_BY_DEFAULT)
    ),
];

然后使用忽略的文件列表来删除引用这些忽略的文件的差异更改。这为您提供了一个仅包含您想要的更改的原始有效负载。

生成建议

解析差异后获得原始有效负载后,我将其传递给平台 API。这是 OpenAI API 的实现。

async function useOpenAI({ rawComments, openAI, rules, modelName, pullRequestContext }) {
    const result = await openAI.beta.chat.completions.parse({
        model: getModelName(modelName, "openai"),
        messages: [
            {
                role: "system",
                content: COMMON_SYSTEM_PROMPT,
            },
            {
                role: "user",
                content: getUserPrompt(rules, rawComments, pullRequestContext),
            },
        ],
        response_format: zodResponseFormat(diffPayloadSchema, "json_diff_response"),
    });

    const { message } = result.choices[0];

    if (message.refusal) {
        throw new Error(`the model refused to generate suggestions - ${message.refusal}`);
    }

    return message.parsed;
}

您可能会注意到 API 实现中响应格式的使用。这是许多 LLM 平台提供的功能,它允许您告诉模型以特定模式/格式生成响应。在这种情况下,它特别有用,因为我不希望模型产生幻觉并为拉取请求中的错误文件或位置生成建议,或者向响应负载添加新属性。

系统提示为模型提供了更多关于如何进行代码审查以及需要记住的事项的背景信息。你可以在这里查看系统提示 github.com/murtuzaalisurti/better.

用户提示包含拉取请求的实际差异、规则和上下文。这就是代码审查的开始。

此 github 操作支持 OpenAI 和 Anthropic 模型。以下是它如何实现 Anthropic API:

async function useAnthropic({ rawComments, anthropic, rules, modelName, pullRequestContext }) {
    const { definitions } = zodToJsonSchema(diffPayloadSchema, "diffPayloadSchema");
    const result = await anthropic.messages.create({
        max_tokens: 8192,
        model: getModelName(modelName, "anthropic"),
        system: COMMON_SYSTEM_PROMPT,
        tools: [
            {
                name: "structuredOutput",
                description: "Structured Output",
                input_schema: definitions["diffPayloadSchema"],
            },
        ],
        tool_choice: {
            type: "tool",
            name: "structuredOutput",
        },
        messages: [
            {
                role: "user",
                content: getUserPrompt(rules, rawComments, pullRequestContext),
            },
        ],
    });

    let parsed = null;
    for (const block of result.content) {
        if (block.type === "tool_use") {
            parsed = block.input;
            break;
        }
    }

    return parsed;
}

添加评论

最后,在检索到建议后,我会对它们进行清理并将其传递给 github API 以添加评论作为审核的一部分。

我选择以下方式添加评论,因为通过创建新评论,您可以一次性添加所有评论,而不是一次添加一条评论。逐条添加评论也可能会触发速率限制,因为添加评论会触发通知,而您不希望向用户发送垃圾邮件通知。

function filterPositionsNotPresentInRawPayload(rawComments, comments) {
    return comments.filter(comment =>
        rawComments.some(rawComment => rawComment.path === comment.path && rawComment.line === comment.line)
    );
}

async function addReviewComments(suggestions, octokit, rawComments, modelName) {
    const { info } = log({ withTimestamp: true }); // eslint-disable-line no-use-before-define
    const comments = filterPositionsNotPresentInRawPayload(rawComments, extractComments().comments(suggestions));

    try {
        await octokit.rest.pulls.createReview({
            owner: github.context.repo.owner,
            repo: github.context.repo.repo,
            pull_number: github.context.payload.pull_request.number,
            body: `Code Review by ${modelName}`,
            event: "COMMENT",
            comments,
        });
    } catch (error) {
        info(`Failed to add review comments: ${JSON.stringify(comments, null, 2)}`);
        throw error;
    }
}

结论

我想让 github 操作保持开放性并开放集成,这就是为什么您可以使用您选择的任何模型 (请参阅支持的模型列表),或者您可以微调和构建您自己的自定义模型位于受支持的基本模型之上,并将其与此 github 操作一起使用。

如果您遇到任何代币问题或速率限制,您可能需要参考相应平台的文档来升级模型限制。

所以,你还在等什么?如果您在 github 上有存储库,请立即尝试该操作 - 它位于 github 操作市场上。

Better - An AI powered Code Reviewer GitHub Action 穆尔图扎阿利苏尔蒂 / 更好的

由 AI 提供支持的代码审阅者 github 操作,可随时在您的工作流程中使用。

更好的

由 AI 提供支持的代码审查程序 github 操作,可在您的工作流程中使用。

为什么要使用它?

  • 标准化您的代码审查流程
  • 更快地获得反馈
  • 识别导致错误代码的模式
  • 常见问题检测
  • 识别安全漏洞
  • 第二意见
  • 让人类专注于更复杂的任务

用法

1.创建工作流程

在存储库的 .github/workflows 文件夹中创建一个工作流文件(如果不存在则创建),其中包含以下内容:

name: Code Review
on
    pull_request:
        types: [opened, reopened, synchronize, ready_for_review]
        branches:
            - main # change this to your target branch
    workflow_dispatch: # Allows you to run the workflow manually from the Actions tab

permissions: # necessary permissions
    pull-requests: write
    contents: read

jobs:
    your-job-name:
        runs-on: ubuntu-latest
        name: your-job-name
        steps:
            - name: step-name
              id: step-id
              uses: murtuzaalisurti/better@v2 # this is
进入全屏模式退出全屏模式
在 GitHub 上查看
版本聲明 本文轉載於:https://dev.to/murtuzaalisurti/better-an-ai-powered-code-reviewer-github-action-2n28?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 重新學習CS基礎知識-實作佇列
    重新學習CS基礎知識-實作佇列
    你曾經站在隊列中嗎,隊列資料結構也做同樣的事情。當你想在你最喜歡的自助餐廳點餐時,你站在隊伍的最後,然後你就可以繼續排隊並離開。 CS 中的佇列資料結構執行相同的功能。佇列資料結構是先進先出的資料結構。佇列資料結構可以使用兩個基本函數 Enqueue 和 Dequeue 來構建,這兩個函數基本上是...
    程式設計 發佈於2024-11-09
  • 為 Angular 18 設定 linter 和 IDE
    為 Angular 18 設定 linter 和 IDE
    將 eslint、prettier、env 加入應用程式。 遺憾的是,Angular 預設不會自行產生這一切。更改原理圖可以提高數千個 Angular 專案的品質。 設定 eslint 9 連結 eslint: yarn ng add @angular-eslint/schema...
    程式設計 發佈於2024-11-09
  • 使用 JavaScript 進行網頁抓取和代理設定的初學者指南
    使用 JavaScript 進行網頁抓取和代理設定的初學者指南
    使用JavaScript程式碼模擬使用者操作,以取得所需資訊。包括模擬使用者開啟網頁、點擊連結、輸入關鍵字等操作,並從網頁中提取所需資訊。 Javascript網頁抓取的核心原理 使用JavaScript程式碼模擬使用者操作來取得所需資訊。包括模擬使用者開啟網頁、點擊連結、輸入關鍵...
    程式設計 發佈於2024-11-09
  • 在 Android 上運行 Llama:使用 Ollama 的逐步指南
    在 Android 上運行 Llama:使用 Ollama 的逐步指南
    Llama 3.2 最近在 Meta 開發者大會上推出,展示了令人印象深刻的多模式功能以及針對使用高通和聯發科技硬體的行動裝置進行最佳化的版本。這項突破使開發人員能夠在行動裝置上運行 Llama 3.2 等強大的 AI 模型,為更高效、私密和響應迅速的 AI 應用程式鋪平道路。 Meta 發布了 ...
    程式設計 發佈於2024-11-09
  • 如何在 Python 中格式化字串以將它們對齊直列?
    如何在 Python 中格式化字串以將它們對齊直列?
    以固定寬度列印字串列印字串時,將它們對齊成直列可以增強可讀性。在 Python 中使用 format 或 f-string 提供了實現此目的的便捷方法。 使用 str.format()str.format() 提供了一個簡單的填充方法字串。其語法包括佔位符 {},後跟格式化表達式。對於左對齊,請使用...
    程式設計 發佈於2024-11-09
  • 為什麼微服務比單體架構重要
    為什麼微服務比單體架構重要
    在當今快節奏的技術環境中,企業需要可擴展且靈活的解決方案來快速適應不斷變化的需求。與傳統的整體方法相比,這就是微服務架構的亮點。 1.什麼是單體架構? 單體架構是一個單一的、統一的系統,其中所有元件都是互連和相互依賴的。這意味著對系統的任何更改或更新都需要重新建置和重新部署整個應用...
    程式設計 發佈於2024-11-09
  • 如何在 PHP 中存取物件屬性:了解語法和錯誤解決方案
    如何在 PHP 中存取物件屬性:了解語法和錯誤解決方案
    瞭解 PHP 物件屬性存取在 PHP 中,存取物件屬性對於處理複雜的資料結構至關重要。屬性保存與物件關聯的信息,使我們能夠管理和操作該數據。 存取物件屬性有兩種常用語法:1。 $property1此語法直接透過名稱存取特定屬性。它用於分配或檢索各個屬性的值。但是,這種方法要求您事先知道確切的屬性名稱...
    程式設計 發佈於2024-11-09
  • PDO如何防止SQL注入並取代轉義單引號?
    PDO如何防止SQL注入並取代轉義單引號?
    PDO防止SQL注入的方法如果你已經從mysql函式庫過渡到PDO,你可能想知道如何取代real_escape_string來轉義發往資料庫的字串中的單引號的函數。雖然向每個字串添加斜杠可能看起來很麻煩,但 PDO 提供了一種更有效的替代方案。 PDO 準備的強大功能為了防止 SQL 注入,PDO ...
    程式設計 發佈於2024-11-09
  • 透過「專案:使用互斥體同步多執行緒列印」課程釋放您的編碼潛力
    透過「專案:使用互斥體同步多執行緒列印」課程釋放您的編碼潛力
    您準備好深入多執行緒程式設計的世界並學習如何使用互斥體來同步字串的列印了嗎? LabEx 提供的項目:使用互斥體同步多執行緒列印課程就是您的最佳選擇。 在這個基於專案的綜合課程中,您將踏上了解互斥體在協調多執行緒執行方面的重要性的旅程。您將首先修改現有的「混沌打字機」程序,確保字串以正確的順序列印...
    程式設計 發佈於2024-11-09
  • 為什麼我在 MySQL 中收到「\'create_date\'時間戳欄位的預設值無效」錯誤?
    為什麼我在 MySQL 中收到「\'create_date\'時間戳欄位的預設值無效」錯誤?
    “create_date”時間戳字段的預設值無效建立帶有時間戳列的表並指定預設值“0000-”時00-00 00:00:00',可能會出現錯誤,指示「'create_date'的預設值無效」。這個錯誤是由 MySQL 的 SQL 模式 - NO_ZERO_DATE 所造成的。...
    程式設計 發佈於2024-11-09
  • 儘管出現「頁面已移動」錯誤,如何使用 cURL 檢索頁面內容?
    儘管出現「頁面已移動」錯誤,如何使用 cURL 檢索頁面內容?
    使用 cURL 檢索頁面內容在此上下文中,您試圖使用 cURL 抓取 Google 搜尋結果頁面的內容。儘管嘗試設定使用者代理程式和各種選項,但您仍無法成功檢索頁面內容。重定向或“頁面移動”錯誤繼續困擾著您。 據信此問題可能源自於查詢字串中特殊字元的編碼。為了緩解這種情況,需要更改 PHP 程式碼。...
    程式設計 發佈於2024-11-09
  • 如何使用 JPA 和 Hibernate 以 UTC 格式儲存日期/時間?
    如何使用 JPA 和 Hibernate 以 UTC 格式儲存日期/時間?
    使用JPA 和Hibernate 在UTC 時區儲存日期/時間在JPA/ 中處理日期和時間時擔心時區差異休眠應用程式?本文探討如何在 UTC (GMT) 時區有效儲存和檢索時態數據,確保跨不同時區進行一致且準確的處理。 考慮以下附註的 JPA 實體:public class Event { ...
    程式設計 發佈於2024-11-09
  • 如何使用 CSS 建立動態擴充的文字輸入欄位?
    如何使用 CSS 建立動態擴充的文字輸入欄位?
    透過 CSS 增強文字輸入回應能力製作 Web 表單時,控製文字輸入欄位的大小至關重要。 CSS 提供了一種簡單的方法來定義其初始尺寸。但是,如果您希望輸入隨著使用者鍵入而動態擴展並達到最大寬度,該怎麼辦?本文深入研究了僅 CSS 和基於 HTML 的技術來實現此行為。 CSS 和內容可編輯利用 C...
    程式設計 發佈於2024-11-09
  • 關於 Javascript Promise 的有趣事實
    關於 Javascript Promise 的有趣事實
    Promise 始終是異步的 Promise 的回呼總是在同步程式碼之後執行 const promise = Promise.resolve(); promise.then(() => console.log('async')); console.log('sync');...
    程式設計 發佈於2024-11-09
  • LightFlow:Go 的任務編排框架
    LightFlow:Go 的任務編排框架
    我發展了 LightFlow,一個任務編排框架,旨在簡化 Go 中複雜工作流程的管理。它專注於執行時序並減少對外部設定檔的需求。 主要特點: 獨立上下文:每個步驟都通過獨立上下文鏈接,僅允許訪問相關數據。 可合併流程:您可以靈活組合任務流程,以便在不同流程中重複使用。 檢查點恢...
    程式設計 發佈於2024-11-09

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3