人間とAI、どちらが書いたコードもCICDでチェックしてみよう

人間とAI、どちらが書いたコードも CI/CDでチェックしてみよう 2025.10.21 SATOSHI KANEYASU

2 氏名：兼安聡所属：株式会社サーバーワークスアプリケーションサービス部在住：広島（フルリモート）担当：DevOps、技術支援、PM、SM SNS(X)：@satoshi256kbyte • 2025
AWS Community Builders • 2025 Japan AWS Top Engineers (AI/ML Data Engineer) • 2025 Japan AWS All Certifications Engineers • 認定スクラムマスター • PMP Speaker Introduction

3 目次 ⚫生成AIを用いた開発と品質面のリスク ⚫GitHub ActionsによるCI/CDパイプラインの作り方 ⚫GitHub Actionsによる品質とセキュリティのチェック ⚫GitHub ActionsからのAWSの操作

生成AIを用いた開発と品質面のリスク

5 AIと協力する開発スタイル – Vibe Coding • AIがコードを生成し、開発者はそのコードをレビュー・修正しながらソフトウェアを開発する手法を、Vibe Codingと言います •
サーバーワークスでは開発に用いる生成AIのソリューションを提供していますソースコード

6 Vibe Codingの課題 ⚫ Vibe Coding とはAIに自然言語で指示を与えて開発するスタイルを指します。 ⚫ 一般的にチャットで会話しながら開発するので、
同じ成果物を得るには会話を再現する必要があります。（対策となるテクニックは存在しますが本筋から離れるので割愛します）このやり取りを丸ごと再現しないと、同じ成果物を得るのは難しい

7 仕様駆動開発 ⚫ Vibe Codingの課題に対しての、対策アプローチの一つが、仕様駆動開発です ⚫ Kiroのスペックは要件定義＞設計＞実装計画＞実装という段階を踏みます要件の入力要件定義設計
実装計画実装 Kiroのスペック requirements. md design.md tasks.md コード

8 AIが作業を途中で打ち切ってしまう AIによるチェックが中途半端成果物に脆弱性が含まれる 1 2 3 Vibe Codingと仕様駆動開発、両方で起き得る課題

9 AIによるチェックが中途半端になってしまう例 • A-1を実装する • A-2を実装する • A-3を実装する • B-1を実装する
• B-2を実装する • B-3を実装する • C-1を実装する • C-2を実装する • C-3を実装する • 実装したプログラムをチェックして、エラーと警告をゼロにする実装計画 AIの最終報告 • 最終的にエラーは0件、警告は20件となりました。残りの20件は動作には問題ない警告です。？？？動作に問題ない警告ならOKという条件はなかったはずだが・・・

10 なぜこのようなことが起きるのか？ • A-1を実装する • A-2を実装する • A-3を実装する • B-1を実装する
• B-2を実装する • B-3を実装する • C-1を実装する • C-2を実装する • C-3を実装する • 実装したプログラムをチェックして、エラーと警告をゼロにする実装計画実装計画に含まれる作業が多すぎる • チェックを最後にまとめてやってしまっている • AIも溜めてからの最後に一気にテストやチェックはやりきれないことがある

11 AIの成果物に脆弱性が含まれる例パッケージ名バージョンライセンス依存関係インストール元 numpy 1.26.4 BSD-3-Clause
依存なし PyPI pandas 2.2.3 BSD-3-Clause numpy PyPI requests 2.32.3 Apache-2.0 urllib3, idna, certifi PyPI fastapi 0.115.0 MIT starlette, pydantic PyPI uvicorn 0.31.0 BSD-3-Clause click, h11 PyPI 識別子対象パッケージ影響バージョン深刻度内容概要 CVSSスコア CVE-2024- 12345 requests ～2.32.3 High 特定のHTTPヘッダー処理により任意コード実行の可能性 8.8 使用ライブラリ一覧脆弱性データベース

12 なぜこのようなことが起きるのか？ ⚫ AIは特に何もしなければ、脆弱性データベースを直接参照していない ⚫ AIは特に何もしなければ、技術的に少しだけ前の情報を元に成果物を作る

13 AIの成果物の課題に対する対策案 AIによるチェックが中途半端要件自体を細かくするチェックをこまめにするよう指示する現象対策 AIに依存しない
チェックを設ける AIの成果物に脆弱性が含まれる

14 AIの成果物の課題に対する対策案 AIによるチェックが中途半端要件自体を細かくするチェックをこまめにするよう指示する現象対策 AIに依存しない
チェックを設ける AIの成果物に脆弱性が含まれる CI/CD

15 CI/CDツールはどれが良いのか？ CI/CDツール難易度 AWSとの連携しやすさ変更のしやすさ GitHub Actions 低中
中 GitLab CI/CD 中中中 AWS CodePipeline 高高低 ⚫ 開発時のチェックなどにはGitHub Actionsが扱いやすく向いています ⚫ AWS CodePipelineは、デプロイ直前の水際チェックに向いています次のページから別の話題に移ります

GitHub Actionsによる CI/CDパイプラインの作り方

17 GitHubのプルリクエストとGitHub Actionsによるチェック develop feature/実装計画 feature/実装要件定義、設計書、実装計画プルリクエストプルリクエストソースコード
⚫ GitHubには、成果物のレビューを依頼するプルリクエストという機能があります ⚫ プルリクエストは、プルリクエストができた時にGitHub Actionsで自動チェックを挟むことが可能で、チェックをした上でレビューすることが可能です

18 GitHubのプルリクエストとGitHub Actionsによるチェック develop feature/実装計画 feature/実装要件定義、設計書、実装計画プルリクエストプルリクエストソースコード
⚫ GitHubには、成果物のレビューを依頼するプルリクエストという機能があります ⚫ プルリクエストは、プルリクエストができた時にGitHub Actionsで自動チェックを挟むことが可能で、チェックをした上でレビューすることが可能です • マークダウンの構文チェック • スペルミスチェック • 自動テスト • プログラムの構文エラー、警告チェック

19 GitHubのプルリクエストとGitHub Actionsによるチェックプルリクエストにおける実行結果画面

20 GitHub Actionsの構造リポジトリのディレクトリ構造

21 今回作成するチェック内容プルリクエスト Lint ソースコードの構文チェックなど自動テスト SCA 使用ライブラリの脆弱性チェック SAST セキュリティ観点の
静的コードチェック Job Job Job Job チェックを早く終わらせるため並列で処理 .github/workflows pull_request_check.yml

22 チェックごとにインストールと実行のステップがあるプルリクエスト .github/workflows pull_request_check.yml Lint ソースコードの構文チェックなど自動テスト SCA 使用ライブラリの脆弱性チェック
SAST セキュリティ観点の静的コードチェック Job Job Job Job ツールのインストール実行ツールのインストール実行ツールのインストール実行ツールのインストール実行 Step Step

23 各ツールのインストールを早くするためにキャッシュを利用するプルリクエスト Lint ソースコードの構文チェックなど自動テスト SCA 使用ライブラリの脆弱性チェック SAST セキュリティ観点の
静的コードチェック Job Job Job Job ツールのインストール実行ツールのインストール実行ツールのインストール実行ツールのインストール実行 Step Step Prepare キャッシュの作成 Job .github/workflows pull_request_check.yml

24 実際のGitHub Actionsの実行画面

25 ワークフローの起動条件 pull_request_check.yml

26 ジョブとステップ、そして並列実行と直列実行の見方 ⚫ ジョブはそれぞれ並行して動作します ⚫ ジョブの中のステップは上から順に直列で動作します ⚫ ジョブはそれぞれがコンテナで動作しますジョブにruns-onでubuntu-latestとコンテナイメージの指定があるのはそれが理由です
pull_request_check.yml

27 ジョブ同士の順番の持たせ方 ⚫ ジョブはそれぞれ並行して動作しますが、 needs属性でジョブを指定することで、そのジョブが終わってから開始するよう指定可能です ⚫ 例えば、並列でジョブを実行する前に、各ジョブの共通ライブラリをインストールしてキャッシュ化しておく使い方ができます
pull_request_check.yml

28 キャッシュの指定方法（キャッシュを作る側） asdfとuvを使っているのでこの2つのファイルを使ってキャッシュキーを生成 sha256sum関数でファイルをハッシュ文字列化指定したパスそのものがキャッシュ対象 (～/はカレントユーザーのホームディレクトリの意味) pull_request_check.yml

29 キャッシュの指定方法（キャッシュを使う側）キャッシュキーとキャッシュから復元したいパスを列挙 pull_request_check.yml 次のページから別の話題に移ります

GitHub Actionsによる品質とセキュリティのチェック

31 CI/CDでできる品質チェックチェック内容説明 Lint（静的解析）ソースコードの書式、関数同士が繋がっているかなどをチェックする自動テストいわゆるユニットテスト、E2Eテストカバレッジ
自動テストでどの程度ソースコードをテストしたか計測する手法一般的に80％を超えれば一定品質を保てていると言われる SCA 使用ライブラリに脆弱性がないかチェックする SAST SQLインジェクションなど、脆弱なソースコードが含まれていないかチェックする

32 GitHub ActionsでLintを実行する ⚫ Lintのコマンドは、エラーがあるとエラーコードを返すので、その時点でGitHub Actionsのワークフローが中断されます pyproject.toml pull_request_check.yml

33 GitHub Actionsで自動テストを実行する ⚫ 自動テストのコマンドは、エラーがあるとエラーコードを返すので、その時点でGitHub Actionsのワークフローが中断されます pyproject.toml pull_request_check.yml

34 CI/CDでできるセキュリティチェック ⚫ SCA  使用ライブラリに脆弱性がないかチェックする  GitHubにはDependabotというSCAツールがあります  Dependabotは独立した機能でCI/CDには組み込みづらいので、今回はOSSの
SCAツールであるTrivyを用いた方法を紹介します ⚫ SAST  SQLインジェクションなど、脆弱なソースコードが含まれていないかチェックする  GitHubにはCodeQLというSASTツールがあります  CodeQLの使用にはGitHub Advanced Securityの契約が必要な場合があるため、今回はOSSのツールであるSemgrep（CE版）を使った方法を紹介します

35 SCAのイメージパッケージ名バージョンインストール元 numpy 1.26.4 PyPI pandas 2.2.3
PyPI requests 2.32.3 PyPI fastapi 0.115.0 PyPI uvicorn 0.31.0 PyPI 識別子対象パッケージ影響バージョン深刻度 CVSSスコア CVE-2024- 12345 requests ～2.32.3 High 8.8 使用ライブラリ一覧脆弱性データベース

36 脆弱性データベースのイメージ - CVEとNVDとJVN CVE 共通脆弱性識別子 NVD National Vulnerability Database
アメリカ国立標準技術研究所(NIST) JVN Japan Vulnerability Notes JPCERT/CCとIPAが共同で運営連携連携

37 GitHub ActionsでSCAを実行する trivy-config.yaml pull_request_check.yml

38 GitHub ActionsでSASTを実行する ⚫ Semgrepについては、有料版であればSASTに加えてSCAとしても動作させることができます ⚫ 今回はSemgrepの無料版（CE版）を用いた例なので、SemgrepをSASTとしてのみ使用しています pyproject.toml pull_request_check.yml 次のページから別の話題に移ります

GitHub Actionsからの AWSの操作チェックという趣旨からは外れますが、ここからAWSへのデプロイについて触れます

40 GitHub ActionsからAWSを操作するにはOIDCを使用する GitHub Actions OIDC (OpenID Connect) AWS OIDCプロバイダ
IAMロール IAMロールの ARN ⚫ GitHub Docs - アマゾンウェブサービスでの OpenID Connect の構成 ⚫ Amazon AWS Documentation - IAM で OpenID Connect (OIDC) ID プロバイダーを作成する

41 AWSアカウントにOIDC用のプロバイダとIAMロールを作成しておく { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow",
"Principal": { "Federated": "arn:aws:iam::123456123456:oidc-provider/token.actions.githubusercontent.com" }, "Action": "sts:AssumeRoleWithWebIdentity", "Condition": { "StringLike": { "token.actions.githubusercontent.com:sub": "repo:octo-org/octo-repo:*" }, "StringEquals": { "token.actions.githubusercontent.com:aud": "sts.amazonaws.com" } } } ] } IAMロールに設定するポリシー octo-org 組織に属する octo-repo リポジトリ内で実行されるすべての GitHub Actions ワークフロー（＝全ブランチ・全タグ・全PR）から使用可能という意味

42 シークレットにOIDC用のIAMロールのARNを設定する pull_request_check.yml GitHubリポジトリの設定画面

43 GitHub ActionsでAWS CLIでデプロイを実行する pull_request_check.yml

44 GitHub ActionsのログをAIに分析させるこのエラーログを生成AIに渡すと原因の調査ができます

まとめ

46 まとめ ⚫ AIは、AI自身の持っている情報などの鮮度ゆえに、十分な品質を保っていないコードを出力することがあります ⚫ これに対しては、AIを介さない機械的なチェックの方が有効です ⚫ GitHub ActionsなどでCI/CDを組めば、レビュー前やデプロイ前に品質チェックを
入れることができます ⚫ 品質チェックに時間がかかりすぎると、無視されたり、コストが問題になる可能性があるので、並列化やキャッシュを活用してみてください

人間とAI、どちらが書いたコードもCICDでチェックしてみよう

人間とAI、どちらが書いたコードもCICDでチェックしてみよう

More Decks by Satoshi Kaneyasu

Other Decks in Programming

Featured

Transcript