Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMによる技術ブログレビューを導入した話
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Cloud Ace
April 01, 2024
Technology
540
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMによる技術ブログレビューを導入した話
Cloud Ace
April 01, 2024
More Decks by Cloud Ace
See All by Cloud Ace
今年の最難関と思われるProfessional Security Operations Engineer の概要
cloudace
0
18
Gemini CLI x Google Cloud Document MCP で作る Google Cloud クイズボット
cloudace
0
21
魅力的な LT を作りたい
cloudace
0
15
AIエージェントはqじゃなくてwqしよう
cloudace
0
13
文系からSRE分野に挑戦 ( 新卒 2年目、私がGCP/AWSを学んで 得た気づき)
cloudace
0
53
Gemini を Raspberry Pi で走ら せた経験
cloudace
0
230
ADK / BigQueryで実現する分析エージェントのガバナンス設計
cloudace
0
45
【ガードレール】組織ポリシーで脆弱な設定を防ごう
cloudace
0
150
Cloud RunならDBも含めた ゼロスケールが可能? WordPressをゼロスケールさせた話
cloudace
0
28
Other Decks in Technology
See All in Technology
チームで進めるAI駆動アジャイル×ウォーターフォール
kumaiu
0
150
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
230
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
580
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
740
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
53
59k
Building applications in the Gemini API family.
line_developers_tw
PRO
0
2.9k
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
0
200
Agentic Web
dynamis
1
200
JSAI2026 オーガナイズドセッションOS-27「不動産とAI」趣旨説明 / JSAI2026 Organized Session OS-27 “Real Estate and AI”: Statement of Purpose
ykiyota
0
220
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
210
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
130
Amazon Bedrock AgentCore ワークショップ JAWS UG TOHOKU / amazon-bedrock-agentcore-workshop-jawsug-tohoku-2026
gawa
9
640
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
28
2.6k
My Coaching Mixtape
mlcsv
0
140
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
280
Building the Perfect Custom Keyboard
takai
2
790
30 Presentation Tips
portentint
PRO
1
320
Unsuck your backbone
ammeep
672
58k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
140
Claude Code のすすめ
schroneko
67
230k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
770
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
Transcript
LLM による技術ブログレビューを 導入してみた時の話 Jagu’e’r Tech Writers 分科会 Meetup #3
自己紹介 • 仕事内容 ◦ クラウドエース株式会社 ◦ Google Cloud を中心としたコンサル、インテグレーションに従事 ◦
主にコンテナ領域を専門としながらアプリ、インフラ、マネジメント全般を 担当 • その他 ◦ リモートでの資格試験では自宅の浴室で受験 ◦ Google Cloud Champion Innovators (Modern Architecture, Serverless App Development) ◦ Google Cloud Partner Top Engineer 2024 ◦ Google Cloud Partner Tech Blog Challenge 2024 受賞 間瀬 真 (@Makocchan_Re)
当社は Zenn にて技術ブログを発信してい ますが、レビュープロセスを経て外部公開 をしています。 レビュープロセスに LLM によるレビューを 組み込んだ時の話をします。 &
本日話すこと
ブログ公開までのプ ロセス Zenn 連携用の GitHub リポジトリ ①ブログ執筆 ②Pull Request(PR)作成 ③マネージャーによる
PR のレビュー ④PR マージ ⑤ブログ公開
レビュー観点例 ・文章の内容に(技術的な視点でみて)誤りがないか ・文章表現において分かりづらくないか、不適切ではないか ・Zenn の禁止事項に該当する内容ではないか ・自社の広報で定めるルールに反していないか - Google Cloud を
GCP や Google Cloud Platform と書かないこと - 半角英数記号の前後には半角スペースを挿入すること - 「最強」みたいな誇張表現をしないこと - などなど
私が文書のレビュー が苦手だった 当時(2023 初秋)、LLM のキャッチアップを個人的 にしたかった 動機・課題 GPT-3.5 です GPT-4
です PaLM です PaLM 2 です GPT-4-turbo です
レビュー精度を 評価した上で本格導入 を検討 試用期間 評価 本格導入 Bad... ブログ執筆者による フィードバックを収集
50%以上の Good 評 価を目標として設定 50 %
Slack での レビュー運用を構築 Slack レビュア(bot) 記事執筆 特定チャンネルより レビュー依頼 レビュー結果の返信 Bad...
レビュー結果に対する評価 slack-app slack-app 評価の蓄積 ※ Slack は、米国およびその他の国で登録された Slack Technologies, Inc. の商標およびサービス マークです。
期待値コントロール のためのキャラ設定 @article-reviewer さん • 記事内容をチェックするプロフェッショナル • おじいちゃんなので的外れなことも多々指摘してし まいます。 •
真面目すぎて文章内容のチェックしかできず、会話 することはできません。
本格導入判断ライン 評価期間において、 約 80% 以上ポジティブ な評価を獲得
評価振り返り 精度には関係ないバグでネガ ティブ評価をもらってしまうこと も 精度の問題によるレビュー指 摘誤りも多々見られた レビュー指摘された箇所が分かりにくい。指摘箇所 の行数を教えてくれるが誤っている。 修正不要な指摘をしてしまう 自分の名前が誤りと指摘された
などなど
本格運用では、GitHub Actions によるレビュー を実施 記事執筆 GitHub Actions LLM によるレビュー レビュー結果を
PR レビューコメントまた はコメントとして追加 レビュー結果/評価結果の蓄積 GitHub リポジトリ
暫定運用からの改善点 その 1 レビュー指摘箇所の特定は LLM にはやらせない
暫定運用からの改善点 その 2 LLM による W チェックを導入 レビュー結果 一次レビュー 二次レビュー
(おじいちゃんとはライバル関係) 最終判断は人間に委ねるように注意を促す
暫定運用からの改善点 その 3 コードのレビューは止める ブログでのコードはサンプルコードや一部簡略化された 記載が多く、指摘としては多いが修正に繋がらないので トークンの無駄と判断 コードレビューに使うくらいなら、 W チェックにトークンを
割いた方がいいと判断
まとめと感想 LLM に全てをやらせない。ルールベースにできるも のはその方が確実なのと、プロンプトも減るので他 の観点の精度向上が期待できる。 誤字脱字や不自然な文章表現、固有名詞の誤りな どの検出は得意そう。 私のレビューは不要にならなかった。 現状はあくまでも文章校正のセルフチェックツール としての位置付けに。
Thank you ※Google Cloud は Google LLC の商標です。