Slide 1

Slide 1 text

”知のインストール”戦略: テキスト資産をAIの⽂脈理解に活かす @zawakin (株式会社ナレッジワーク)

Slide 2

Slide 2 text

© Knowledge Work Inc. ⾃⼰紹介 zawakin (@zawawahoge) 株式会社ナレッジワーク AIエンジニア エキスパート (2020年⼊社) ⾃社開発BtoB SaaS「ナレッジワーク」のAI機能開発‧導 ⼊を多数経験。 現在やっていること ● AI技術戦略策定 ● AIエージェント開発 ● 組織イネーブルメント(社内AI活⽤推進含む) 2 今の所Cursorが好き

Slide 3

Slide 3 text

© Knowledge Work Inc. Profile 会社概要 3 Profile 会社概要 創業日 代表者 事業内容 2020年4月1日 麻野 耕司 ナレッジワークの開発・提供

Slide 4

Slide 4 text

© Knowledge Work Inc. Agenda ⽬次 4 ● 課題:AIは「組織の⽂脈」を読めない? ● 戦略:「テキスト資産」から「知」をインストール ● 実践:「知の構造化」プロセスと結果 ● 展望:AIによる「⽂脈理解」のその先

Slide 5

Slide 5 text

© Knowledge Work Inc. Agenda ⽬次 5 ● 課題:AIは「組織の⽂脈」を読めない? ● 戦略:「テキスト資産」から「知」をインストール ● 実践:「知の構造化」プロセスと結果 ● 展望:AIによる「⽂脈理解」のその先

Slide 6

Slide 6 text

© Knowledge Work Inc. ナレッジワークはAIを使った開発を進めてます 6 背景:ナレッジワークはAIを使った開発を進めてます GitHub Copilot Cursor Cline Devin etc.

Slide 7

Slide 7 text

© Knowledge Work Inc. 7 ⼤規模コードベースにおいて AI Coding を導⼊する際の課題の⼀つ ↓ 「組織の⽂脈」を伝えることが難しい! 課題

Slide 8

Slide 8 text

© Knowledge Work Inc. AIの進化とコンテキストサイズ 8 8 理論上は、⼤規模コードベースも扱える!? → これで⼤規模開発の課題は全て解決… ?? AIコーディングツール、⽇々進化中 → Cursor, Cline, Devin, … → AI Agent でソフトウェア開発をするのが当たり前の時代に突⼊ LLMの驚異的な進化、特に「コンテキストウィンドウ増加」 ● 2023年: 10万トークンが最先端 ● → 2025年初頭: 100万~200万トークン時代へ! (数百万トークン)

Slide 9

Slide 9 text

© Knowledge Work Inc. コンテキストサイズが⼤きくなっても、 依然として課題がある 9 巨⼤なコンテキストサイズだけでは解決しない「壁」

Slide 10

Slide 10 text

© Knowledge Work Inc. 巨⼤なコンテキストサイズだけでは解決しない「壁」 10 10 ⼤きなコンテキストサイズを持つだけでは、 AIは真の「組織の⼀員」にはなれない 深い「⽂脈理解」の難しさ ● 組織⽂化、歴史的経緯、暗黙のルール、設計思想の"ニュアンス" etc. ● 例:「この部分は昔問題があったから、あえてこう書いてる」等はAIには分からない 効率‧コスト‧ノイズの問題 ● 巨⼤なコンテキストを毎回処理 → コスト‧速度は現実的? ● ⼤量の情報(ノイズ含む)から本当に重要な情報を⾒つけられる? 組織ルールの反映不⾜ ● コンテキストサイズが⼤きくても「私たちのチームのコーディングスタイル」を完全に守っては くれない…

Slide 11

Slide 11 text

© Knowledge Work Inc. 加えて、私たち⼈間側にも ボトルネックがある 11 「AIに教える」側の難しさ

Slide 12

Slide 12 text

© Knowledge Work Inc. 「AIに教える」側の難しさ 12 12 AIの限界 (⽂脈理解など) + ⼈間の限界 (ルール作成など) → AIに「何を」「どうやって効率的に」教えるかが、これからの鍵! ここで⾔う「AIに組織知⾒を教える」とは主に以下の⼆つ ● ルールファイル/コンテキスト(Cursor,Cline等) ● プロンプトエンジニアリング ⾔語化が難しい (暗黙知をどうやってルールに?) 粒度が難しい (どこまで細かく書けばいいの?) 管理が⼤変 (ルールが増えるとメンテできない…)

Slide 13

Slide 13 text

© Knowledge Work Inc. Agenda ⽬次 13 ● 課題:AIは「組織の⽂脈」を読めない? ● 戦略:「テキスト資産」から「知」をインストール ● 実践:「知の構造化」プロセスとと結果 ● 展望:AIによる「⽂脈理解」のその先

Slide 14

Slide 14 text

© Knowledge Work Inc. では、どうやってAIに 「組織の⽂脈」を効率的に教えるか? 14 我々の戦略:テキスト資産からの「知」の抽出と構造化

Slide 15

Slide 15 text

© Knowledge Work Inc. 戦略:テキスト資産からの「知」の抽出と構造化 15 15 組織内に眠る「テキスト資産」は宝の⼭ 着眼点:組織内に眠る「テキスト資産」 ● GitHub Pull Request レビューコメント (数千〜数万件)、議事録、スタイルブック etc. ○ これらは単なる過去の記録ではない GitHub 議事録 …

Slide 16

Slide 16 text

© Knowledge Work Inc. 戦略:テキスト資産からの「知」の抽出と構造化 16 16 ⼤量の⽣情報(ノイズ含む)をAIに探させるのではなく… → 凝縮された重要な「知」を与えることで効率と精度を両⽴ ● Step1: テキスト資産から「知(ルール、原則、価値観)」を抽 出 ● Step2: AIが理解しやすい形に構造化‧凝縮する ● Step3: 構造化された「知」をAIにインストール(ルールや原則 をプロンプトに⼊れる)

Slide 17

Slide 17 text

© Knowledge Work Inc. この「知のインストール」戦略によって ⽬指すもの 17 ⽬指す姿:AIを「良き開発パートナー」へ

Slide 18

Slide 18 text

© Knowledge Work Inc. ⽬指す姿:AIを「良き開発パートナー」へ 18 18 AIを真の「良き開発パートナー」に育てましょう AIが組織の「⽂脈」を深く理解 ● 単なるコード⽣成ツールを超えた存在へ より「筋の良い」コード⽣成 ● 組織のルールや設計思想を⾃然に反映 ○ → コード品質向上、レビュー負荷軽減に繋がる ⼈間とAIのより⾼度な協調 ● AI:組織知に基づいた的確な提案‧⽀援 ● ⼈間:より創造的なタスク、本質的な課題解決に集中

Slide 19

Slide 19 text

© Knowledge Work Inc. Agenda ⽬次 19 ● 課題:AIは「組織の⽂脈」を読めない? ● 戦略:「テキスト資産」から「知」をインストール ● 実践:「知の構造化」プロセスと結果 ● 展望:AIによる「⽂脈理解」のその先

Slide 20

Slide 20 text

© Knowledge Work Inc. では、具体的にどうやって「知」を 抽出‧構造化するか? 20 実践プロセス全体像:組織知をAIに繋ぐまで

Slide 21

Slide 21 text

© Knowledge Work Inc. 21 実践プロセス全体像:組織知をAIに繋ぐまで 1. データ収集 2.ルール抽出 3.原則導出 4.開発活⽤ 今⽇はこのステップを順にご紹介します!

Slide 22

Slide 22 text

© Knowledge Work Inc. Step 1: 貴重な「テキスト資産」の収集 22 22 対象ユーザーや期間を絞って収集も可能 対象データ: 厳選されたGitHubレビューコメント(数千件) ● なぜコメント? → コードベースの「Why」を含む質の⾼い知⾒の宝庫だから 収集⽅法: GitHub API を利⽤ (Tips) ● 権限は Read access to metadata and pull requests でOK (Fine-grained Token) ● ⾃動化: Pythonスクリプトで⼀括ダウンロード GitHub コメント コメント コメント コメント

Slide 23

Slide 23 text

© Knowledge Work Inc. ⽬的: ⼤量のコメントから「ルール」の候補を効率的に抽出 (1) まず「観点」を設定: ● ChatGPT等に問いかけ、⼀般的なレビュー観点6つを⽣成 ○ 例: 「コードスタイル」「機能実装」「設計」「設計‧モジュール化およびAPI/インターフェース設計」「ドキュメント‧コメントのルール」「テストコードとテスト戦略」「インフラ‧設定‧その他の改善点」 (2) バッチ処理で効率化: ● 全コメントを100件ずつのバッチに分割 ● 各バッチ × 6観点 でLLM (OpenAI o3-mini) でルール抽出 (3) LLMへの指⽰ (プロンプト): ● 例:以下のレビューコメント群から、「{観点名}」に関するルールとその具体例を抽出してください。 ● 特に、内容例とポイントを具体的に⽰してください。 (4) 結果: ● 各観点ごとにルール候補が多数抽出される ● → 全体で約62万⽂字のルールテキスト (JSON) が⽣成! ルール ルール コメント コメント コメント コメント Step 2: LLMを活⽤したルールの⾃動抽出 23 23 同じコメントセットから多⾓的に情報を抽出 → 情報損失を最⼩化!

Slide 24

Slide 24 text

© Knowledge Work Inc. 「コードスタイル」ルール コメント コメント コメント コメント Step 2: LLMを活⽤したルールの⾃動抽出 24 24 コメントセットのバッチ処理で多⾓的に情報を抽出 → 情報損失を減らす! コメント コメント コメント コメント 「API/インターフェイス 設計」ルール コメント セット … コメント セット … 観点1 観点2

Slide 25

Slide 25 text

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 25 25 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出 ⽬的: 抽出された⼤量のルール候補 (重複も含む)から、本質的で汎 ⽤的な「原則」を導き出す ⽅法: ● 約62万⽂字のルールJSONを Gemini 2.5 Pro (1M トークン!) に⼀括⼊⼒! ● → LLMにルールのグルーピングと抽象化を指⽰ ルール ルール ルール ルール 原則 原則 ルール ルール 3600個 30個

Slide 26

Slide 26 text

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 26 26 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出 ルール ルール ルール ルール 原則 原則 ルール ルール 3600個 30個 ⼤原則 6個

Slide 27

Slide 27 text

© Knowledge Work Inc. 結果:⾒えてきた「組織の⼤原則」 27 27 AIのためのルール化が、結果的に組織⽂化‧価値観の⾔語化にも繋がった! 可読性 & 保守性 ⼀貫性 & 予測可能性 堅牢性 & 信頼性 テスト容易性 & 品質保証 関⼼事の分離 & 疎結合 明確な意図の伝達

Slide 28

Slide 28 text

© Knowledge Work Inc. Agenda ⽬次 28 ● 課題:AIは「組織の⽂脈」を読めない? ● 戦略:「テキスト資産」から「知」をインストール ● 実践:「知の構造化」プロセスと結果 ● 展望:AIによる「⽂脈理解」のその先

Slide 29

Slide 29 text

© Knowledge Work Inc. 抽出‧構造化された「組織知」を、 どうやって⽇々の開発に活かすのか? 29 今後の活⽤イメージ:AIエディタ連携

Slide 30

Slide 30 text

© Knowledge Work Inc. ⽬標: Cursor などのAIエディタのルールファイルとしてチームで運⽤! 今後の活⽤イメージ:AIエディタ連携 30 原則 原則 ⼤原則 ルール ファイル ルール ルール 実現したいこと: ● AIがコード⽣成や提案を⾏う際に、常に組織の原則‧ルールを考慮する ● 開発者が都度指⽰せずとも、⾃然と「組織らしい」コードが書ける世界へ

Slide 31

Slide 31 text

© Knowledge Work Inc. まとめとメッセージ 31 ● 今⽇のポイント ○ AI時代、「組織知」は競争⼒の源泉 (テキスト資産は宝の⼭!) ○ AIの⽂脈理解を深めるため「知の構造化」を実践しよう ● まとめ ○ AIに"何を教えるか"で差がつく ○ 組織の強みを⾔語化し、AI時代の競争⼒を築こう 「知の構造化」、 ⼩さな⼀歩から始 めてみませんか?

Slide 32

Slide 32 text

© Knowledge Work Inc. 【宣伝】エンジニア積極募集中! 32 32 https://kwork.studio/recruit-engineer ナレッジワークではエンジニアを絶賛大募集中です!

Slide 33

Slide 33 text

No content