Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Factory AI - Agent-Native Software Developmentの全貌

Factory AI - Agent-Native Software Developmentの全貌

https://daisuke.masuda.tokyo/article-2025-11-03-0139

本プレゼンテーションは、4種類の専門Droid(Code、Reliability、Knowledge、Tutorial)を備えたエージェントネイティブ開発プラットフォーム「Factory AI」を19枚のスライドで解説しています。計画とタスク分解、HyperCodeによるコード理解、ByteRank検索最適化といった核心技術を詳述し、単純なLLMラッパーとの違いを明確化します。基本的な利用方法(テスト自動生成、コードレビュー、インシデント対応)から応用的な活用法(マルチリポジトリ変更、コンプライアンスゲート、DroidShieldセキュリティ)まで網羅し、エンジニア向けにタスク粒度、コンテキスト供給、CLI/CI統合、モデル戦略などの実践的Tipsを提供します。Devin AI、GitHub Copilot Workspaceとの比較により適切なツール選択を支援し、Clariの導入事例で開発速度40%向上、レビュー時間60%削減、技術的負債70%解消を実証します。エンタープライズグレードのセキュリティ(SOC 2 Type II、GDPR、HIPAA対応)、4ステップの導入ロードマップ、包括的サポート体制で締めくくられています。

Avatar for Daisuke Masuda

Daisuke Masuda PRO

November 02, 2025
Tweet

More Decks by Daisuke Masuda

Other Decks in Technology

Transcript

  1. AGENT-NATIVE DEVELOPMENT Factory AIは「どこ でも動作する」 AIエー ジェント開発プラット フォーム 「Droids」と呼ばれる専門化されたAIエージェントが、開発者の既存ワ ークフローを変えることなく、あらゆる環境で動作します。IDE、ター

    ミナル、Slack、Webなど、開発者が使用するすべての場所でシームレ スに統合されます。 マルチインターフェース対応 VS Code、JetBrains、Vim、CLI、 Slack/Teamsなど、あらゆる環境で動作 ワークフロー非侵襲性 既存のツール、モデル、ショートカットを そのまま維持 エンタープライズグレード 業界標準のセキュリティとコンプライアン スを完備 ベンダーロックインなし Claude、GPT、Geminiなど任意のモデルを 選択可能 導入企業:Podium、EY、eightfold.ai、Parafin、Framer、Clari $120M 評価額 Sequoia Capitalから$15Mの資金調達を受け、総額 $20M以上の調達を達成
  2. SPECIALIZED AI AGENTS - PART 1 専門化された Droidsが 開発ライフサイクル全体をカバー THE

    BUILDER Code Droid コード生成、リファクタリング、バグ修正など、コーディングタスク全般を担当。自然言語の指示から本番環境対応の機 能を構築し、数千の決定を必要とする複雑なエンジニアリングタスクを自律的に実行します。 THE GUARDIAN Reliability Droid システムの安定性監視、インシデント対応、パフォーマンス最適化を担当。Slack/Teamsと統合し、インスタントなイン シデント解決を実現します。本番環境の問題を迅速に検知し、自動的に修正案を提示します。 Part 2では、Knowledge DroidとTutorial Droidを紹介 します。 01 02
  3. SPECIALIZED AI AGENTS (続き) 専門化された Droidsが 開発ライフサイクル全体をカバー THE SCHOLAR Knowledge

    Droid コードベースの理解、ドキュメント生成、技術的な質問への回答を 担当。数百万行のコードベースを瞬時に理解し、データ分析やコー ドマイグレーションを支援します。APIドキュメントの自動生成も可 能です。 THE MENTOR Tutorial Droid Factory自体の使い方を学習者に教え、オンボーディングプロセスを 効率化します。インタラクティブなガイドを提供し、新しいチームメ ンバーが迅速に生産性を発揮できるようサポートします。 4つの専門化されたDroidsが、コード生成からシステム監視、知識管理、オンボ ーディングまで、開発ライフサイクル全体をシームレスにカバーします。 03 04
  4. CORE TECHNOLOGY Droidsを支える 4つの核心技術 Droidsは単なるLLMラッパーではなく、ロボット工学 や認知科学の技術を応用した高度なエージェントシス テムです。4つの核心技術が、複雑なソフトウェア開発 タスクの自律的な実行を可能にします。 これらの技術は相互に連携し、人間の開発者と同じフィードバック ループとイテレーションサイクルを共有します。開発環境に完全に

    接地し、既存のツールチェーンをそのまま活用できる設計思想が特 徴です。 技術的優位性 多解像度表現とマルチモデル戦略により、コードベースの深い理解と高 精度な情報検索を実現。ロボット工学の自己批評能力により、複雑な決 定を自律的に実行します。 計画 /タスク分解 高レベルの問題を小さなサブタスクに分解し、 最適な軌道を計算します。ロボット工学や認知 科学の技術を応用した自己批評能力と決断シミ ュレーションにより、複雑なソフトウェア開発 タスクを効率的に実行します。 ツール統合と環境接続 バージョン管理、エディタ、デバッガ、リン タ、静的解析ツールなど、人間開発者が使用す るすべてのツールにアクセスします。開発環境に 完全に接地し、人間と同じフィードバックルー プを共有します。 HyperCode コード理解 エンジニアリングシステムの多解像度表現を構 築し、コードベースの深い理解を可能にしま す。明示的(グラフ)および暗黙的(潜在空間 類似性)な関係を自律的に構築し、異なる抽象 レベルでの洞察を抽出します。 ByteRank 検索最適化 特定のタスクに関連する情報を高精度に検索す るアルゴリズムを実装。HyperCodeで構築され た洞察とデータを活用し、タスク実行に必要な 正確な情報を取得します。コンテキスト情報の 精度を大幅に向上させます。 これらの技術により、Droidsは大規模コードベースでも高い精度で動作し、SWE-benchで19.27%(Full 版)、31.67%(Lite版)のスコアを達成しています。
  5. BASIC USAGE 日常的な開発タスクを 自然言語で委任 40% 時間削減 定型タスクの処理時間を 大幅に短縮 24/7 常時対応

    いつでもどこでも Droidsが稼働 Factory AIの最も基本的な利用方法は、日常的な開発タスクをDroidsに委任することです。開発 者は自然言語で指示を出し、Droidsが実装からテストまでを自律的に実行します。 1. ユニットテストの自動生成 コードベースとREADMEをアップロードし、「この関数のユニットテストを作成して」と指示するだけ で、包括的なテストケースが生成されます。 2. コードレビューの自動化 プルリクエストをDroidsに渡すと、コード品質の分析、潜在的なバグの検出、改善提案を自動的に行い ます。 3. インシデント対応の迅速化 Slackで「本番環境でエラーが発生している」と報告すると、Reliability Droidがログを分析し、原因を 特定し、修正案を提示します。 4. ドキュメント生成の自動化 「このAPIのドキュメントを作成して」と指示すると、Knowledge Droidがコードを分析し、使用例を 含む包括的なドキュメントを生成します。
  6. ADVANCED USE CASES 大規模リファクタリングと 技術的負債の解消を加速 8x 効率向上 エンジニアリング時間を 劇的に削減 20x

    コスト削減 大規模マイグレーションで 実証済み Factory AIの真価は、人間にとって単調で時間のかかる大規模タスクで発揮されます。数百 万行のコードベースに対する一貫した変更を、並列実行により劇的に加速できます。 レガシーコードのマイグレーション 古いフレームワークから新しいバージョンへの移行、言語の変更など、数千のファイルに及ぶ変更 を自動化。Clariの事例では8年間蓄積されたコードを数週間でリファクタリング。 内部ツールとダッシュボードの構築 要件を自然言語で説明すると、React、recharts、shadcn/uiなどを使用した本格的な内部ツールを 生成。データ統合、フィルタリング、ソート機能も実装されます。 データサイエンスワークフローの自動化 データ前処理、探索的データ分析、特徴量エンジニアリング、モデル評価まで、データサイエンス パイプライン全体を自動化。適切な機械学習モデルを提案します。 デザインからコンポーネントへの変換 デザインモックアップの画像をアップロードすると、レイアウトを分析し、レスポンシブでアクセ シブルなコンポーネントコードを生成します。
  7. ADVANCED USE CASES - PART 2 エンタープライズ運用を 加速する高度な機能 Factory AIは、大規模な組織での運用に必要な高度な機能を提供します。複数リポ

    ジトリの管理、セキュリティとコンプライアンスの確保、システム全体のパフォ ーマンス最適化など、エンタープライズ開発の課題を解決します。 マルチリポ横断一括変更 API変更や依存関係更新に伴う複数リポジトリ横断の変更を自動化。影響範囲 の特定から変更の整合性確認、テストまでを一貫して処理し、変更の伝搬ミス を防止します。マイクロサービスアーキテクチャでの一貫性維持に不可欠な機 能です。 コンプライアンス /品質ゲート DroidShieldによるセキュリティやコンプライアンス違反の静的検査を自動 化。CI/CDパイプラインに組み込み、品質基準を満たさないコードの早期発見 と修正提案を行います。SOC 2、GDPR、CCPA、HIPAAなどの規制要件に対応 します。 パフォーマンス最適化 システム全体のプロファイリングから改善対象の特定、最適化コードのPR作 成、改善効果の検証まで自動化。データ構造の効率化やアルゴリズム改善を提 案し、システムのスケーラビリティを向上させます。 DroidShield: セキュリティとコンプライアンスの守護者 DroidShieldは、Factory AIのセキュリティとコンプライアンスを確保する保護機能です。静的検査により、コ ードが組織のセキュリティポリシーとコンプライアンス要件を満たしていることを自動的に検証します。詳細 な機能と統合ポイントは次のスライドで紹介します。
  8. DROIDSHIELD セキュリティとコンプライアンスの 自動検証システム DroidShieldは、Factory AIのセキュリティとコンプラ イアンスを確保する保護機能です。静的検査により、 コードが組織のセキュリティポリシーとコンプライア ンス要件を満たしていることを自動的に検証します。 主な機能 静的コード解析

    コードの構造とパターンを分析し、潜在的なセキュリティリスクを特定し ます。OWASP Top 10などの標準的な脆弱性パターンを検出します。 脆弱性スキャン 既知の脆弱性データベース(CVE、NVD)と照合し、依存関係に含まれる 脆弱性を検出します。自動的に修正パッチを提案します。 ライセンス違反検出 オープンソースライセンスの互換性を検証し、組織のライセンスポリシー に違反する依存関係を特定します。 機密情報漏洩防止 APIキー、パスワード、トークンなどの機密情報がコードに含まれていな いかスキャンします。コミット前に警告を発します。 統合ポイント CI/CDパイプライン ビルドプロセスに組み込み、品質ゲートとして機 能します。基準を満たさないコードはデプロイを ブロックします。 プルリクエスト PRの作成時に自動的にスキャンを実行し、レビュ アーに結果を通知します。修正提案を自動的にコ メントします。 コミット前フック 開発者のローカル環境でコミット前にスキャンを 実行し、問題を早期に発見します。即座にフィー ドバックを提供します。 定期スキャン 既存のコードベースを定期的にスキャンし、新た に発見された脆弱性を検出します。週次または月 次でレポートを生成します。 導入効果 DroidShieldの導入により、セキュリティインシデントの発生率が平均60%減少し、コンプ ライアンス監査の準備時間が75%短縮されました。開発チームは、セキュリティ専門家の介 入なしに、安全なコードを継続的に提供できるようになります。 SOC 2、GDPR、CCPA、HIPAAなどの主要な規制要件に対応し、エンタープライズグレードのセキュリテ ィを実現します。
  9. BEST PRACTICES Factory AIの生産性を 最大化する 5つのベストプラクティス AIエージェントを効果的に活用するには、適切な指示の出し方と検証プロセスが 重要です。以下のTipsを実践することで、Factory AIの価値を最大限に引き出せま す。

    Tip 1: コンテキストを明確に提供 README、関連コード、エラーログを一緒に提供することで、Droidsの理解精 度が向上します。 Tip 2: タスクを適切な粒度に分割 大規模な機能追加は段階的に分割し、各ステップでレビューすることで方向性 のずれを防ぎます。 Tip 3: 自律性レベルを調整 新しいプロジェクトでは低い自律性で頻繁に確認し、慣れてきたら高い自律性 で効率を優先します。 Tip 4: カスタム Droidsを活用 プロジェクト固有のパターンやコーディング規約をカスタムDroidsに学習させ ることで一貫性を確保します。 Tip 5: 常にコードレビューを実施 AIが生成したコードは必ずレビューし、統合ターミナルでテストします。問題 があればRepair機能で自動修正できます。 AI活用の成熟度曲線 AIエージェントは開発者を置き換えるのではなく、増強します。単調で反復的なタスクを委任す ることで、創造的な問題解決と戦略的な意思決定に集中できます。
  10. ENGINEER TIPS - PART 2 さらなる効果を引き出す 実践的な Tips Factory AIの効果を最大化するための追加のベストプラクティスを紹

    介します。これらのTipsを実践することで、開発チーム全体の生産性 と品質を向上させることができます。 droid CLI+ CI統合 ローカル開発とCI/CD環境で同一のDroidワークフローを実行することで、 一貫性のある結果と再現性の高い自動化プロセスを実現します。開発者のロ ーカル環境での実行結果がCI/CDでも同じになるため、デバッグが容易にな ります。 ガードレールの設定 変更可能なファイル範囲や実行許可コマンドをホワイトリスト化すること で、予期せぬ変更や実行リスクを低減し、セキュリティを確保します。重要 なファイルやシステムコマンドへのアクセスを制限し、安全な運用を実現し ます。 効果的なレビュー運用 Factoryのネイティブdiffビューアと承認フローを必須プロセスとして導入 し、AIによる変更を人間が常に検証・承認する体制を確立します。AIの出力 を盲目的に信頼せず、適切なガバナンスを維持します。 タスク粒度の最適化 明確な受入基準(AC)付きで小さなタスクに分解 して委譲することで、AIエージェントの成功率が向 上します。範囲が限定されるほど、コンテキスト理 解と実装の質が高まります。1つのタスクは1つの 機能に集中させます。 コンテキスト供給の充実化 README、アーキテクチャ文書、設計決定記録 (ADR)、関連チケットなどをDroidsに連携する ことで、背景理解を深め、適切な意思決定を促進で きます。コンテキストが豊富なほど、より適切な実 装が生成されます。 モデル戦略の最適化 タスク種別に応じて最適なLLMモデルを選択し、推 論コストと多様性のバランスを考慮したモデル運用 戦略を策定します。複雑なタスクには高性能モデ ル、単純なタスクには軽量モデルを使い分けます。 継続的な評価体制 SWE-bench系の社内版ベンチマーク(Crucible類 似)を構築し、Droidsのパフォーマンスと改善を 継続的に測定・追跡します。定量的な評価により、 AIエージェントの効果を可視化し、継続的な改善を 実現します。 これらのTipsは、Factory AIを導入した先進企業の実践から得られた知見です。組織の状況に応じてカスタマ イズし、段階的に導入することをお勧めします。
  11. AI DEVELOPMENT TOOLS それぞれの強みを 理解し、用途に応 じて選択する AI開発ツール市場には、Factory AI、Devin AI、GitHub Copilot

    Workspaceという3つの主要プレイヤーが存在します。それぞれ異 なる哲学とアプローチを持ち、適した用途が異なります。 3 主要プレイヤー それぞれが独自の強みを持ち、エンタープライズ市場で競争しています。選 択のポイントは、既存ワークフローとの親和性、カスタマイズ性、エンター プライズ機能です。 項目 Factory AI Devin AI Copilot Workspace 開発元 Factory (Sequoia出資) Cognition Labs GitHub (Microsoft) コアコンセ プト マルチインターフェース対応Droids 完全自律型AIエンジニア エージェント型開発環境 最大の強み 既存ワークフローを変えない柔軟性 大規模リファクタリングの並 列実行 GitHubエコシステム完全統合 価格 BYOK無料、Pro $20/月、Max $200/ 月 Core $20〜、Team $500/月 Copilotサブスクリプション含む 対応環境 IDE/CLI/Slack/Web/PM 専用IDE、Slack/Linear/Jira Web、GitHub Mobile カスタマイ ズ性 高(カスタムDroids、Slash Commands) 高(ファインチューニング対 応) 中(Brainstorm/Plan/Repair agent) エンタープ ライズ SSO、監査ログ、オンプレミス カスタムDevin、セキュリティ 機能 組織ポリシー統合 導入企業 Clari、Podium、EY Nubank、Goldman Sachs GitHub利用企業全般 Factory AI: 既存ツール維持、複数インターフェース柔軟利用 Devin AI: 大規模技術的負債解消、反復的リファクタリング Copilot Workspace: GitHub中心開発、モバイル対応(※Preview終了)
  12. ADVANCED AI TECHNOLOGY 最先端のエージェント技術が 支える高度な自律性 Factory AIは、長期的推論、無限コンテキストエンジン、マルチモデル対応など、 最新のAI技術を統合したプラットフォームです。SWE-benchでFull版19.27%、 Lite版31.67%のスコアを達成し、TerminalBenchベンチマークで第1位を獲得。 技術的優位性を実証しています。

    無限コンテキスト エンジン 数百万行のコードベースを横断的に理解 し、隠れた依存関係や影響範囲を正確に 把握します。 マルチモデル サンプリング 複数の最先端LLMを活用し、様々なモデ ルから複数の解決策を生成。テストで検 証後、最適な解決策を選択します。 エージェント スキャフォールド 複雑なタスクを適切なサブタスクに分解 し、並列実行。結果を統合し一貫性のあ る成果物を生成。 継続的学習 機能 プロジェクトでの使用を通じて、コーデ ィングスタイル、アーキテクチャパター ンを学習します。 業界トップクラスのベンチマーク実績 SWE-benchでFull版19.27%、Lite版31.67%(pass@1)を達成。特に複雑なタスクでも 高い性能を示し、TerminalBenchでは業界第1位を記録しました。
  13. SUCCESS STORY - CLARI Agent- Native開発で 生産性が劇的 に向上 Clariは、売上管理プラットフォームを提供するSaaS 企業で、Factory

    AIを全面採用した先進的な事例で す。開発チーム全体でFactory AIを導入し、開発速度 と品質の両方を改善しました。 40% 開発速度向上 新機能開発のリードタイムが平均40%短縮。特に、ボイラー プレートコード生成、APIエンドポイント実装、テストコー ド作成といった定型的なタスクでの効果が顕著でした。 導入効果の全体像 Factory AIの導入により、Clariは開発プロセス全体で大幅な改善を実現しまし た。開発速度の向上に加えて、コードレビュー時間の削減、技術的負債の解消、 オンボーディング期間の短縮など、多岐にわたる成果を上げています。 詳細な導入効果の測定結果は次のスライドで紹介します。
  14. SUCCESS STORY - CLARI (続き) 具体的な 成果の詳細 30% レビュー時間削減 Code

    DroidによるPRの事前レビューにより、人間のレビュ アーは設計判断や複雑なロジックの検証に集中できるように なりました。レビュー時間が平均30%削減され、マージま での時間が短縮されました。 技術的負債の解消加速 長年放置されていたレガシーコードのリファクタリングを、Factory AIを活用して計画的に 進めることができました。8年間蓄積された数百万行のETLコードのリファクタリングを数 週間で完了。エンジニアは新機能開発に集中しながら、バックグラウンドでDroidsが技術 的負債を解消します。 オンボーディング期間の短縮 新入社員がKnowledge DroidとTutorial Droidを活用することで、コードベースの理解が加 速しました。質問への即座の回答、関連コードの提示により、生産性向上までの期間が半 減しました。従来3-4ヶ月かかっていたオンボーディングが1.5-2ヶ月に短縮されました。 4つの主要指標の改善率
  15. ENTERPRISE SECURITY セキュリティと コンプライアンス Factory AIは、最先端のセキュリティプロトコルを採用し、企業の機密 情報と知的財産を保護します。金融機関や大手企業での導入実績が、そ の信頼性を証明しています。 データ保護 コードとデータは暗号化され、AIモデルのトレーニングには使用されませ

    ん。BYOKプランでは、データが外部に送信されることなく自社環境で処理 されます。 コンプライアンス対応 SOC 2 Type II認証取得済み。GDPR、CCPA、HIPAAなど主要な規制に準拠。 監査ログとアクティビティトレイルによりすべての操作を記録・追跡可能。 エンタープライズ機能 SSO統合によるシームレスな認証、SAML/SCIMプロビジョニング対応、オン プレミス展開オプションで完全なデータ主権を確保、高度なリポジトリ権限 管理。 セキュリティ機能の充実度 エンタープライズグレードのセキュリティは、AI開発ツール導入の前提条件です。Factory AIは、 データ保護とコンプライアンスの両面で業界最高水準を実現しています。
  16. GETTING STARTED 簡単なインストールから本格運用まで、 充実したサポート体制 5分 インストール コマンド一つで すぐに開始 24/7 サポート対応

    エンタープライズ プランで提供 Factory AIの導入は非常にシンプルです。数分でインストールが完了し、すぐに使い始めることがで きます。充実したドキュメント、Discordコミュニティ、エンタープライズサポートにより、スムー ズな導入と運用を実現します。 ステップ 1: インストール( 5分) コマンド一つで、Factory CLIがインストールされます。VS Code、JetBrainsなどのIDE拡張機能も利用可能で す。 curl -fsSL https://app.factory.ai/cli | sh ステップ 2: 初期設定( 10分) BYOKプランの場合は自身のAPIキーを設定、有料プランの場合はアカウント登録を行います。チーム設定、 リポジトリ接続、権限設定を完了します。 ステップ 3: オンボーディング( 1-2週間) Tutorial Droidがインタラクティブなガイドを提供します。小規模なタスクから始めて、徐々に複雑なタスク に挑戦します。 ステップ 4: 本格運用 チーム全体での利用を開始します。Agent-readiness Dashboardで利用状況を監視し、最適化の機会を特定 します。
  17. THE FUTURE OF DEVELOPMENT Agent-Native 開発の未来 Factory AIは、単なるコーディング支援ツールではありません。 開発ライフサイクル全体にAIエージェントを統合する「Agent- Native

    Software Development」という新しいパラダイムを提 唱しています。 AIは開発者を増強 置き換えるのではなく、創造的な問題解決に 集中できるよう支援 ワークフローを尊重 慣れ親しんだツールをそのまま使い続けられ る設計 エンタープライズ実績 Clari、Podium、EYなど大手企業での導入実 績 継続的進化 最新AIモデルの恩恵を即座に享受できる柔軟 性 推奨5ステップ 1. ツール連携:Git/CI/Jira/Slack等との統合と権限/監査の整備 2. パイロット導入:1〜2チームで"テスト自動化/コード移行"から開始 3. KPI設定:MTTR/Lead Time/PR通過率/欠陥密度/生成テスト比率など 4. ガバナンス:DroidShield/承認フロー/モデル方針の標準化 5. スケール:成功パターンのテンプレート化と組織展開 Factory AIで、ソフトウェア開発の未来を今日から体験しましょう。 $120M 評価額 Sequoia Capitalの支援を受け、Agent-Native開発 の新しいパラダイムを切り開く