Weekly AI Agents News! 12月号プロダクト/ニュースのアーカイブ

Weekly AI Agents News @ottamm_190 1２月号プロダクトニュース編

はじめに • LLMエージェントに関するニュースや論文をほぼ毎週更新しています。 • 論文、プロダクトの順番でまとめています。 • 個人の備忘録で取り組んでおり、誤りがある場合もあります。 • 文字サイズ16ptで小さいのでPCで見ることをおすすめします。 •
SpeakerDeckに過去の4月、5月、6月、７月、8月、9月、10月、11月の資料を分けて公開しています。 • 7月から隔週で更新します。

12月30日更新リリース • AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始ブログ • Weekly AI
Agent News!から見えたAIエージェントの現在地 • AIエージェントビジネスの現状と今後の考察 • 生成AIエージェントが刺さる業務課題を探そう！ • 2024年生成AIエージェントのおすすめ論文 16選 • AIエージェントの評価 • 10 AI Trends in 2025 You Can't Miss • 15 Agentic Systems and Frameworks of 2024 • Top 10 Research Papers on AI Agents • AI Agent Trends: Skills and Workforce Insights for 2024 • Top 10 AI Agent Trends and Predictions for 2025

12月30日更新ブログ • Building effective agents • Multi AI
Agents In Production • 【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所 • Agentic AI vs Generative AI: Understanding the Key Differences and Impacts • AI エージェントで実現する業務効率化とイノベーション: 日本の最新事例授業 • Reasoning with o1

AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始企業固有の業務にあわせて実務に即した課題を解決する企業専用AIエージェントを開発 https://www.cyberagent.co.jp/news/detail/id=31196 利用イメージ

Weekly AI Agent News!から見えたAIエージェントの現在地 2024年のエージェント開発動向と技術的な気づきマクロレベルのアーキテクチャはほぼ同じ • 2023年夏頃までにエージェントの基礎的構成要素（知覚、プロフィール、プランニング、ツール利用、メモリ、リフレクション）は出揃い、2024年にはそれを発展させる研究が続いた細部の作り込みの工夫
• メモリ管理やプロンプト設計、環境情報（RAGやツール）を磨くことで、タスク成功率を一定レベルまで底上げできる • ただし、一定水準を超えると性能が頭打ちになりがち 2024年は応用分野の開拓が進んだ • コンピュータ操作、データ分析、レポート生成、製造現場、教育支援など、多くのベンチマークや業務適用の事例の登場 “エージェントを作り込んだら精度が本当に上がるのか” という疑問 • エージェントが複雑化しても、最終的な精度向上幅は数％〜10％ほどで、思ったほど大きくない • 多くの論文は同じ課題にぶつかり、根本的にはLLMの限界を超えられない場合が多い https://masamasa59.hatenablog.com/entry/weekly-ai-agent-journey

著者が重視、主張していることはなんだと思いますか Weekly AI Agent News!から見えたAIエージェントの現在地著者が特に強調しているのは、 • エージェントの基礎技術はすでに出揃っており、マクロレベルのアーキテクチャはどれも似通っているが、細部の作り込みによって性能や使い勝手に差が生まれる •
LLMの性能向上に依存する部分が大きく、アーキテクチャやプロンプトを工夫しても大幅な性能改善は難しい • ビジネス活用では、エージェントが苦手とする領域を避けつつ、限界にぶつからない範囲で現実的な価値を出すのが重要である • どの会社でも使える標準的な設計を押さえたうえで、細部の作り込みやタスクの絞り方を賢くやり、現場で成果を上げていこう https://masamasa59.hatenablog.com/entry/weekly-ai-agent-journey

AIエージェントビジネスの現状と今後の考察多様な企業・ベンダーが参入 • 大手クラウドベンダーは「Agent Builder」を提供し、業務に応じてエージェントを手軽に作れる環境を整備中 • 既存システムの強みを活かしてデータ分析やドキュメント管理、業務代行などのエージェントを提供する例も増加主要なエージェント応用 • エージェントビルダー：プロバイダ側が開発済みエージェントを提供・カスタマイズ可能
• リサーチ・問い合わせ対応（RAG的アプローチ）：社内文書やWeb検索を繰り返し行い、情報が揃ったかを判断 • データに基づく意思決定支援：売上やCRMデータなどを可視化・分析し、報告 • 資料作成支援：Webや社内情報を統合し、提案書・調査報告などを生成 • Agentic Process Automation：従来のRPAを拡張し、定型・非定型作業を自律的に組み合わせるエージェントの今後の方向性 • 生成AIエージェントと業務ソフトウェアが強く連携し、「指示だけで〇〇が完了」といったキャッチコピーが増える • GUI操作など汎用的なコンピュータ制御はまだ困難で、業務特化のエージェントに商機がある AIエージェントへの誤解と注意点 • 「自動化＝AIエージェント」ではない。必ずしもLLMを用いた高度な“思考プロセス”が必要なわけではない • エージェントの思考と行動プロセスが人間らしく見えても、結果の正確性は保証されない • 「マルチエージェント」という言葉は分野や文脈で意味が異なり、曖昧に使うと混乱を招く https://masamasa59.hatenablog.com/entry/ai-agent-business-guide

著者が重視、主張していることはなんだと思いますか AIエージェントビジネスの現状と今後の考察著者が一貫して主張しているのは、「AIエージェント」という言葉がビジネス現場でバズワード的に使われつつあるが、実際には“何を自動化・高度化するのか”を明確にし、かつ特化型で作り込む必要があるという点 1. 汎用的なエージェントより、業務特化型のエージェントにこそ勝機がある • GUI操作などを含む汎用的な制御はまだ難しく、不確実性も高い • 一方で、特化型エージェントは業務領域を絞ることで精度を高められ、ビジネスインパクトを出しやすい
2. 「エージェント＝自動化」ではない • エージェントが持つ計画・思考プロセスが必ずしも必要とは限らず、むしろ既存ツールで解決できることも多い • 目的に応じて、あえてエージェントを使わない選択も重要 3. “マルチエージェント”を安易に謳わない • 分野ごとに「エージェント」の定義が異なるため、曖昧なまま使うと社内外で混乱を招く 4. 業務フロー（プロセス）への納得感と、結果（精度・使いやすさ）は別 • 人間らしい思考プロセスや動的なフローを実装しても、結果の正確性が伴わなければ意味がない • 顧客やユーザーは最終的な成果物や業務効率の向上を評価する 5. 今後はLLMプロバイダだけでなく、各業務ソフトウェアが独自の「AIエージェント」を持つ流れが加速する • 「ユーザーが指示するだけで〇〇が完了/効率化」というマーケティングが増えるものの、連携先が増えても精度が伴わなければ使われない • 自社ソフトウェアの強みやデータ連携を活かして、特化型エージェントを磨く必要がある総じて、「エージェント」という言葉が広範かつ曖昧に使われがちな現状に対して、著者は“より明確な目的設定”“特化領域での精度向上”“結果を重視した価値提供”の重要性を強く主張している https://masamasa59.hatenablog.com/entry/ai-agent-business-guide

生成AIエージェントが刺さる業務課題を探そう！エージェントが刺さるビジネスの特徴 • 抽象度が高いタスク例：事前に手順や正解が一意に定まらない・複数のプロセスがある業務 • 課題は明確だが答えが一意に定まらない例：新規製品アイデアの立案 • 成果物のバリエーションが多く、都度カスタマイズが必要
例：営業資料や提案書を顧客ごとに作り直す業務 • 複数のツール・データソースを組み合わせる必要がある例：データ分析ツール→見込客リスト生成→メール送信、などのクロスオペレーション • “試行錯誤”や“自己改善”が必須のPDCAサイクルを回す業務例：A/Bテストを繰り返すマーケティング施策、新規事業アイデア創出 • 情報収集・要約・分類といったナレッジワークが多い例：大量のレポートから要約を行い、次のアクション（提案書作成など）まで繋げる • ルーチンワークだが例外が多く、対応ルールが複雑例：契約書チェックや在庫管理フローで、多数の条件分岐と例外対応が必要 • 複数ステークホルダーがレビュー・承認し合うワークフロー例：提案書や仕様書のレビューに多部署が関わる場面 https://masamasa59.hatenablog.com/entry/business-challenges-for-ai-agents

著者が重視、主張していることはなんだと思いますか生成AIエージェントが刺さる業務課題を探そう！著者が特に強調していること 1. 「生成AIエージェント」の本来の強みや特徴を正しく理解して、どのような業務にフィットするか（タスクの抽象度やイレギュラー対応、複数ツール連携など）を見極めること 2. エージェントの導入ありきではなく、「業務課題に対して本当にエージェントが有効か」を検討し、相応しくない場面（定型作業やエラーが許されない業務など）では無理に導入しないこと 3.
エージェントの“自律的なタスク計画・自己修正”こそが大きな違いであり、単なるRPA的な自動化や定義済みワークフローとの混同に注意することこれらを踏まえたうえで「エージェントが本質的に力を発揮できる業務課題を探す」アプローチが重要だと著者は主張している https://masamasa59.hatenablog.com/entry/business-challenges-for-ai-agents

2024年生成AIエージェントのおすすめ論文 16選大きくまとめると以下の文献を紹介 (1) CoT（Chain of Thought）関連 • CoTが有効なタスク・そうでないタスクの分析 •
推論能力向上の文脈で再注目されている (2) LLM（Large Language Models）の計画・推論能力 • 前提条件からゴールまでの「計画」が苦手とされていたが、最新のモデルでは改善されているかを評価 • 実世界の制約やルールを守る能力の評価。法律・税制・規制など複数ルールの遵守がどこまでできるかを検証 (3) RAGのエージェント化 • 従来のRAGからエージェント化へ移行するメリットや具体的な手法 • 「Agentic IR」など、新たなアプローチを解説 (4) マルチエージェント設計 • 複数のエージェントをオーケストレートして問題解決する方法 • 「専門エージェント＋オーケストレータ」という構成をどう活用するか (5) AIエージェント構築・UX設計 • シングル/マルチエージェントにおける設計手法（計画・メモリ・制御フローなど） • GUI操作エージェント（AnthropicやGoogleなどの事例）の仕組みと課題 • エージェントと人間のインタラクション設計をどう行うか (6) 学習手法 • 大規模行動モデル（LAM: Large Action Models）など、エージェントとしての性能を強化する学習方法 • LLMベースのエージェントとの差異や適用タスクの例 (7) メタ認知能力 • 「フロンティアモデルはメタ認知能力を持つか？」という評価 • エージェントが「自分の限界を把握し、必要な追加情報を補う」ように行動できるかどうかを検証 (8) ゲーム（脱出ゲーム）を題材にした長期タスク評価 • 長期的な計画や創造力を要する「脱出ゲーム」を使ってエージェントの知能を評価 • サブタスク管理や探索的行動など、エージェントの自律性・創造性が試される点が興味深い https://masamasa59.hatenablog.com/entry/2024-best-papers-on-ai-agents

AIエージェントの評価 W&B AI Solution Engineer の方からAIエージェントの評価記事が公開 • 背景：AIの活用は単一プロンプト利用から複数のコンポーネントを統合する方法へと移行 • Compound
AIシステムの観点からRAG, AIエージェントを定義 (ここを強調したいように感じた) 評価観点 • システム全体、プロンプトレベル、軌跡レベルで評価 • それぞれの評価の実現用意性や課題も記述されていた評価項目（右図参照） • オフライン評価とオンライン評価で評価指標は変わらない • 変わるのはリアルタイム評価に人間フィードバックがあるか評価体系構築の流れ Step1: Observability toolの導入 Step2: 基本的なテストケースの整備 Step3：Playgroundでの検証 Step4：本格的な評価体系の構築 https://note.com/wandb_jp/n/nf563ea9d3096

10 AI Trends in 2025 You Can't Miss 1. 自律型エージェントAI
(Autonomous Agentic AI) • AIエージェントが複雑なタスクを人間の手をほとんど借りずに実行可能になる。 2. マルチモーダルAI (Multimodal AI) • AIがテキスト、音声、画像など複数の情報源を同時に処理し、より包括的な理解をする。 3. 推論時計算の最適化 (Inference-Time Compute) • AIモデルがタスクの内容に応じて「どれだけ計算するか」を動的に調整し、高速化や省電力化を図る技術。 4. Edge AIと小型言語モデル (SLMs) の台頭 • クラウドではなく、端末（スマホやIoT機器など）自体でAIを動作させる流れが拡大。ユーザーのプライバシー保護や低電力化が進む。 5. ほぼ無限のメモリ (Near-Infinite Memory) • AIが会話やユーザーの好みを長期にわたって保持し、よりパーソナライズされた体験を提供。プライバシーの扱いが課題になる可能性も。 6. リアルタイム音声：タイピング不要の時代 • 音声入力が進化し、スムーズで自然なやり取りが可能に。文字入力に代わるインタラクション手段として、対応言語・品質の向上が期待される。 7. AIのワークフロー統合の深化 • AIがメールやプロジェクト管理などの既存ツールに組み込まれ生産性が向上 8. 製品開発の加速 • AIによる設計・プロトタイプの高速化により、開発期間が従来の半分以下に短縮される見通し 9. 投資拡大とインフラ強化 • 政府レベルでの大規模投資（数十億ドル規模）が研究やインフラ、イノベーションを後押し 10.科学分野での画期的進歩 • AIが生物学・化学・物理学などの研究を加速し、創薬や素材開発に革命的な変化をもたらす。研究と産業応用の連携が一層重要に。 https://learnprompting.beehiiv.com/p/10-ai-trends-in-2025-you-can-t-miss

15 Agentic Systems and Frameworks of 2024 GUI Agents: A
Survey: ソフトウェアの画面を人間のようにクリック・入力して操作するエージェントについての総合的調査 Agent K v1.0：データサイエンスに特化した自律型エージェント。前処理から特徴量エンジニアリング、モデル調整まで自動化 The AI Scientist：研究アイデアの生成、コード執筆、実験、結果の可視化、論文執筆、疑似査読まで自動化する科学研究支援フレームワーク MALT：複数のLLMを“生成者・検証者・改良者”のように役割分担させ、段階的に出力を洗練する協調型フレームワーク Agent S：GUI操作を自動化し、複雑な長いタスクを人間同様に実行するオープンフレームワーク Automated Design of Agentic Systems (ADAS)：メタエージェント”がコードを書くことでエージェント自体を自動生成・改良する AgentInstruct：シンプルな入力から大規模な合成データを自動生成し、LLMの事後学習に利用させるフレームワーク AgentStore：複数のデジタルエージェントを組み合わせて複雑なコンピュータタスクを自動化するプラットフォーム WALL-E：LLMと学習規則を併用して現実環境を理解・ナビゲートするシステム “Generative Agent Simulations of 1,000 People”：1,052人の実際の行動や態度をLLMエージェントで再現する手法で85%の精度で個人の回答や行動傾向を模倣 DynaSaur：汎用プログラミング言語でタスク実行手順を動的に作成・再利用するエージェントフレームワーク PRefLexOR：選好最適化や強化学習を取り入れ、モデルが自らの推論を何度も振り返り、深い思考を育む手法 Generative World Explorer (Genex)：AIエージェントが3D環境を頭の中でシミュレートし、現実の探索回数を減らしながら理解を深めるフレームワーク Bel Esprit：会話型エージェントが複数モデルを組み合わせて高度なタスクをこなすパイプラインを作成するシステム AutoKaggle：テーブルデータを扱うKaggle形式のタスクを効率化するエージェント https://www.turingpost.com/p/15-agents-of-2024

Top 10 Research Papers on AI Agents Modelling Social Action
for AI Agents • AIエージェントの社会行動を依存関係やコミットメント理論を通して体系化し、協調と集団行動の基盤を提案 Visibility into AI Agents • 自律エージェントがもたらすリスクに対し、ID付与やリアルタイム監視、ログ記録など透明性を高める手法を提案 Artificial Intelligence and Virtual Worlds –Toward Human-Level AI Agents • 仮想世界を活用して、NPCの高度化や人間レベル知能の実現可能性を探る Intelligent Agents: Theory and Practice • エージェント理論からアーキテクチャ・プログラミング言語まで包括的に整理し、理論と実用面での課題を論じる TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents • LLMエージェントのタスク分割と外部ツール活用能力を評価する枠組み“TPTU”を提案 A Survey on Context-Aware Multi-Agent Systems: Techniques, Challenges and Future Directions • 文脈認識を備えるマルチエージェントを対象に、学習・推論モデルから今後の研究課題までを体系化 Agent AI: Surveying the Horizons of Multimodal Interaction • 視覚・音声・テキストなど複数モーダルを扱うエージェントAIの現状と課題を整理し、AGIに向けた方向性を示す Large Language Model-Based Multi-Agents: A Survey of Progress and Challenges • LLMを組み込んだマルチエージェントの応用事例と技術的ハードルを総括し、協調・競合シミュレーションの可能性を検討 The Rise and Potential of Large Language Model-Based Agents: A Survey • LLMを核としたAIエージェントの進化と応用分野を概観し、マルチモーダル化や倫理的課題を含む将来展望を論じる A survey of progress on cooperative multi-agent reinforcement learning in open environment • オープンな動的環境での協調型MARL手法を総括し、エージェント数や環境条件が変化する状況への適応戦略を提案 https://www.analyticsvidhya.com/blog/2024/12/ai-agents-research-papers/

AI Agent Trends: Skills and Workforce Insights for 2024 企業はAIエージェントを活用した高度な自動化へシフトしつつあり、将来的にはマルチエージェントの協調や戦略的意思決定が重要になる
エージェンティックAIの台頭と企業戦略への影響 • AIエージェントが人間を置き換えるのではなく、協働しながら業務を高度化する未来が近づいている • OpenAIが2025年1月にリリースを予定している「Operator」のように、複数ステップのタスクを自律的に行うAIエージェントの登場が注目を集めている • MicrosoftやAnthropicなど他社も同様の開発を進めており、今後は「AIエージェント同士の協業」や「マルチタスク処理」が重要となる求められるスキル：データインフラと自動化から、適応力・高度分析へ • プロセスマイニング（394%伸び）やデータパイプライン（245%伸び）など、データを活用してワークフローを最適化するスキルの需要が急増。 • 「転移学習」「特徴量エンジニアリング」などのスキルも伸びており、複数のドメインに応用できる柔軟なAIモデル開発が重視されている。 • RPAやデータエンジニアリングの需要は依然高いが、すでに多くの企業が導入済みで成熟期に入り、今後はより高度な「インテリジェントオートメーション」に移行する可能性がある。変化するデータ活用：ビッグデータからリアルタイム・インサイトへ • ビッグデータ関連の需要がやや減少傾向にある一方で、より高速かつ柔軟な分析手法の需要が高まっている。今後注目される分野：マルチエージェントや戦略的AI • 「群知能」「ゲーム理論」関連スキルも成長し、AIエージェント同士が協調・競合しながら複雑なタスクをこなす時代が見込まれる。 • 技術力だけでなく、組織設計や戦略的思考を兼ね備えた人材の需要が高まる可能性がある。 https://blog.getaura.ai/ai-agents-skills-data-trends

2024年の主な動向 Top 10 AI Agent Trends and Predictions for 2025
1. カスタマーサービスでの普及 • 多くの業界で、AIエージェントが問い合わせ対応などの顧客接点を担うように • 一部の企業では60%超の顧客対応をエージェントが担当 2. エージェントの高い自律性 • NLPや強化学習の進歩により、文脈理解力が向上し、より賢くタスクを遂行 3. サイバーセキュリティ分野での活用 • AIエージェントが脅威検知やリアルタイムでのセキュリティ監視を行い、企業の防御を強化 4. 人間との連携強化 • データ分析や意思決定の補佐など、“作業代行”を超えた共同パートナーとして活躍 5. エージェント構築フレームワークの台頭 • AutoGen、CrewAI、LangChainなど、コード不要でカスタマイズできるプラットフォームが多数出現し、開発・導入の障壁が低下 https://www.analyticsvidhya.com/blog/2024/12/ai-agent-trends/

2025年に注目すべき10のエージェントトレンド Top 10 AI Agent Trends and Predictions for 2025
さらなるAIエージェント導入の増加 Capgeminiの調査では、2026年までに82%の企業がAIエージェントを導入予定コード生成やデータ分析など、幅広い部門のタスクへ適用が拡大プロアクティブなAIエージェントの登場単に指示待ちではなく、利用者の状況やデータを分析して先回りして提案・行動するエージェントが増加パーソナライズの実現 Generative AIの進化により、ユーザーの好みや履歴を基に高度なパーソナライズが可能に小売・ヘルスケアなどで顧客の趣味嗜好・健康データに合わせた提案を行うように感情知能(Emotional Intelligence)の向上ユーザーのトーンや文脈を汲み取り、共感を伴ったコミュニケーションを取るエージェントが増えるカスタマーサポートや教育・セラピーなど、対話の質が一段と向上マルチモーダル対応の進化テキスト、音声、画像、動画を統合的に扱うことで、より自然で多彩なインタラクションを可能にカスタマーサポートやクリエイティブ領域での協働が拡張高度なマルチエージェント・システム複数のAIエージェントが連携し、在庫管理・需要予測・物流最適化など、より複雑な業務を一括で処理 OpenAI SwarmやMicrosoft Magentic AIのような基盤で大規模マルチエージェントを運用・管理エージェント構築フレームワークの発展と統合 2024年に台頭したAutoGenやCrewAIなどのプラットフォームがさらに拡充小規模企業の統合や機能追加が進み、より大規模で成熟したフレームワークが確立する可能性 IoT・パーソナルデバイスとの連携強化スマートホームやスマートシティなどのIoT環境と連動し、自律的にデバイスやプロセスを制御個人向け端末でもエージェントが自動でスケジュールやショッピング手配を行うなど、利便性アップ倫理・透明性への重視エージェントの意思決定プロセスを説明可能にする「XAI(Explainable AI)」がさらに注目金融や医療などでの活用が増すにつれ、公平性と説明責任を担保する規制や基準が整備コミュニケーション・コラボレーションツールの高度化会議の効率化（リアルタイムでの議事録作成や要点整理など）を実現するスマート・アシスタント異業種間での情報共有やプロジェクト管理ツールにも高度に組み込まれ、チームワークを強力にサポート https://www.analyticsvidhya.com/blog/2024/12/ai-agent-trends/

Building effective agents/Anthropic エージェントは、ツール等を活用して自律的にタスクを進めるシステム、一方、あらかじめ決まったコードフローに沿う構成はワークフロー(workflow)と呼ぶワークフローはタスクの手順が定型化している場合に向いており、エージェントは柔軟かつモデル主体の意思決定が求められる場合に適している Augmented LLM（拡張LLM） • retrievalやツール呼び出し、メモリなどでLLMを拡張するワークフロー各種
Prompt Chaining • タスクを複数ステップに分解して順に実行。途中でプログラム的なチェックをはさみ、精度向上を図る例: ドキュメントの要約→チェック→翻訳、のように明確な段階分割がある場合 Routing • 入力を分類して、最適な下流タスクに振り分ける例: カスタマーサポートの問合せを種類別に振り分ける、モデルごとに負荷やコストを最適化する Parallelization • タスクを並列に分割して処理（Sectioning）したり、同じタスクを複数回試行して投票（Voting）で最適解を得たりする例: セキュリティ診断を複数のプロンプトで行い、結果を投票でまとめる Orchestrator-Workers • 中央のLLMがサブタスクを動的に生成し、それぞれのWorker LLMに振り分けて結果を集約 • タスク内容に応じて必要なサブタスク数が変わるような、複雑な場面向き Evaluator-Optimizer • 1つのLLMが回答を出し、もう1つのLLMがその回答を評価・フィードバックし、改善する。例: 文書作成や検索を複数回にわたって修正・最適化する場合に有効コメント）研究では、Routing 以降はマルチエージェントでよく見る設計です。Augmented LLMはToolLLMと呼ばれていましたね。エージェント Prompt Chaining Augmented LLM https://www.anthropic.com/research/building-effective-agents

Multi AI Agents In Production/CrewAI この調査には 4,500 人を超える専門家が参加しました導入の広がりと主な用途 •
多くの企業はまず内部プロセス改善などの「高精度が求められるユースケース」からAIエージェントを導入し始める傾向があり、マーケティング分野での導入は比較的少ない。 • サポート業務への適用が重要視されるケースが増えている。導入スピード • 約76%の企業が30〜60日以内にAIエージェントを本番運用に移したいと考えている。 • 大企業ほど複数のユースケースを素早く本番運用に取り入れており、中小企業と比較して約23%高い導入実績がある。調査概要 • 回答者の地域比率はアメリカ大陸45.2%、APAC（アジア太平洋） 22.27%、EMEA（欧州・中東・アフリカ）21.3%、リモート10.8% • 企業規模では従業員10名未満が34.6%、11〜100名が32.1%、101〜 5,000名が19.9%、5,000名超が13.5%。 https://insights.crewai.com/

【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所 AIエージェント開発の前提条件 • 課題やニーズの明確化 • LLMが最適解であるとは限らない。従来の問い合わせシステムや単純なFAQで足りる場合もある。
• まず「何を解決したいのか」を明確にし、要件定義に十分な時間をかける。既にあるSaaSやツールで足りるなら無理にLLMを導入しない。 • LLMの有用性と限界 • 金融・医療・法律など正確性が求められる領域では、LLM単体では要件を満たしにくい場合がある。 • 「LLMを使う部分」と「人間が介在すべき部分」の切り分けが重要。 • どの範囲までLLMに委ねるかを明確にし、ビジネスロジックやルールは別途システム側に実装するなど、役割をはっきり分割する。 • モデル選定とユーザーニーズ • 大半のケースでは汎用的な大規模モデル（GPT-4など）で十分。 • セキュリティ・コスト要件やオンプレ運用の必要がある場合などは専用モデルを検討する価値がある。要求定義と設計上のポイント • UI・UXの設計 • チャット型UIが最適とは限らない。ユーザーにテキスト入力を強要しすぎると逆に使いにくい。 • 最終的な目的は「チャットをする」ことではなく「問題を解決する」こと。 • セキュリティ・プライバシー要件 • プロンプトインジェクションなどLLM固有のリスクが存在する。 • DBアクセスなどを行う場合は、ユーザーが直接SQLを操れるような状況を避けるなど、従来同様のセキュリティ設計が必須。 AIエージェント時代のアプリケーション開発パターンの例 • ユーザー入力 → DBから取得 → LLMで結果生成（最小関与パターン） • LLMがユーザー入力を解析 → API呼び出しクエリ生成 → システムが結果取得 → LLMで生成（Function Callingパターン） • LLMにAPI一覧を渡し、必要なAPIやパラメータをLLMが自律的に選択する（AIエージェントパターン） https://www.ai-shift.co.jp/techblog/5252

Agentic AI vs Generative AI: Understanding the Key Differences and
Impacts Agentic AIとは • 自律性: 人間からの明確な指示がなくても、設定された目的に向けて自律的に行動を起こす。 • ゴール指向: タスク達成のために意思決定を行い、必要に応じて環境に適応し続ける。 • 適応と学習: 失敗や成功から学習し、継続的にパフォーマンスを向上できる。 • 複雑な意思決定: 多くの選択肢を検討し、それに伴う結果を踏まえて最適な判断を下す。 • 環境認識: カメラやセンサーなどを用いて外部環境を把握し、それをもとに行動を変化させる。具体例 • 自動運転車: 目的地へ安全に到達するために、周囲の交通状況を認識しながら自律的に走行する。 • 高度なバーチャルアシスタント: 予定調整やリマインダーなどを自動的に実行し、ユーザーの目標達成をサポートする。 Generative AIとは • 反応的な仕組み: ユーザーからの入力に応じてテキストや画像を生成するが、自ら目的を設定して行動するわけではない。 • タスク指向(受動的): 入力に対して即座にコンテンツを生成するが、継続的・自律的な意思決定や行動はしない。 • 単純な意思決定: 学習済みのパターンをもとに最も可能性の高い出力を選択する程度で、複雑な状況判断や目標追求は行わない。 • 学習や適応が限定的: 訓練後の推論時には、基本的には新しい情報を反映して自己改善するわけではない。 • 環境認識なし: バーチャルなデータ(テキストや画像)のみに基づいており、物理的な環境を認識して行動を変えることはできない。具体例 • ChatGPT: 入力された質問や文章に対してテキストを生成し返答する。 • 画像生成モデル(DALL-Eなど): テキストの説明をもとに画像を生成。 https://medium.com/@myscale/agentic-ai-vs-generative-ai-understanding-the-key-differences-and-impacts-e4527bb7c4ee

AI エージェントで実現する業務効率化とイノベーション: 日本の最新事例/Microsoft MicrosoftからAIエージェントの事例 • コールセンターの業務効率化 (ソフトバンク、大和証券、ベルシステム 24 など) AI
が問い合わせ内容を判断し最適解を提示。待ち時間短縮や回答精度向上を実現 • 熟練知識の継承と開発スピード向上 (トヨタ自動車) 専門分野ごとの AI エージェントが 24 時間体制で質問に対応。効率的な知識共有により新車開発を加速 • 現場スタッフ支援とサービス品質向上 (JR西日本) 複雑な営業制度を扱う駅員を AI が支援。待ち時間短縮や新人育成に効果 • 自律型エージェントによる課題解決 (富士通) 複数のサブエージェントを協調させて最適解を提案する仕組みを開発。社内で数百のエージェントを活用中 • ゲーム開発や金融業務、教育分野への応用 (スクウェア・エニックス、セブン銀行、ナガセなど) ゲームエンジンの活用支援、社内チャットボット、個別学習支援などを実装 • 社内業務効率化と投資判断支援 (三菱商事、MUFG など) 文章要約ツールや社内 ChatGPT を活用し、膨大な情報から必要な判断を迅速化 • 24 時間の AI 法律相談サービス (弁護士ドットコム) 125 万件以上の法律相談データを活用し、一般ユーザーが無料相談を利用可能 https://news.microsoft.com/ja-jp/2024/12/18/241218-operational-efficiency-and-innovation-enabled-by-ai-agents-latest-case-studies-from-japan/

Reasoning with o1/DeepLearningAI Colin Jarvis（OpenAI）による短期コース o1を使ったプロンプトの4つの主要原則 • Simple and direct
• No explicit CoT required • Use structured formats（ XML or markdown ） • Show rather than tell 計画と実行の分離方法も紹介 • o1がオーケストレーター（指揮者）として計画を作成し、4o-mini モデルにその計画を実行させることで知性とコストのトレードオフを管理した方法を紹介メタ・プロンプティング手法も紹介 • o1を使ってプロンプトそのものを改善していくアプローチ https://www.deeplearning.ai/short-courses/reasoning-with-o1/

12月16日更新リリース • RTX AI PC が生成 AI で複雑な問題を自律的に解決する
AI エージェントを実現 • Pydantic AI • ｢Copilot Vision｣プレビュー版公開。AIとの二人三脚が実現しそう • OpenAI o1 System Card • Introducing Gemini 2.0: our new AI model for the agentic era • The next chapter of the Gemini era for developers • Google が Project Mariner を発表: ユーザーに代わってWebを使用する AI エージェント • Introducing Google Agentspace: Bringing AI agents and AI-powered search to enterprises • グーグル、AIエージェント搭載「メガネ型デバイス」発表 Gemini 2.0採用 • Devin is generally available today! リポジトリ • awesome-llm-apps

12月16日更新ブログ • Best 5 Frameworks To Build Multi-Agent
AI Applications • Magentic-One, AutoGen, LangGraph, CrewAI, or OpenAI Swarm: Which Multi-AI Agent Framework is Best? • GenAIOps: Operationalize Generative AI - A Practical Guide • From SaaS to Vertical AI Agents • How to Build a General-Purpose LLM Agent • エージェンティックAI：ビジネスにおける6つの有望なユースケース • How to use AI for Prototyping as a PM • What is AI Engineering? • Outcome-based pricing for AI agents

RTX AI PC が生成 AI で複雑な問題を自律的に解決する AI エージェントを実現 AnythingLLM：各自のローカル PC
上で様々なアプリに統合できるようにする、カスタマイズ可能なオープンソースのデスクトップアプリ • ドキュメント作業、タスク管理、電子メール返信など、個別のニーズに対応可能 • NVIDIA RTX GPUにより高速かつプライバシーを保護した環境でAIを利用可能 • コミュニティハブではAIスキルやスラッシュコマンドの共有・利用が可能エージェント型AIの特徴 1. ユーザー入力を処理し、情報を収集 2. 推論を通じてタスクを理解し、解決策を生成 3. 外部ツールやソフトウェアを統合して実行 4. フィードバックループで性能向上実例と応用 • Microsoft Outlookのメールアシスタント、カレンダー管理、ウェブ検索、カスタムAPIの統合など • 個人データをローカルで安全に処理しながら、さまざまなワークフローを効率化 https://blogs.nvidia.co.jp/blog/ai-decoded-agents-anythingllm-rtx-ai/

Pydantic AI エージェント Pydantic AIは生成AIを使用して本番環境レベルのアプリケーションを簡単に構築できるように設計された Python エージェントフレームワーク LangChain, LlamaIndexなどのエージェントクラスと同じようなもの
• ツールとシステムプロンプトを与えてエージェントが定義できる • Agentクラスを見るとループで終了フラグが立つまで行動する仕組みになっている • 自己修正に関してはデフォルトの再試行回数は1だが、エージェント全体、特定のツール、または結果検証ごとに変更できる • 単一のエージェントだけでなくマルチエージェントも実現できる • 入出力を型定義できる数ヶ月後の評判次第で使ってみようかな https://github.com/pydantic/pydantic-ai https://ai.pydantic.dev/agents

Copilot Vision プレビュー版公開 Microsoftからプレビュー版提供で、Copilotは閲覧中のページを読み取って、解決策を模索してくれるエージェントと一緒に画面を見ながら会話できるのがポイント情報収集ウェブページをもとに、質問に応じた情報を提示する。博物館の計画や買い物のサポート、ゲームのルール説明など買い物支援ニーズや好みに合う商品を提案し、商品の手入れ方法などもアドバイス
ゲームサポートユーザーの理解度に合わせ、適度なヒントを提供しつつ楽しさを損なわないサポートを実現 https://www.gizmodo.jp/2024/12/copilot-vision-preview-version.html

OpenAI o1 System Card OpenAIのo1モデルシリーズは、強化学習を用いてCoTを活用し、複雑な推論を行う能力を持っているシステムカードにはo1およびo1-miniモデルの安全性評価や外部テスト結果をまとめている METR機関は、最新のAIシステムが複雑なタスクを完遂する能力を評価する組織 • o1モデルの性能は人間が2時間かけて解決できるタスクと同程度の成功率を達成した •
失敗の原因は成功に必要なツールやフォーマットを適切に使用できなかったケースが約70%を占めている • モデルは初期戦略が失敗した場合、異なるアプローチに切り替える能力が限られている https://openai.com/index/openai-o1-system-card/

Introducing Gemini 2.0: our new AI model for the agentic
era Gemini 1.0: 初のマルチモーダルAIモデルとしてテキスト、音声、画像、コードの理解力が向上した Gemini 2.0: 次世代のエージェンティックモデルで、マルチモーダルインアウトができ、計画・行動の能力を強化 Gemini 2.0の主な特徴 • マルチモーダル対応 • 入力: テキスト、画像、音声、動画、コード出力: 画像生成、 TTSの多言語対応 • 高性能モデル • Gemini 2.0 Flash: 1.5 Flashの2倍の速度と性能向上、ツール利用（Google Search、コード実行、外部関数呼び出し）も可能 • 新機能 1. Deep Research: 複雑なトピックを調査し、レポート作成を支援 2. AI Overviewsの強化：高度な数式、マルチモーダルクエリ、コーディングなど、より複雑なトピックや複数ステップの質問に対応プロジェクト 1. Project Astra • AIアシスタントとしての対話、記憶、ツール活用能力を強化し、Androidとプロトタイプのスマートグラスでテスト中 2. Project Mariner • ブラウザ内の情報を理解し、タスクを実行可能。ユーザー操作を優先し、安全性に配慮した設計 3. Jules • GitHubに統合された開発者向けAIコードエージェント来年初めには、Gemini 2.0 をさらに多くの Google 製品に拡張する予定 https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/

The next chapter of the Gemini era for developers 開発者向けのブログ
Multimodal Live APIによってリアルタイムのマルチモーダルアプリを構築できる • 音声指示から画面のハイライト部分を読み上げてもらったり、単語の意味を説明させることができる Gemini 2.0 を使用する実験的な AI 搭載コードエージェントである Jules • Gemini2.0 FlashがSWE-bench Verified で 51.8% を達成 • Jules は問題に対処するための包括的な複数ステップの計画を作成 • 複数のファイルを効率的に変更し、修正を直接 GitHub に戻すためのプルリクを作成 • 2025 年初頭には他の関心のある開発者にも提供される予定 Colabのデータサイエンスエージェントがノートブックを作成 • labs.google/codeで誰でもデータセットをアップロードして数分以内に分析情報を取得できる https://developers.googleblog.com/en/the-next-chapter-of-the-gemini-era-for-developers/

Google が Project Mariner を発表: ユーザーに代わってWebを使用する AI エージェント Geminiを搭載し、Chromeブラウザを制御し、カーソル移動やクリック、フォーム入力などを実行する現在、少数のテスターに提供されている段階
操作速度動作が遅い • カーソルの移動やクリックごとに約5秒の遅延 • この遅さが実用性を制限する要因となっている機能の制約クレジットカード番号や請求情報の入力が不可 • セキュリティ上の理由で、ユーザーの重要な個人情報は扱わない仕様利用規約への同意やクッキーの受け入れが不可 • これも意図的に制限されており、ユーザーの許可が必要利用環境の制限アクティブタブのみ対応 • エージェントはChromeブラウザの最前面のアクティブタブでのみ動作可能 • 他の作業を並行して行うことはできないプライバシーとセキュリティ • スクリーンショットをクラウドに送信する必要があり、これに同意しなければ使用できない • ユーザーのプライバシー保護を考慮し、すべての動作は透明性を持つように設計されているユーザー依存性 • Geminiが行う動作はすべて目視で確認可能 • Googleはこれを意図的な設計とし、AIがユーザーのコントロール外で操作することを防いでいる https://techcrunch.com/2024/12/11/google-unveils-project-mariner-ai-agents-to-use-the-web-for-you/

Introducing Google Agentspace: Bringing AI agents and AI-powered search to
enterprises Google Agentspace: AIを活用したエンタープライズ向けソリューション NotebookLMを活用した企業データの新しい利用法 • NotebookLM Plusを企業向けに拡張し、データの統合やインサイト発見を支援 • 音声要約機能や高度なRAGが可能 • 例: 財務データを分析し、オーディオで要約を生成する企業全体の情報発見 • Googleの検索技術を活用した企業専用のマルチモーダル検索エージェント • 文書やメール、構造化データにまたがる検索と翻訳機能を備える • ConfluenceやSharePointなどのサードパーティアプリとも連携可能 • 例: JIRAチケットの検索と上司への要約メール送信業務自動化エージェント • 業務領域ごとにカスタムAIエージェントを作成可能 • マーケティング、財務、エンジニアリングなどで調査やタスク自動化を支援する • ローコードツールを使って独自のエージェントを作成可能 • 例: 経費報告の管理やバグ修正の支援 https://cloud.google.com/blog/products/ai-machine-learning/bringing-ai-agents-to-enterprises-with-google-agentspace?hl=en

グーグル、AIエージェント搭載「メガネ型デバイス」発表 Gemini 2.0採用 Gemini 2.0を搭載したメガネ型デバイスの試作品を公開 • 音声で操作し、リアルタイムで周囲の情報を提供 • グーグル検索やマップ、画像認識機能あり •
AIエージェント機能でタスクを代行（例: eコマース、店の予約） • 試作品は少数のテスター向けに提供予定公開されたデモメガネを使い、自転車でロンドン市内を探索しながら • 公園名や自転車道沿いの施設情報の確認 • バスのルートや道路沿いの彫刻に関する情報の提供 • メールから暗証番号を抽出して案内 https://forbesjapan.com/articles/detail/75798

Devin is generally available today! AIスタートアップのCognitionが、自律型のAIソフトウェアエンジニア「Devin」の正式サービスを開始価格は月額500ドルからで、利用回数の制限はなく、Slack経由でのアクセスとVisual Studio CodeなどのIDEからの利用、APIへのアクセス、そしてCognitionによるサポートなどが利用できる
開発からドキュメントのメンテナンスまで、開発チームを支援できるとする次のようなタスクを与えた場合に最も適切に処理できる • すでにやり方が分かっているタスクをDevinに与える • テストのやり方や確認の方法をDevinに指示して実行してもらう • 大きなタスクは3時間以内に終わる程度のタスクに分解する • 事前に詳細な要件をDevinと共有する • Devinにチャットでフィードバックする Azure Marketplaceからの導入も可能 https://publickey1.jp/blog/24/aidevin500.html https://devin.ai/

Awesome LLM Apps RAG および AI エージェントを使用して構築された優れた LLM アプリの厳選
コレクションのリポジトリ参考になるものがあればコードを見てもいいかも！ https://github.com/Shubhamsaboo/awesome-llm-apps/tree/main

Best 5 Frameworks To Build Multi-Agent AI Applications 1. Phidata
• Pythonベースのフレームワークで、LLMをAI製品用のエージェントに変換する • 特徴: 組み込みUI、AWS統合、複数エージェントの構築、テンプレート、クラウドデプロイ • 利用例: Yahoo Financeのデータを要約するエージェントの構築 2. OpenAI Swarm • 軽量なオープンソースのエージェントフレームワーク（実験段階） • 特徴: 会話の引き継ぎ機能、スケーラビリティ、プライバシー保護 • 利用例: エージェント間のタスク引き継ぎシステム 3. CrewAI • 多機能かつ大規模なエージェントフレームワーク。大企業が利用 • 特徴: 700以上のアプリ統合、ノーコード環境、エージェント監視、テストツール • 利用例: チームでのマルチエージェント自動化 4. Autogen • エージェントコラボレーションとLLMワークフロー向けのオープンソースフレームワーク • 特徴: クロス言語対応、ローカル実行、非同期メッセージング、拡張性 • 利用例: 天気情報を取得するエージェントシステムの構築 5. LangGraph • LangChainエコシステム内のグラフベースのエージェントフレームワーク。 • 特徴: ノードとエッジでワークフローを構築、トークンストリーミング、状態の永続化、スケール展開 • 利用例: 線形・階層型ワークフローの作成 https://medium.com/@amosgyamfi/best-5-frameworks-to-build-multi-agent-ai-applications-1f88530ef8d8

Magentic-One, AutoGen, LangGraph, CrewAI, or OpenAI Swarm: Which Multi-AI Agent
Framework is Best? AutoGen (Microsoft) • ソフトウェア開発向け、コード生成と実行に特化。ユーザーとアシスタントエージェントの双方向モデル • セットアップが複雑で非プログラマーには不向き。他のタスクでは性能が限定的 CrewAI • 直感的で簡単にエージェントを作成可能。初心者向けで迅速なデモ作成に最適 • カスタマイズ性が低く、複雑なプログラミングタスクには不適 LangGraph • 高い柔軟性とカスタマイズ性を持つ。LangChainをベースにし、オープンソースLLMやAPIとの互換性が高い。 • ドキュメントが不十分で、初心者には難しい。プログラミングスキルが必要 OpenAI Swarm • 簡単なエージェント作成とコンテキスト切り替え（ハンドオフ）に特化し、初心者向け。 • OpenAI APIのみ対応、実運用には不向き。コミュニティサポートが不足。 Magentic-One (Microsoft) • 非プログラマー向けで簡単に使用可能。AutoGenをベースにした汎用フレームワークで、5つのデフォルトエージェントが付属。 • オープンソースLLMとの互換性が難しく、柔軟性に欠ける。ドキュメントとコミュニティサポートが未整備。 https://medium.com/data-science-in-your-pocket/magentic-one-autogen-langgraph-crewai-or-openai-swarm-which-multi-ai-agent-framework-is-best-6629d8bd9509

GenAIOps: Operationalize Generative AI - A Practical Guide Generative AIと新たなOps
生成AIの急速な進化により、新たな運用パラダイムが登場 • PromptOps: プロンプトの管理と最適化、AgentOps: 自律エージェントの運用、RAGOps: RAGの運用生成AIを活用するプロセス 1. モデル選定: 必要に応じた適切な生成モデルの選択。モデルの精度、コスト、レイテンシなどを評価。 2. プロンプトエンジニアリング: 効果的なプロンプトを設計し、カタログ化。テンプレートと評価データセットを活用して自動評価を行う 3. 評価指標の設定: タスクに応じた適切な評価基準を選択（例：ROUGEやBLEU） 4. モデルのテストとデプロイ: 評価結果に基づき、業務要件（コスト、速度）に合致するモデルを選択 https://medium.com/@sokratis.kartakis/genaiops-operationalize-generative-ai-a-practical-guide-d5bedaa59d78

From SaaS to Vertical AI Agents スタートアップ業界における垂直型AIエージェントの台頭について議論記事垂直型AIエージェントとは • エージェントはタスク管理を支援するSaaSの進化版という位置付け
• SaaSがデスクトップソフトをクラウド化して業界を変えたのに対し、垂直型AIエージェントは特定のドメインでの人間の仕事そのものを置き換えるソリューション • SaaSは業務を効率化するツールでしたが、垂直型AIエージェントは業務そのものを削除するスタートアップ戦略 1. SaaSと同様、巨大企業と競争しない（GoogleやAppleに任せる） 2. B2Bニッチな市場で特化型ソリューションを開発 3. 退屈で反復的なタスクを見つけて、それを自動化する例：特定の官公庁契約の自動入札や、歯科医療請求の自動化汎用 AI アシスタントを夢見ているなら、やめてください。Apple、Google、OpenAI はすでにその王座を争っています。 https://medium.com/the-ambition-hub/from-saas-to-vertical-ai-agents-dfec2b646570

How to Build a General-Purpose LLM Agent 汎用的なLLMエージェントを構築することは、ユースケースを迅速にプロトタイプ化できる LLMエージェント構築の7ステップ 1.
適切なLLMの選定 • 推奨モデル: GPT-4.0、Claude 3.5やLlama3.2 2. エージェントの制御ロジック（通信構造）の定義 • エージェント行動パターン: ツール使用、リフレクション、ReAct、Plan-then-Execute 3. プロンプトの明確化 • エージェントの役割、トーン、エラー処理、ツール使用条件を明記 4. ツールの定義と最適化 • 必須ツール: コード実行、ウェブ検索、ファイル操作、データ分析 • ツールの要素: 名前、説明、入力スキーマ（必要パラメータなど）、実行方法 5. メモリ管理戦略の決定 • メモリの種類: 最新の会話kターン、最新nトークン、LLMによる会話要約 6. エージェントの生の出力の解析 • 出力データをJSONなどの構造化フォーマットに変換 7. エージェントの次のステップをオーケストレーション • ツール実行またはユーザーへの回答を決定マルチエージェントの必要性 • 単一エージェントはトークンやコンテキストの制限で性能に限界がある • 複数のエージェントを活用することで、タスクを分割し効率を向上可能 • 推奨: 汎用単一エージェントをプロトタイプとして構築し、徐々に複雑なシステムへ拡張 https://towardsdatascience.com/build-a-general-purpose-ai-agent-c40be49e7400

Agentic AI：ビジネスにおける6つの有望なユースケース 1. ソフトウェア開発 • コーディングアシスタントがコード作成やエラーチェックを担い、開発プロセスを大幅に効率化 • DevOpsツールチェーンと連携し、仕様のリバースエンジニアリングやテストケースの自動生成を実現 2. ステロイドを投与したRPA（ロボットによるプロセス自動化）
• 単純なタスクだけでなく、複雑な意思決定を含むプロセスも自律的に対応 • 適応性のある自律プロセスが業務効率を向上 3. カスタマーサポートの自動化 1. 従来のチャットボットを超え、文脈を理解し複雑なリクエストにも対応 2. 例外処理や非決定論的タスクも実行可能 4. 企業ワークフローの効率化 1. 会議メモのプロジェクトチケット化や、需要予測に基づくサプライチェーン管理の自動化 2. 情報サイロを解消し、組織全体でのデータ活用を促進 5. サイバーセキュリティと脅威検出 1. AIエージェントが脅威をリアルタイムで検出し、迅速に対応 2. 個別のセキュリティプロトコルの適用やコスト削減を実現 6. ビジネスインテリジェンス（BI） 1. BIエージェントが音声入力やあいまいな質問を解釈し、有益な洞察を提供 2. マーケティングチームや他部門のデータ分析を支援 https://www.cio.com/article/3619835/

How to use AI for Prototyping as a PM PMがAIを使ったプロトタイピングを行うべき理由
• AIの進化でソフトウェア開発の敷居が低下: AIは迅速なプロトタイピングを可能にし、これまで数週間かかっていた工程が数時間、場合によっては数分に短縮される • 役割からスキルへのシフト: 企業はタイトルよりもスキルを重視するようになり、アイデアを伝えたりプロトタイプを作成したりするスキルが重要にツール選択のポイント • プロジェクトタイプ • フロントエンド → Vercel v0 • バックエンド → Replit Agent • フルスタック → 複数ツールの組み合わせ • チームの経験 • 開発者中心 → Cursor、Windsurf • デザイナーとの連携 → Vercel v0 https://amankhan1.substack.com/p/how-to-use-ai-for-prototyping-as

What is AI Engineering? AIエンジニアとは何か • AIエンジニアは、LLMを活用してAIシステムを構築し、ビジネス課題を解決する役割 • この職種は、MLエンジニアやソフトウェアエンジニアと関連している •
特有のスキルセットを持つ新たな職種として注目されている AIエンジニアに必要なスキル 1. リサーチ: 最新の研究論文を理解し、自身のプロジェクトに適用する能力 2. プロンプトエンジニアリング: 効率的なプロンプト設計と評価 3. ソフトウェア開発: 高品質なコードとシステム構築スキル 4. インフラ管理: データストレージやデプロイに関する知識 5. データエンジニアリング: データ処理とクレンジング能力 6. MLOps: 継続的なシステム改善のための運用スキル https://www.newsletter.swirlai.com/p/what-is-ai-engineering

Outcome-based pricing for AI agents アウトカムベース価格モデルの登場 • 料金変動型だが、実際のビジネス成果（解決されたサポートケース、アップセル、契約維持など）に紐づいて課金される。 • 結果が出なかった場合、多くの場合費用は発生しないというもの
AIエージェントに適用 • Sierra社はアウトカムの価格モデルを採用し、AIエージェントが顧客対応を行い、成果を生み出すことで収益を得る。 • 継続的な最適化を行い、費用削減や収益向上を目指す。成功の基準や料金は透明で、明確な基準に基づいて設計アウトカムベースの価格モデルは、ソフトウェアが「棚に眠る」ことを防ぎ、ビジネス成功の価値にのみ支払いを求める革新的な仕組み。Sierraは、このアプローチを通じて、顧客のコスト削減と成長を支援する。 https://sierra.ai/blog/outcome-based-pricing-for-ai-agents

Weekly AI Agents News! 12月号プロダクト/ニュースのアーカイブ

Weekly AI Agents News! 12月号プロダクト/ニュースのアーカイブ

masatoto

More Decks by masatoto

Other Decks in Research

Featured

Transcript

Weekly AI Agents News @ottamm_190 1２月号プロダクトニュース編

12月30日更新リリース • AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始ブログ • Weekly AI

12月30日更新ブログ • Building effective agents • Multi AI

AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始企業固有の業務にあわせて実務に即した課題を解決する企業専用AIエージェントを開発 https://www.cyberagent.co.jp/news/detail/id=31196 利用イメージ

2024年生成AIエージェントのおすすめ論文 16選大きくまとめると以下の文献を紹介 (1) CoT（Chain of Thought）関連 • CoTが有効なタスク・そうでないタスクの分析 •

AIエージェントの評価 W&B AI Solution Engineer の方からAIエージェントの評価記事が公開 • 背景：AIの活用は単一プロンプト利用から複数のコンポーネントを統合する方法へと移行 • Compound

10 AI Trends in 2025 You Can't Miss 1. 自律型エージェントAI

15 Agentic Systems and Frameworks of 2024 GUI Agents: A

Top 10 Research Papers on AI Agents Modelling Social Action

AI Agent Trends: Skills and Workforce Insights for 2024 企業はAIエージェントを活用した高度な自動化へシフトしつつあり、将来的にはマルチエージェントの協調や戦略的意思決定が重要になる

2024年の主な動向 Top 10 AI Agent Trends and Predictions for 2025

2025年に注目すべき10のエージェントトレンド Top 10 AI Agent Trends and Predictions for 2025

Multi AI Agents In Production/CrewAI この調査には 4,500 人を超える専門家が参加しました導入の広がりと主な用途 •

【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所 AIエージェント開発の前提条件 • 課題やニーズの明確化 • LLMが最適解であるとは限らない。従来の問い合わせシステムや単純なFAQで足りる場合もある。

Agentic AI vs Generative AI: Understanding the Key Differences and

AI エージェントで実現する業務効率化とイノベーション: 日本の最新事例/Microsoft MicrosoftからAIエージェントの事例 • コールセンターの業務効率化 (ソフトバンク、大和証券、ベルシステム 24 など) AI

Reasoning with o1/DeepLearningAI Colin Jarvis（OpenAI）による短期コース o1を使ったプロンプトの4つの主要原則 • Simple and direct

12月16日更新リリース • RTX AI PC が生成 AI で複雑な問題を自律的に解決する

12月16日更新ブログ • Best 5 Frameworks To Build Multi-Agent

RTX AI PC が生成 AI で複雑な問題を自律的に解決する AI エージェントを実現 AnythingLLM：各自のローカル PC

Pydantic AI エージェント Pydantic AIは生成AIを使用して本番環境レベルのアプリケーションを簡単に構築できるように設計された Python エージェントフレームワーク LangChain, LlamaIndexなどのエージェントクラスと同じようなもの

Introducing Gemini 2.0: our new AI model for the agentic

The next chapter of the Gemini era for developers 開発者向けのブログ

Google が Project Mariner を発表: ユーザーに代わってWebを使用する AI エージェント Geminiを搭載し、Chromeブラウザを制御し、カーソル移動やクリック、フォーム入力などを実行する現在、少数のテスターに提供されている段階

Introducing Google Agentspace: Bringing AI agents and AI-powered search to

Awesome LLM Apps RAG および AI エージェントを使用して構築された優れた LLM アプリの厳選

Best 5 Frameworks To Build Multi-Agent AI Applications 1. Phidata

Magentic-One, AutoGen, LangGraph, CrewAI, or OpenAI Swarm: Which Multi-AI Agent

GenAIOps: Operationalize Generative AI - A Practical Guide Generative AIと新たなOps

From SaaS to Vertical AI Agents スタートアップ業界における垂直型AIエージェントの台頭について議論記事垂直型AIエージェントとは • エージェントはタスク管理を支援するSaaSの進化版という位置付け

How to Build a General-Purpose LLM Agent 汎用的なLLMエージェントを構築することは、ユースケースを迅速にプロトタイプ化できる LLMエージェント構築の7ステップ 1.

How to use AI for Prototyping as a PM PMがAIを使ったプロトタイピングを行うべき理由

What is AI Engineering? AIエンジニアとは何か • AIエンジニアは、LLMを活用してAIシステムを構築し、ビジネス課題を解決する役割 • この職種は、MLエンジニアやソフトウェアエンジニアと関連している •

Weekly AI Agents News! 12月号 プロダクト/ニュースのアーカイブ

Weekly AI Agents News! 12月号 プロダクト/ニュースのアーカイブ

More Decks by masatoto

Other Decks in Research

Featured

Transcript

Weekly AI Agents News! 12月号プロダクト/ニュースのアーカイブ

Weekly AI Agents News! 12月号プロダクト/ニュースのアーカイブ