• Improving Vision-Language-Action Model with Online Reinforcement Learning • Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search 自己修正 • RealCritic: Towards Effectiveness-Driven Evaluation of Language Model Critiques • Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge 安全性 • Context is Key for Agent Security
Supernet Digital Agents • AI Agents for Computer Use: A Review of Instruction-based Computer Control, GUI Automation, and Operator Assistants Data Agents • Jupybara: Operationalizing a Design Space for Actionable Data Analysis and Storytelling with LLMs Multi Agent Systems • Position: Towards a Responsible LLM-empowered Multi-Agent Systems • ToM-agent: Large Language Models as Theory of Mind Aware Generative Agents with Counterfactual Reflection • Multi-Agent Geospatial Copilots for Remote Sensing Workflows
都市監視、森林保護、気候分析、農業研究などの多様なアプリケーションを統合できる 合計521のAPI関数が実装され、単一エージェントの約3倍の規模となった 都市計画、農業、エネルギー、環境、保険、防衛、不動産、物流、金融、通信 の業界で応用可能 2月10日 更新分 Multi Agent Systems
in Tool Learning? (紹介しない) 学習 • 自己修正能力を獲得する学習フレームワーク「Agent-R」を提案 • Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training • エージェントが新しい環境に自律的に適応できるよう、軌跡データ生成するフレームワーク • Learn-by-interact: A Data-Centric Framework for Self-Adaptive Agents in Realistic Environments メモリ • 動的な自己更新型ライブラリを持つChem Agentの提案 • ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning 自己進化 • 学び続けるエージェントの実現に向けて生涯学習を知っておこう • Lifelong Learning of Large Language Model based Agents: A Roadmap
Action Dual-Control Agent for Generalized Applications • モジュールを組み合わせ計画と実行を完遂するエージェント • A Multimodal Social Agent • 標準操作手順をもとに行動するエージェント • SOP-Agent: Empower General Purpose AI Agent with Domain-Specific SOPs • エージェントの認証、行動範囲と参照範囲の認可 • Authenticated Delegation and Authorized AI Agents Agentic AI Systems • クラウド運用やITシステムの管理をエージェントで自動化 • AIOpsLab: A Holistic Framework to Evaluate AI Agents for Enabling Autonomous Clouds • 個別教育プラットフォームのユーザー行動をシミュレーション • Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems
Generation: A Survey on Agentic RAG • 情報密度の高い文章コンテンツを生成させる方法を提案 • OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking Software Agents • LLMベースのコード生成プロセスを体系的に整理 • Towards Advancing Code Generation with Large Language Models: A Research Roadmap API Agents • 小型無人航空システム(sUAS)のシミュレーションテストプロセスを自動化 • LLM-Agents Driven Automated Simulation Testing and Analysis of small Uncrewed Aerial Systems Digital Agents • 自己データ収集によるGUIエージェントモデル「UI-TARS」を提案 • UI-TARS: Pioneering Automated GUI Interaction with Native Agents • アリババから階層型の自己進化モバイルエージェントの提案 • Mobile-Agent-E: Self-Evolving Mobile Assistant for Complex Tasks
LLM Co-Pilots Research Agents • 文献調査エージェントをいつ使う? • PaSa: An LLM Agent for Comprehensive Academic Paper Search Embodied Agents • EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents(紹介しない) Multi Agent Systems • マルチエージェント協調を俯瞰する • Multi-Agent Collaboration Mechanisms: A Survey of LLMs
Scheduled tasks in ChatGPT • Introducing Citations on the Anthropic API • Perplexity now has a mobile assistant on Android • Perplexity launches Sonar, an API for AI search