O N A S AT O 株式会社Fusic エンジニア 東京の大学を卒業。在学中にエンジニアとして3社で約2年半の長期イン ターンを経験。機械学習や生成AIの研究開発に携わる中で、MLモデルの 本番運用に興味を持ちMLOpsに関心を深める。生成AIも取り入れた開発 や、AWSパートナー企業での経験から、同領域に強みを持つFusicに魅力 を感じ、2025年に新卒入社。
Adaptive information management for retrieval-augmented generationより Before 素のRAG 検索を繰り返すたびに無関係な文書が混ざり、答え の精度が落ちる After State-Aware RAG ワーキングメモリに必要な情報だけを残しながら推 論を進める いつもの通りブログ書いてます
Bedrock KB から検索 Generator (回答役) サブ質問・中間回答・最終回答を 生成 Extractor (整理役) 「捨てる/まとめる/追記」で ワーキングメモリを管理 5つの推論アクション(A1〜A5) A1 Decompose & Answer 分解→検索→中間回答 A2 Consolidate メモリだけで結論 A3 Refine 中間回答を直す A4 Redirect 聞き方を変える A5 Conclude 最終回答 学習が必要なのは Extractor だけ → Claude へのプロンプトで代替(AWS マネージドで再現) 3つのモジュールが下記5アクションを使い分けて推論を進める G + R + E E E G + R G R = Retriever / G = Generator / E = Extractor