手法:用途別に異なるレベルの整文指針を定め、軽量な LLM のfine tuning により整文品質を向上させた 成果:ROUGE2 :[ 会見]0.272→0.647 、[ インタビュ ー]0.220→0.598 (単純な指示文に比べ、特にインタビュ ー・会見で整文品質を改善) 実績: 「ALOFA 」現行モデルの1機能として実用中 8 冗長表現 F(フィラー) 、D(言い 直し) 、B(相槌) 固有表現 S(漢数字) 、P(人名) 後処理モデルで付与するタグ 朝日新聞社の(Pスズキ)です。(Fえ ー)本日は(S百人)の方に手伝って(D もら)もらって整文の作業を進めな くちゃと思います。(Bなるほど)今 回の作業時間は、(S二時間)くらい を予定のをしています。題材とし ては(Pキシダ)首相の演説ですね。 ここで作業していいんですか?お 願いします。作業を説明を始めさ してもらいます。 タグデータ見本 音声認識研究 Copyright 2025 The Asahi Shimbun Company.