Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ブログの作成に音声AIツールを使って音声入力しようとした話

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for Makky12 Makky12
February 19, 2026

 ブログの作成に音声AIツールを使って音声入力しようとした話

2026/02/19(木)に開催された「KAG AI WEEK Day4 ~ランチタイムにAIを浴びる!5日間連続LTウィーク~」における私の発表「ブログの作成に音声AIツールを使って音声入力しようとした話」の発表資料です。 #kag_ai_week

https://kddi-agile.connpass.com/event/384248/

Avatar for Makky12

Makky12

February 19, 2026
Tweet

More Decks by Makky12

Other Decks in Technology

Transcript

  1. 1 KDDI Agile Development Center Corporation 自己紹介 ◼ 氏名:鈴木 正樹

    ◼ 所属:KDDIアジャイル開発センター(KAG) 名古屋オフィス ◼ 役割:クラウドアーキテクト & バックエンドエンジニア サーバーレス&IaCが大好き。好きなサービスはAWS LambdaとAWS CDK 主にJAWS-UG 名古屋&JAWS-UG CDK支部で活動 ◼ Certification: ◼ AWS Solution Architect Associate(2023) ◼ AWS Community Builder(serverless)(2023~) ◼ Scrum Inc. 認定スクラムマスター(2025~) ◼ : @makky12(SUZUKI Masaki@クラウドエンジニア) ◼ Blog:https://makky12.hatenablog.com/
  2. 2 KDDI Agile Development Center Corporation 本日のアジェンダ • AI音声ツール導入の経緯 •

    Wispr Flowでブログ作成をやった結果 • 参考:Wispr Flowでコーディングを試してみた • まとめ
  3. 3 KDDI Agile Development Center Corporation 注意事項 • 本セッションは特定のAI技術にDeep Diveするような内容ではありません

    ◦ 「やってみた」シリーズの一環として、気楽にご覧ください • Wispr Flowの詳細説明は、今回は省略します ◦ 正式な情報は、Wispr Flow公式サイトをご確認ください • この資料は、下記URLで公開済みです ◦ この資料です • 本資料は、Wispr FlowでのAI音声入力は利用してません(理由は本文内で) ◦ ちなみに、みのるん氏作の「#パワポ作るマン」でも作ってません
  4. 5 KDDI Agile Development Center Corporation AI音声ツール導入の経緯 Wispr Flow導入まで •

    個人活動の一環で、ブログでのアウトプットを行っている ◦ https://makky12.hatenablog.com/(「echo(“備忘録”)」) ◦ https://qiita.com/makky12/ • ブログの作成に、毎回やたら時間がかかりすぎる ◦ (内容はともかく)時間だけは毎回超大作に… • もっとサクッとブログ作成&公開を行いたい ◦ ブログ作成のハードルを下げたい&もっとアウトプット数を増やしたい ◦ かといって、AIに記事を生成してもらうのは論外だし…
  5. 6 KDDI Agile Development Center Corporation AI音声ツール導入の経緯(その2) Wispr Flow導入までの経緯 •

    そんな時、AI音声入力ツール「Wispr Flow」の存在を知る ◦ Wispr Flow公式サイト:https://wisprflow.ai/ • 今までのツールと比べ、日本語の認識精度がかなり高く、日本語入力にかなり便利そう 文章を音声入力すれば、ブログ作成の時間を短縮できるのでは?
  6. 8 KDDI Agile Development Center Corporation Wispr Flowのメリット 主に3点 •

    導入・操作が簡単&比較的安価 ◦ インストール&ユーザー登録するだけ ◦ 入力モードON/OFF切替はショートカットキーで一発 ◦ PC版(Win/Mac)は2,000語/週まで無料(iPhoneは1,000語/週まで無料) • 日本語の認識精度がかなり良かった ◦ 思った以上に認識精度が高く、実用レベルで結構使えた ◦ 入力する内容が決まっているなら、なかなか便利そう(公式ドキュメントなど) • ノイズ・雑音を誤判断することがほとんどなかった ◦ 「動画サイトの音声」や「(流している)音楽」レベルは全く問題なし ◦ 環境音を誤判断することも全くなかった(私の環境では) ◦ おそらく、それなりの治安(意味深)の環境であれば問題ないと思う
  7. 9 KDDI Agile Development Center Corporation Wispr Flowの課題点 主に2点+1 •

    やはり誤認識はある ◦ いくら認識精度が高いといっても、やはり誤認識はある(これは仕方ない) • 固有名詞や専門用語は「辞書機能」である程度フォローできる(Team版以上なら共有辞書を使用可能) ◦ 「これ(=AI音声入力ツール)1つですべて完結する」とは思わないことが大事 • 入力モードONの認識がイマイチ ◦ ショートカットキーを押しても入力モードONと認識しないことが結構あった ◦ 何度も繰り返すと、そのうち認識してくれる(ちなみに、OFFの認識精度はかなり良い) • その他、もう一つ大きな問題が発覚 ◦ 次のページで紹介
  8. 10 KDDI Agile Development Center Corporation 「文章が浮かんでこない」という問題 Wispr Flow(AI音声入力ツール)というより、使用する人間側の問題ですが… •

    いざ音声入力で書こうとすると、文章が全然頭に浮かばない(マジで) ◦ キーボード入力の時は問題なく浮かんでくるのにが、音声入力しようとすると全然浮かばない ◦ 音声入力させる場合、一度頭の中で文章としてまとめる作業が必要だから? ◦ とはいえ個人の個性・特性な気もする…?(この辺、皆さんはどうなのかを知りたいです) • 結果、ブログというより「顧客への説明」のような堅苦しい文章しか出てこない結果に… 結果「やっぱり手書きが一番!」という結論に落ちつきました
  9. 12 KDDI Agile Development Center Corporation Wispr Flowでコーディングを試してみた おまけで、Wispr Flowでコーディングは可能か?というのを試してみました

    • 下記コードをWispr Flowでコーディング • 結果、10分やって1行目すらまともにコードを記載できず、断念 ◦ むしろ、日本語の方が認識精度が高いんじゃ…(使用者の英語力の問題?) ◦ ., (), スペースなど入力が非常に困難な文字も少なくない ◦ 特に、変数名((英語としてはあり得ない)複数単語の組み合わせ)を全然認識しない • 結論:コーディングは、コード生成AIに任せるのが一番!(「餅は餅屋」)
  10. 14 KDDI Agile Development Center Corporation まとめ このセッションのまとめ • Wispr

    Flowはじめ、各種AI音声入力ツールには便利な反面、問題点もあるので「これ一つで すべて解決できるとは初めから思わない」ことが大事 • ブログのように「考えながら入力する」タイプの文章の場合、音声入力だと意外と文章が浮 かんでこない事がある(人間の特性として、そういうタイプの人もいる) ◦ 逆に、すでに内容が分かっている文章を入力するケースでは非常に便利(社内文章、契約書など) • AI音声入力ツールは、コーディングには全く向かない。コード生成AIに任せるのが一番 ◦ 餅は餅屋(再掲)