Slide 1

Slide 1 text

人工知能時代の到来 藤田 一寿 Ver. 20251202 初心者向けの導入資料

Slide 2

Slide 2 text

人工知能の実力の現状 • 人と会話ができます。 • 文章作成は得意です。 • 英語・日本語だけではなく様々 な言語ができます。 • プログラミングもできます。 • 絵も得意です。 • 曲も作れます。 • ゲームは人より得意です。 もう、人を雇う必要はないのでは?

Slide 3

Slide 3 text

人工知能はどのようなことが できるか

Slide 4

Slide 4 text

人工知能は画像処理が得意 • 物体認識 • 画像に写っているものが何であるか分かる。 • 領域分割 • 画像の該当する場所がどこか分かる。 • 物体の位置推定 • 物体がどこに写っているか分かる。 • 異常検知 • 画像がいつも通りであるかどうか検知する。 • 画像生成 • 指示された画像を生成する。 何が映っているか分かります。 絵を描けます。

Slide 5

Slide 5 text

物体認識 (Krizhevsky 2012) Classification Results (CLS) 0.28 0.26 0.16 0.12 0.07 0.036 0.03 0.023 0 0.05 0.1 0.15 0.2 0.25 0.3 2010 2011 2012 2013 2014 2015 2016 2017 Classification Error 16.7% ↓ 23.3% ↓ (http://image-net。org/challenges/talks_2017/ILSVRC2017_overview。pdf) 物体認識大会で優勝した人工知能のスコア 0。051 Karpathy AlexNet ResNet Deep learning GoogLeNet 画像識別大会の課題にKarpathy博士が取り組んだが、人工知能より悪 いスコアだった。 物体認識において、人工知能は人間より性能は上かもしれない。 2012年の物体認識大会で優勝した人工知能 AlexNetの認識例。間違っているものもあるが、 間違いも筋の良い間違え方(画像から連想され る答え)をしている。 人間と同じような間違え 方をしている点が面白い。 誤答率

Slide 6

Slide 6 text

物体認識における人工知能の性能は進化し続けている https://paperswithcode.com/sota/image-classification-on-imagenet?p=deepvit-towards-deeper-vision-transformer

Slide 7

Slide 7 text

画像生成人工知能 • 人が描いた画像と変わらない画像が生成できる。 • 性能が高すぎて人が描いたものと区別がつかない。 • 画像のクオリティと制作時間を考慮すると簡単なイラストなら画像生成人工知 能で良いのではないか。 人工知能に自分の名前を与 え画像を生成 人工知能に小松大学を与え画像を生成 2022年版 2023年版

Slide 8

Slide 8 text

画像生成人工知能 2023年度前期

Slide 9

Slide 9 text

画像生成人工知能 Komatsu university Komatsu city A cute girl in Komatsu 2024 FLUX.1

Slide 10

Slide 10 text

画像生成 2025 Google Nano Banana Pro

Slide 11

Slide 11 text

動画生成 2025 Google Veo3.1

Slide 12

Slide 12 text

Deepfake https://www.youtube.com/watch?v=x2g48Q2I2ZQ (Rossler et al., 2019)

Slide 13

Slide 13 text

領域分割 • 人工知能による画像の領域分割 • 各ピクセルが何の物体に属しているかを推定する 9 FCN-8s SDS[14] Ground Truth Image Fig. 6. Fully convolutional networks improve performance on PASCAL. The left column shows the output of our most accurate net, FCN-8s. The TABLE 8 The role of foreground, background, and shape cues. All scores are the mean intersection over union metric excluding background. The architecture and optimization are fixed to those of FCN-32s (Reference) and only input masking differs. train test FG BG FG BG mean IU Reference keep keep keep keep 84.8 Reference-FG keep keep keep mask 81.0 Reference-BG keep keep mask keep 19.8 FG-only keep mask keep mask 76.1 BG-only mask keep mask keep 37.8 Shape mask mask mask mask 29.1 Masking the foreground at inference time is catastrophic. However, masking the foreground during learning yields a network capable of recognizing object segments without observing a single pixel of the labeled class. Masking the background has little effect overall but does lead to class confusion in certain cases. When the background is masked during both learning and inference, the network unsurpris- ingly achieves nearly perfect background accuracy; however certain classes are more confused. All-in-all this suggests that FCNs do incorporate context even though decisions are driven by foreground pixels. To separate the contribution of shape, we learn a net restricted to the simple input of foreground/ background masks. The accuracy in this shape-only condition is lower Shelhamer et al。 2016 Ronneberger et al., 2015 Novikov et al., 2018

Slide 14

Slide 14 text

領域分割 (https://www.youtube.com/watch?v=1HJSMR6LW2g)2016

Slide 15

Slide 15 text

信号処理 • 音声認識 • 何の音か分かる。 • 何を言っているか分かる。 • 信号分離 • 混ざった音を音源ごとに分ける。 • 混ざった音の中から特定の音源の音を取り出す。 • 音声生成 • 新たな曲や声を作りだす。 • 既存の声に似た声を作れる。 いらない音を消せます。 曲を作れます。

Slide 16

Slide 16 text

制御 • ロボット制御 • ゲームプレイ人工知能 ロボットを動かせます。 ゲームは人より上手いです。

Slide 17

Slide 17 text

(https://www.youtube.com/watch?v=iaF43Ze1oeI ) 2016 ロボット制御

Slide 18

Slide 18 text

ロボット制御 • Tesla optimus

Slide 19

Slide 19 text

Physical AI • フィジカル AI により、ロボットや自動運転車などの自律マシンは、現実の (物理的な) 世界を認識、理解して、複雑な行動ができるようになる。 • また、洞察や実行すべきアクションを生成する能力もあることから、よく「生 成フィジカル AI」とも呼ばれる。 • https://www.nvidia.com/ja-jp/glossary/generative-physical-ai/ • よくわからないことが書いてあるが、データから世界を理解する人工知能(世 界モデル)を構築し、世界を理解し自ら動ける人工知能(ロボット)のことを Physical AIと言っている。 • 世界を理解するために、現実世界のセンサー(ロボット)を使うのも可能だが、 バーチャル空間を用い世界モデルを構築しても良い。

Slide 20

Slide 20 text

(https://www.youtube.com/watch?v=TmPfTpjtdgg) 2015 ゲームをプレイ

Slide 21

Slide 21 text

(https://www.youtube.com/watch?v=L4KBBAwF_bE) 2016

Slide 22

Slide 22 text

人よりゲームは上手い • ロボットの制御やゲーム人工知能に使われる人工 知能はDQNは、ゲームで人間より良いスコアを出 す。 • Atariの49のゲームのうち29タイトルで人間より良 い成績を収める (Mnih et al。 2015)。 • AlphaStarはコンピュータゲーム「スタークラフト 2」で人間のプレーヤの上位0。2%にランクインし た(2019)。 (Mnih et al., 2015) (https://deepmind.google/discover/blog/alphastar-mastering-the-real-time-strategy-game-starcraft-ii/)

Slide 23

Slide 23 text

AlphaGo、 AlphaGo Zero、 AlphaZero • AlphaGo • 2016年イ・セドル氏に勝利、2017年柯潔(コ・ジェ)氏に勝利 • 2015年まではアマ有段者レベルだった囲碁AIが、AlphaGoの登場によりにより囲 碁AIが世界トップ棋士より強くなった。 • AlphaGo Zero (Silver et al., 2017) • 自己学習のみでAlphaGoに勝つ。 • AlphaZero (Silver et al., 2018) • 様々なボードゲームにも対応できる。 • 自己学習のみで強くなる。人間はデータを用意する必要がない。 • 碁ではAlpha Goにも勝てる。 • チェス (Stockfish)、将棋(elmo)にも勝てる。

Slide 24

Slide 24 text

言語処理 • 文章生成 • 対話 • 文章理解 • 翻訳 • 文章校正・校閲 • プログラムコード生成 翻訳(DeepL) しゃべるのは得意です。 作文も得意です。 翻訳できます。 プログラミングも得意です。 英文改善(DeepL)

Slide 25

Slide 25 text

対話型人工知能 • 人が話す(書く)文章と変わらない文章を生成できる。 • 性能が高すぎて人が書いた文章と区別がつかない。 • 性能が高すぎて人がいらなくなる可能性が出てきている。 対話型人工知能の会話例(ChatGPT)

Slide 26

Slide 26 text

プログラミングは人工知能任せ 社内でCodexをどのように自社製品として活用 していますか?CodexはCodexの構築に貢献して いますか? 40 eason-OAI •14日前 非常に活用しています!チームメンバーによっ てパターンは異なりますが、私はCodexへの変 更の99%をCodexを使って記述しています。来年 は手動でコードを1行も書かないことを目標に しています :) 人工知能コーディングシステムOpenAI Codexの開発において、ある技術者は 人工知能コーディングシステムを使って99%のコードを書いている。

Slide 27

Slide 27 text

プログラミングは人工知能任せ • Googleはプログラミングにおいて、人工知能を活用している。 • 2024年10月ではコードの25%以上が人工知能により生成されている。 (https://www.watch.impress.co.jp/docs/news/1635534.html) • 2025年10月ではコードの半分が人工知能により生成されている。 (https://www.youtube.com/watch?v=hA1OEi6TRYU&list=WL&t=2162s)

Slide 28

Slide 28 text

プログラミングは人工知能任せ • 簡単なソフトなら人工知能に任せて作ることができる。 • 実際に人工知能に作らせたソフト • ローカル実行可能な翻訳ソフト • https://github.com/KazuhisaFujita/PrivaTranslate • 複数エージェント型チャットボットシステム • https://github.com/KazuhisaFujita/OllamaSimpleHub • あいうえお学習ゲーム • https://github.com/KazuhisaFujita/AIUEO-Tap

Slide 29

Slide 29 text

なぜ今、人工知能が話題なの か

Slide 30

Slide 30 text

これまでも人工知能はあった • これまでのあった人工知能 • 電卓 • 画像認識 • 画像に映っている物体が何か分かる。 • 何が何処にあるか分かる。 • 文字が分かる。 • 予測 • 天気予報などの情報から仕入れ数を予測する。 • 状況から販売値段を決める。 • これまでの人工知能は何らかの機能に特化している。 • 特化しているため人工知能を使っている感覚がなく、単に便利なソフト・機能と感じる。 • 日常で使っており高性能であることに気づかない。 • 高性能が当たり前になっている。 影からみんなの生活を 支えています。

Slide 31

Slide 31 text

なぜ今、人工知能が話題になるのか • 汎用的 • 自然な会話ができる。 • 動くプログラムコードも生成される。 • データ解析もできる。 • 文章要約もできる。 • 文章校正もできる。 • 翻訳も出来る。 • 表現の世界にも進出 • 絵も書ける。 • 曲も作れる。 • 以上の機能をもった人工知能を誰でも使える。 作文や絵を描くのが得意 です。

Slide 32

Slide 32 text

なぜ今、人工知能が話題になるのか • 性能が高い • 前述の用途で実用に足る性能がある。 • 人工知能に任せられる業務が増える。人工知能に雇用を奪われるの心配を真面目に しなければならなくなった。 • 人工知能技術が人類を滅ぼす可能性を真面目に議論する人工知能研究者が現れる 。 • 創造性を持ち始める。 • 絵や音楽など芸術の世界でも人工知能の作品が存在感を持つ。 • 創造するという人の特権と思っていた行為が人工知能にも出来、人の尊厳を傷つ ける。 • 人は習得するために多大な時間をかけているのに、人工知能がいとも簡単に高品質の絵を出力 する(本当は人工知能(研究者)もこのレベルまで来るのに大変な苦労をしているが)。 人のかわりに何でも できます。

Slide 33

Slide 33 text

人工知能はすでに人を超えている 画像認識 https://aiindex.Stanford.edu/report/ 人レベル 数学 抽出型質問応答 画像理解と自然言語理解 の統合能力 自然言語理解 マルチタスク言語理解 複数モード の理解 博士レベルの 科学の質問

Slide 34

Slide 34 text

話題の2大人工知能 •対話型人工知能 •画像生成人工知能

Slide 35

Slide 35 text

対話型人工知能 • 対話型人工知能とは • 会話が出来る人工知能 • 利用者が音声やテキストで入力すると自然な文章を生成し、応答してくれる人工 知能(https://www.nikkei.com/theme/?dw=23052603) • 例: • ChatGPT (OpenAI) • Copilot (Microsoft) • Gemini (Google) • Claude (Anthropic) • 古くはELIZA(イライザ)

Slide 36

Slide 36 text

対話型人工知能のユーザーの伸びもすごい ChatGPTはたった2ヶ月で1億ユーザ 達成!!

Slide 37

Slide 37 text

中国(83%)、インドネシア (80%)、タイ(77%)といっ た国では、AI製品やサービスは 有害というより有益であると考 える人が圧倒的多数を占めてい ます。一方、カナダ(40%)、 アメリカ(39%)、オランダ (36%)といった国では、楽観 的な見方は依然としてはるかに 低い水準にとどまっています。 しかしながら、感情は変化しつ つあり、2022年以降、以前は懐 疑的だったドイツ(+10%)、 フランス(+10%)、カナダ (+8%)、イギリス(+8%)、 アメリカ(+4%)など、楽観的 な見方が大きく高まっています。

Slide 38

Slide 38 text

ChatGPTはかなり役に立つ(よって人が要らなくなる?) • ChatGPTを使った実際のサービス • ChatGPTが英会話講師として活躍 (Speak) • PDFの論文を要約 (ChatPDFなど) • プレゼンも自動生成 (ChatGPT、 SlidesGPTなど) • 会議の要約も出来る(いろいろ) • 活用事例 • プログラムを作成できる。 • しかもChatGPTが自ら自分のプログラムコードを修正する(AutoGPT)。 • 自然言語でロボットに指示を出せる (ChatGPT for robot)。(https://www.Microsoft.com/en- us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/) • ゲーム内でAI同士が会話した。(Park et al., https://arxiv.org/abs/2304.03442) • 子供の感想文の手伝いが出来た。 (https://twitter.com/ume_nanminchamp/status/1641703840276959232) • 機械学習のコンペの課題をChatGPTの指示に従って解くと良い成績だった。 (https://zenn.dev/seiyakitazume/articles/bc11bbd020cdfe) • 日単位で新しいアイデアやサービスが出てくる。 このスライドは2023年3月末くらいの 様子を表す。かなり古い内容。

Slide 39

Slide 39 text

対話型人工知能の導入事例 • 地方自治体 • 神奈川県横須賀市 • ChatGPTの全長的な活用実証を開始。文章作成、文章の要約、誤字脱字のチェック、またアイデア創出などに活用。 • (https://www.city.Yokosuka.Kanagawa.jp/0835/nagekomi/20230418_chatgpt.html、 2023年5月23日) • 福井県越前市 • 住民の質問に答える住民向けと、施策立案などの際の資料作成に役立てるための職員向けにChatGPTを試験運用 • (https://www.fukuishimbun.co.jp/articles/-/1790078、 2023年6月5日) • 企業 • パナソニック コネクト • 3時間かかっていたコーディング前の事前調査が5分に短縮、9時間かかっていたアンケート分析が6分で終了 • (https://ascii.jp/elem/000/004/143/4143067/、 2023年6月29日) • ベネッセHD • ChatGPTを使った自由研究支援サービスを提供 (https://www.nikkei.com/article/DGXZQOUC10A940Q3A710C2000000/、 2023年7月13日) • 日清食品HD • 企画立案、商談のロールプレイなどで営業分野で活用、他分野にも活用を広げていく予定。 (https://toyokeizai.net/articles/-/689597、 2023年7月27日)

Slide 40

Slide 40 text

人工知能搭載ロボットが代行 • ローソンは、AI搭載ロボットとスマートグラスを活用し、店舗業務の効率化を 目指してい。2030年までに店舗オペレーションを30%削減を目標としている 。ロボットで欠品検査から品出しまでやことを目指し検証実験中。 https://japan.cnet.com/article/35239710/)

Slide 41

Slide 41 text

画像生成人工知能 • 画像生成人工知能 • 下手なプロより上手い絵が生成される。 • 短時間でそれなりに満足できる画像が生成できるため人間 の尊厳を傷つける。 • Fake画像が簡単に作れる。 https://twitter。 フェイク画像例 2024年 DALL-E3 2024 DALL-E3 (2024年FLUX)

Slide 42

Slide 42 text

話題のAI関連の企業

Slide 43

Slide 43 text

OpenAI • 非営利法人OpenAI Incとその子会社である営利法人OpenAI Limited Partnershipからなる。 • 2015年サム・アルトマン、イリヤ・サツケヴァー、イーロン・マスクらが設立 • GPT3、GPT4、DALL-E2など開発 • OpenAIの精神 • AI should be an extension of individual human wills and、 in the spirit of liberty、 as broadly and evenly distributed as possible。 (AIは個人の意思の延長であるべきで、自由の精神の下、できる限り広く均等に分配さ れるべき)(https://openai.com/blog/introducing-openai) • 「人間レベルのAIが、いつ実現可能なレベルに達するかを予測するのは困難だ。そのレベルに達したときに、良 い成果を自己利益よりも優先できる強力な研究機関が存在することが重要となる」 (https://japan.zdnet.com/article/35074857/、 2015年12月14日) • 「自身の好奇心に集中して良い結果を優先できる一流の研究機関が存在することが重要です」と声明で述べている。 「研究者は、論文やブログ投稿、コードなどの形態を問わず、自らの成果を公開することを強く推奨され、(もし 存在するならば)特許は世界と共有されます」。(https://www.technologyreview.jp/s/188883/the-messy- secretive-reality-behind-openais-bid-to-save-the-world/、 2020年5月27日) • 様々な人工知能開発支援ツールを提供 • OpenAI Gym • OpenAI Universe • 2019年マイクロソフトから出資 • 皮肉なことに、現在は開発した人工知能技術はクローズドなものになっている。 OpenAIからCloseAIへ イリヤ・サツケヴァー:現在の深層ニューラルネットワーク、人工知能ブームの火付 け役となった人物。AlexNetの共著者で研究を主導した人物であると言われる。

Slide 44

Slide 44 text

DeepMind • 2010年デミス・ハサビス(世界トップクラスのゲームプレーヤー、ゲーム開発者 、神経科学者、人工知能研究者)が設立 • 2014年Googleが買収 • 様々な革新的な人工知能技術を開発 • Deep Q Network • Alphaシリーズ • AlphGo:囲碁で人のトッププレーヤーに勝つ • AlphaZero:自らの対戦データだけで世界最強 • AlphaStar:コンピュータゲームでも人のトッププレーヤーに勝つ • MuZero:ルールを教えなくても強くなる。 • AlphaFold:タンパク質の構造予測 • AlphaTensor、 AlphaDev:効率的なアルゴリズムを発見 • 2023年4月Google Brain Teamと統合しGoogle DeepMindになった。 • 2024年ノーベル化学賞受賞

Slide 45

Slide 45 text

Google Brain Team • Googleの人工知能研究部門 • 様々な革新的な技術を開発 • 機械学習のプラットフォームTensorflowを開発 • 言語モデル(Transformer、 BERT) • 画像識別モデル(EfficientNet、 Vision Transformer) • AutoML • TPU (https://gigazine.net/news/20180112-google-brain-work-2017/) • 2023年4月Deep Mindと統合しGoogle Deep Mindとなった。

Slide 46

Slide 46 text

NVIDIA • GPU設計およびGPU向け開発ソフトの開発 • GPUとはコンピュータの画像処理に特化した演算装置 • ジェンスン・フアンが1993年に設立 • 開発環境CUDAの提供 • GPUを汎用計算に使う(GPGPU)ソフトを開発する環境 • GPUが科学技術計算で使えるようになったためワークステーションやスーパーコ ンピュータに普及した。 • GPUはニューラルネットワークの計算も高速化出来るため、人工知能の必須部品と なる。 • GPUで量子計算も出来るようになる。 • 量子コンピューティングでも覇権を狙っている? • GPUを汎用計算に用いる技術を実用的なレベルで一般に提供できるのはNVIDIAの みである。 (https://nvidianews.nvidia.com/news/nvidia- announces-gtc-2020-keynote-with-ceo- jensen-huang-set-for-may-14)

Slide 47

Slide 47 text

AI関連各企業の特徴 • Meta • 人工知能開発のプラットフォーム(Pytorch) • 大規模言語モデル(LLAMA) • オープンソースに積極的 • OpenAI • 大規模言語モデル(ChatGPT) • 技術公開に消極的 • Google • 人工知能開発のプラットフォーム(Tensorflow) • 深層強化学習(DQN、 Alpha*) • 研究成果の公開は比較的積極的 • NVIDIA • 人工知能用のプロセッサの独占 • 量子計算用のプロセッサも独占を目指す?(cuQuantum) Microsoft • OpenAI とパートナーシップ • Antholopicとパートナーシップ • Metaと提携 • クラウドコンピューティングに注力 • オープンソースに積極的 Amazon • クラウドコンピューティングに注力 「オープンソースは脅威」「勝者はMeta」「 OpenAIは重要ではない」などと記された GoogleのAI関連内部文書が流出 (https://gigazine.net/news/20230508-google- document-llm-arms-race/、2023年5月8日) Googleの負け惜しみと言う意見もあったが、 2024年の段階では正確に将来を見越していたと 考えられる。確かにMetaは技術発展への寄与と しては勝者かもしれないが、それがビジネスに 繋がっていると言えるかといえば怪しい。 2025年には、MetaのLLMは競争力を失い、 OpenAIとGoogleのクローズLLMと中国製のオ ープンLLMが存在感を示す。

Slide 48

Slide 48 text

AI関連各企業の特徴 • Meta • 人工知能を活かすサービスがない。 • 人工知能を動かすためのインフラを活用するサービスがない。 • プロセッサを開発する。 • Google • 人工知能を活かすサービスがある。 • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • 自社のプロセッサ(TPU)を有している。 • Amazon • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • プロセッサはNVIDIAから購入する。 • プロセッサを開発する 。 • Microsoft • 人工知能を活かすサービスがある。 • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • プロセッサを開発する 。

Slide 49

Slide 49 text

AI関連企業の関係(2025年) Antholopic Amazon NVIDIA Google Apple TSMC Meta Microsoft OpenAI GPU販売 GPU生産 GPU販売 Geminiを提供 パートナーシップ 協力? GPU販売 TPU生産 パートナーシップ パートナーシップ パートナーシップ