$30 off During Our Annual Pro Sale. View Details »

人工知能時代の到来/IntroAI

 人工知能時代の到来/IntroAI

Avatar for Kazuhisa Fujita

Kazuhisa Fujita

November 28, 2023
Tweet

More Decks by Kazuhisa Fujita

Other Decks in Education

Transcript

  1. 人工知能は画像処理が得意 • 物体認識 • 画像に写っているものが何であるか分かる。 • 領域分割 • 画像の該当する場所がどこか分かる。 •

    物体の位置推定 • 物体がどこに写っているか分かる。 • 異常検知 • 画像がいつも通りであるかどうか検知する。 • 画像生成 • 指示された画像を生成する。 何が映っているか分かります。 絵を描けます。
  2. 物体認識 (Krizhevsky 2012) Classification Results (CLS) 0.28 0.26 0.16 0.12

    0.07 0.036 0.03 0.023 0 0.05 0.1 0.15 0.2 0.25 0.3 2010 2011 2012 2013 2014 2015 2016 2017 Classification Error 16.7% ↓ 23.3% ↓ (http://image-net。org/challenges/talks_2017/ILSVRC2017_overview。pdf) 物体認識大会で優勝した人工知能のスコア 0。051 Karpathy AlexNet ResNet Deep learning GoogLeNet 画像識別大会の課題にKarpathy博士が取り組んだが、人工知能より悪 いスコアだった。 物体認識において、人工知能は人間より性能は上かもしれない。 2012年の物体認識大会で優勝した人工知能 AlexNetの認識例。間違っているものもあるが、 間違いも筋の良い間違え方(画像から連想され る答え)をしている。 人間と同じような間違え 方をしている点が面白い。 誤答率
  3. 領域分割 • 人工知能による画像の領域分割 • 各ピクセルが何の物体に属しているかを推定する 9 FCN-8s SDS[14] Ground Truth

    Image Fig. 6. Fully convolutional networks improve performance on PASCAL. The left column shows the output of our most accurate net, FCN-8s. The TABLE 8 The role of foreground, background, and shape cues. All scores are the mean intersection over union metric excluding background. The architecture and optimization are fixed to those of FCN-32s (Reference) and only input masking differs. train test FG BG FG BG mean IU Reference keep keep keep keep 84.8 Reference-FG keep keep keep mask 81.0 Reference-BG keep keep mask keep 19.8 FG-only keep mask keep mask 76.1 BG-only mask keep mask keep 37.8 Shape mask mask mask mask 29.1 Masking the foreground at inference time is catastrophic. However, masking the foreground during learning yields a network capable of recognizing object segments without observing a single pixel of the labeled class. Masking the background has little effect overall but does lead to class confusion in certain cases. When the background is masked during both learning and inference, the network unsurpris- ingly achieves nearly perfect background accuracy; however certain classes are more confused. All-in-all this suggests that FCNs do incorporate context even though decisions are driven by foreground pixels. To separate the contribution of shape, we learn a net restricted to the simple input of foreground/ background masks. The accuracy in this shape-only condition is lower Shelhamer et al。 2016 Ronneberger et al., 2015 Novikov et al., 2018
  4. 信号処理 • 音声認識 • 何の音か分かる。 • 何を言っているか分かる。 • 信号分離 •

    混ざった音を音源ごとに分ける。 • 混ざった音の中から特定の音源の音を取り出す。 • 音声生成 • 新たな曲や声を作りだす。 • 既存の声に似た声を作れる。 いらない音を消せます。 曲を作れます。
  5. Physical AI • フィジカル AI により、ロボットや自動運転車などの自律マシンは、現実の (物理的な) 世界を認識、理解して、複雑な行動ができるようになる。 • また、洞察や実行すべきアクションを生成する能力もあることから、よく「生

    成フィジカル AI」とも呼ばれる。 • https://www.nvidia.com/ja-jp/glossary/generative-physical-ai/ • よくわからないことが書いてあるが、データから世界を理解する人工知能(世 界モデル)を構築し、世界を理解し自ら動ける人工知能(ロボット)のことを Physical AIと言っている。 • 世界を理解するために、現実世界のセンサー(ロボット)を使うのも可能だが、 バーチャル空間を用い世界モデルを構築しても良い。
  6. 人よりゲームは上手い • ロボットの制御やゲーム人工知能に使われる人工 知能はDQNは、ゲームで人間より良いスコアを出 す。 • Atariの49のゲームのうち29タイトルで人間より良 い成績を収める (Mnih et

    al。 2015)。 • AlphaStarはコンピュータゲーム「スタークラフト 2」で人間のプレーヤの上位0。2%にランクインし た(2019)。 (Mnih et al., 2015) (https://deepmind.google/discover/blog/alphastar-mastering-the-real-time-strategy-game-starcraft-ii/)
  7. AlphaGo、 AlphaGo Zero、 AlphaZero • AlphaGo • 2016年イ・セドル氏に勝利、2017年柯潔(コ・ジェ)氏に勝利 • 2015年まではアマ有段者レベルだった囲碁AIが、AlphaGoの登場によりにより囲

    碁AIが世界トップ棋士より強くなった。 • AlphaGo Zero (Silver et al., 2017) • 自己学習のみでAlphaGoに勝つ。 • AlphaZero (Silver et al., 2018) • 様々なボードゲームにも対応できる。 • 自己学習のみで強くなる。人間はデータを用意する必要がない。 • 碁ではAlpha Goにも勝てる。 • チェス (Stockfish)、将棋(elmo)にも勝てる。
  8. 言語処理 • 文章生成 • 対話 • 文章理解 • 翻訳 •

    文章校正・校閲 • プログラムコード生成 翻訳(DeepL) しゃべるのは得意です。 作文も得意です。 翻訳できます。 プログラミングも得意です。 英文改善(DeepL)
  9. プログラミングは人工知能任せ 社内でCodexをどのように自社製品として活用 していますか?CodexはCodexの構築に貢献して いますか? 40 eason-OAI •14日前 非常に活用しています!チームメンバーによっ てパターンは異なりますが、私はCodexへの変 更の99%をCodexを使って記述しています。来年

    は手動でコードを1行も書かないことを目標に しています :) 人工知能コーディングシステムOpenAI Codexの開発において、ある技術者は 人工知能コーディングシステムを使って99%のコードを書いている。
  10. プログラミングは人工知能任せ • 簡単なソフトなら人工知能に任せて作ることができる。 • 実際に人工知能に作らせたソフト • ローカル実行可能な翻訳ソフト • https://github.com/KazuhisaFujita/PrivaTranslate •

    複数エージェント型チャットボットシステム • https://github.com/KazuhisaFujita/OllamaSimpleHub • あいうえお学習ゲーム • https://github.com/KazuhisaFujita/AIUEO-Tap
  11. これまでも人工知能はあった • これまでのあった人工知能 • 電卓 • 画像認識 • 画像に映っている物体が何か分かる。 •

    何が何処にあるか分かる。 • 文字が分かる。 • 予測 • 天気予報などの情報から仕入れ数を予測する。 • 状況から販売値段を決める。 • これまでの人工知能は何らかの機能に特化している。 • 特化しているため人工知能を使っている感覚がなく、単に便利なソフト・機能と感じる。 • 日常で使っており高性能であることに気づかない。 • 高性能が当たり前になっている。 影からみんなの生活を 支えています。
  12. なぜ今、人工知能が話題になるのか • 汎用的 • 自然な会話ができる。 • 動くプログラムコードも生成される。 • データ解析もできる。 •

    文章要約もできる。 • 文章校正もできる。 • 翻訳も出来る。 • 表現の世界にも進出 • 絵も書ける。 • 曲も作れる。 • 以上の機能をもった人工知能を誰でも使える。 作文や絵を描くのが得意 です。
  13. なぜ今、人工知能が話題になるのか • 性能が高い • 前述の用途で実用に足る性能がある。 • 人工知能に任せられる業務が増える。人工知能に雇用を奪われるの心配を真面目に しなければならなくなった。 • 人工知能技術が人類を滅ぼす可能性を真面目に議論する人工知能研究者が現れる

    。 • 創造性を持ち始める。 • 絵や音楽など芸術の世界でも人工知能の作品が存在感を持つ。 • 創造するという人の特権と思っていた行為が人工知能にも出来、人の尊厳を傷つ ける。 • 人は習得するために多大な時間をかけているのに、人工知能がいとも簡単に高品質の絵を出力 する(本当は人工知能(研究者)もこのレベルまで来るのに大変な苦労をしているが)。 人のかわりに何でも できます。
  14. 中国(83%)、インドネシア (80%)、タイ(77%)といっ た国では、AI製品やサービスは 有害というより有益であると考 える人が圧倒的多数を占めてい ます。一方、カナダ(40%)、 アメリカ(39%)、オランダ (36%)といった国では、楽観 的な見方は依然としてはるかに 低い水準にとどまっています。

    しかしながら、感情は変化しつ つあり、2022年以降、以前は懐 疑的だったドイツ(+10%)、 フランス(+10%)、カナダ (+8%)、イギリス(+8%)、 アメリカ(+4%)など、楽観的 な見方が大きく高まっています。
  15. ChatGPTはかなり役に立つ(よって人が要らなくなる?) • ChatGPTを使った実際のサービス • ChatGPTが英会話講師として活躍 (Speak) • PDFの論文を要約 (ChatPDFなど) •

    プレゼンも自動生成 (ChatGPT、 SlidesGPTなど) • 会議の要約も出来る(いろいろ) • 活用事例 • プログラムを作成できる。 • しかもChatGPTが自ら自分のプログラムコードを修正する(AutoGPT)。 • 自然言語でロボットに指示を出せる (ChatGPT for robot)。(https://www.Microsoft.com/en- us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/) • ゲーム内でAI同士が会話した。(Park et al., https://arxiv.org/abs/2304.03442) • 子供の感想文の手伝いが出来た。 (https://twitter.com/ume_nanminchamp/status/1641703840276959232) • 機械学習のコンペの課題をChatGPTの指示に従って解くと良い成績だった。 (https://zenn.dev/seiyakitazume/articles/bc11bbd020cdfe) • 日単位で新しいアイデアやサービスが出てくる。 このスライドは2023年3月末くらいの 様子を表す。かなり古い内容。
  16. 対話型人工知能の導入事例 • 地方自治体 • 神奈川県横須賀市 • ChatGPTの全長的な活用実証を開始。文章作成、文章の要約、誤字脱字のチェック、またアイデア創出などに活用。 • (https://www.city.Yokosuka.Kanagawa.jp/0835/nagekomi/20230418_chatgpt.html、 2023年5月23日)

    • 福井県越前市 • 住民の質問に答える住民向けと、施策立案などの際の資料作成に役立てるための職員向けにChatGPTを試験運用 • (https://www.fukuishimbun.co.jp/articles/-/1790078、 2023年6月5日) • 企業 • パナソニック コネクト • 3時間かかっていたコーディング前の事前調査が5分に短縮、9時間かかっていたアンケート分析が6分で終了 • (https://ascii.jp/elem/000/004/143/4143067/、 2023年6月29日) • ベネッセHD • ChatGPTを使った自由研究支援サービスを提供 (https://www.nikkei.com/article/DGXZQOUC10A940Q3A710C2000000/、 2023年7月13日) • 日清食品HD • 企画立案、商談のロールプレイなどで営業分野で活用、他分野にも活用を広げていく予定。 (https://toyokeizai.net/articles/-/689597、 2023年7月27日)
  17. OpenAI • 非営利法人OpenAI Incとその子会社である営利法人OpenAI Limited Partnershipからなる。 • 2015年サム・アルトマン、イリヤ・サツケヴァー、イーロン・マスクらが設立 • GPT3、GPT4、DALL-E2など開発

    • OpenAIの精神 • AI should be an extension of individual human wills and、 in the spirit of liberty、 as broadly and evenly distributed as possible。 (AIは個人の意思の延長であるべきで、自由の精神の下、できる限り広く均等に分配さ れるべき)(https://openai.com/blog/introducing-openai) • 「人間レベルのAIが、いつ実現可能なレベルに達するかを予測するのは困難だ。そのレベルに達したときに、良 い成果を自己利益よりも優先できる強力な研究機関が存在することが重要となる」 (https://japan.zdnet.com/article/35074857/、 2015年12月14日) • 「自身の好奇心に集中して良い結果を優先できる一流の研究機関が存在することが重要です」と声明で述べている。 「研究者は、論文やブログ投稿、コードなどの形態を問わず、自らの成果を公開することを強く推奨され、(もし 存在するならば)特許は世界と共有されます」。(https://www.technologyreview.jp/s/188883/the-messy- secretive-reality-behind-openais-bid-to-save-the-world/、 2020年5月27日) • 様々な人工知能開発支援ツールを提供 • OpenAI Gym • OpenAI Universe • 2019年マイクロソフトから出資 • 皮肉なことに、現在は開発した人工知能技術はクローズドなものになっている。 OpenAIからCloseAIへ イリヤ・サツケヴァー:現在の深層ニューラルネットワーク、人工知能ブームの火付 け役となった人物。AlexNetの共著者で研究を主導した人物であると言われる。
  18. DeepMind • 2010年デミス・ハサビス(世界トップクラスのゲームプレーヤー、ゲーム開発者 、神経科学者、人工知能研究者)が設立 • 2014年Googleが買収 • 様々な革新的な人工知能技術を開発 • Deep

    Q Network • Alphaシリーズ • AlphGo:囲碁で人のトッププレーヤーに勝つ • AlphaZero:自らの対戦データだけで世界最強 • AlphaStar:コンピュータゲームでも人のトッププレーヤーに勝つ • MuZero:ルールを教えなくても強くなる。 • AlphaFold:タンパク質の構造予測 • AlphaTensor、 AlphaDev:効率的なアルゴリズムを発見 • 2023年4月Google Brain Teamと統合しGoogle DeepMindになった。 • 2024年ノーベル化学賞受賞
  19. Google Brain Team • Googleの人工知能研究部門 • 様々な革新的な技術を開発 • 機械学習のプラットフォームTensorflowを開発 •

    言語モデル(Transformer、 BERT) • 画像識別モデル(EfficientNet、 Vision Transformer) • AutoML • TPU (https://gigazine.net/news/20180112-google-brain-work-2017/) • 2023年4月Deep Mindと統合しGoogle Deep Mindとなった。
  20. NVIDIA • GPU設計およびGPU向け開発ソフトの開発 • GPUとはコンピュータの画像処理に特化した演算装置 • ジェンスン・フアンが1993年に設立 • 開発環境CUDAの提供 •

    GPUを汎用計算に使う(GPGPU)ソフトを開発する環境 • GPUが科学技術計算で使えるようになったためワークステーションやスーパーコ ンピュータに普及した。 • GPUはニューラルネットワークの計算も高速化出来るため、人工知能の必須部品と なる。 • GPUで量子計算も出来るようになる。 • 量子コンピューティングでも覇権を狙っている? • GPUを汎用計算に用いる技術を実用的なレベルで一般に提供できるのはNVIDIAの みである。 (https://nvidianews.nvidia.com/news/nvidia- announces-gtc-2020-keynote-with-ceo- jensen-huang-set-for-may-14)
  21. AI関連各企業の特徴 • Meta • 人工知能開発のプラットフォーム(Pytorch) • 大規模言語モデル(LLAMA) • オープンソースに積極的 •

    OpenAI • 大規模言語モデル(ChatGPT) • 技術公開に消極的 • Google • 人工知能開発のプラットフォーム(Tensorflow) • 深層強化学習(DQN、 Alpha*) • 研究成果の公開は比較的積極的 • NVIDIA • 人工知能用のプロセッサの独占 • 量子計算用のプロセッサも独占を目指す?(cuQuantum) Microsoft • OpenAI とパートナーシップ • Antholopicとパートナーシップ • Metaと提携 • クラウドコンピューティングに注力 • オープンソースに積極的 Amazon • クラウドコンピューティングに注力 「オープンソースは脅威」「勝者はMeta」「 OpenAIは重要ではない」などと記された GoogleのAI関連内部文書が流出 (https://gigazine.net/news/20230508-google- document-llm-arms-race/、2023年5月8日) Googleの負け惜しみと言う意見もあったが、 2024年の段階では正確に将来を見越していたと 考えられる。確かにMetaは技術発展への寄与と しては勝者かもしれないが、それがビジネスに 繋がっていると言えるかといえば怪しい。 2025年には、MetaのLLMは競争力を失い、 OpenAIとGoogleのクローズLLMと中国製のオ ープンLLMが存在感を示す。
  22. AI関連各企業の特徴 • Meta • 人工知能を活かすサービスがない。 • 人工知能を動かすためのインフラを活用するサービスがない。 • プロセッサを開発する。 •

    Google • 人工知能を活かすサービスがある。 • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • 自社のプロセッサ(TPU)を有している。 • Amazon • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • プロセッサはNVIDIAから購入する。 • プロセッサを開発する 。 • Microsoft • 人工知能を活かすサービスがある。 • 人工知能を動かすためのインフラをクラウド事業に活用できる。 • プロセッサを開発する 。
  23. AI関連企業の関係(2025年) Antholopic Amazon NVIDIA Google Apple TSMC Meta Microsoft OpenAI

    GPU販売 GPU生産 GPU販売 Geminiを提供 パートナーシップ 協力? GPU販売 TPU生産 パートナーシップ パートナーシップ パートナーシップ