Slide 1

Slide 1 text

2023/2/17 (Fri) 高知県工業技術センター . 【技術者養成講座】 最近トレンドのAI手法 ~AI・ディープラーニングの初歩から先端モデルまでを2時間で~ Nov. 22, 2022 ver 0.3 created. Dec. 09, 2022 ver 0.5 updated Feb. 12, 2023 ver 0.8 updated Feb. 14, 2023 ver 0.9 updated Feb. 16, 2023 ver 1.0 updated 株式会社DigiDockConsulting 常務取締役CTO 国際カンファレンス「ElixirConf JP」ファウンダー Elixirコミュニティ「fukuoka.ex」「ElixirImp」「LiveView JP」オーガナイザ AIスクール「AIジョブカレ」福岡校開校 北九州市立大学 「プログラミング論」教授級非常勤講師 北九州高等専門学校 特命教授 / コンピュータ研究部 指導員 piacere / 森 正和

Slide 2

Slide 2 text

目次 01 はじめに 03 04 05 02 06 07 自己紹介 & 自社紹介 AI・MLを取り巻く10年の変化 最近のAIで何が可能か? はじめての機械学習…先端の前に 先端AIの仕組みと開発の最前線 そんなに遠くない未来のAIの姿 08 質疑応答タイム

Slide 3

Slide 3 text

3 はじめに 01 3

Slide 4

Slide 4 text

はじめに ● 本講義は、近年の生活やビジネスの中で、欠かせない存在と なりつつあるAIの最近のトレンドを学び、それらAIが社会 の中でどういった形で使われているかを紹介し、どのような 仕組みで作られているかを学べるセッションです ● その多くは、ニュースやTV、SNS、ネット動画などで聴く ことも多く、今後、それら情報で触れるAIを身近なものと して理解できるようになれると思います (プログラミングや 数学の知識は不要なので、気楽に楽しんでください) ● なお本スライド中で「ML」と表記した 箇所は「機械学習 (Machine Learning)」 の略です (機械学習が何者かも解説します)

Slide 5

Slide 5 text

はじめに ● 講義の中で以下を行いますので、もし可能であれば、お手元 のスマホやPCで一緒に動かしたり、ご覧いただくと、より 楽しむことができると思います ○ スマホ上で実行できるAIのデモ/お試し ○ ネット上で利用できるAIのデモ/お試し ○ 私や仲間が執筆したコラムの閲覧 ○ 先端AIのプログラミング ※ElixirとLivebook環境が必要 ■ プログラミングについては勉強会もご案内します ● ハッシュタグ #高知AIセミナー でコメント下さい

Slide 6

Slide 6 text

6 自己紹介 & 自社紹介 02 6

Slide 7

Slide 7 text

my favotite technologies & implements Twitter / NeosVR / Discord @piacere_ex Github / YouTube / Qiita @piacerex 40年前からプログラマ (職業プログラマ歴は27年) 書けるプログラミング言語は158言語 小学4年生でゲームプログラミングを始め、現在も プロダクトとOSSを開発し、事業やコミュニティの 優位性へと転用する開発者/アーキテクト/経営者 大手企業をメイン顧客として、IT事業/UX・UI/ D2Cマーケティング/VR・AR・メタバース/ Web3/エッジコンピューティングにまつわる事業 コンサルティングと企画支援、プロダクトを提供 技術コミュニティも複数発足・主催しており、毎月 イベント開催とLT、ライブコーディングをこなす piacere / 森 正和 “piacere” is an Italian word, means “Joy” == == Real Online VR / AR

Slide 8

Slide 8 text

活動 ≒ 事業+コミュニティ+育成(エンジニア、学生) ● 北九州市立大学 教授級非常勤講師「プログラミング論」 ● 北九州高等専門学校 特命教授 コンピュータ研究部指導員 ● ラジオFM KITAQ「Technology Cruising Night」パーソナリティ ● 株式会社DigiDockConsulting 常務取締役CTO ● ほかIT企業2社経営、技術顧問3社担当 ● Elixirコミュニティ「fukuoka.ex」創始者 ● Elixir国際カンファレンス「ElixirConf JP」創始者 ● 「ElixirImp」「LiveView JP」ファウンダー ● AIスクール「AIジョブカレ」福岡校開校者 ● Elixirスクール「Elixir |> College」創始者 ● 高知県 工業技術センター AI・機械学習 研修講師 ● 上級AI開発コミュニティ「IAIFukuoka」発足人 ● 独立行政法人 中小企業基盤整備機構 コンサルタント

Slide 9

Slide 9 text

We are fukuoka.ex in Fukuoka/Kitakyu, Japan Over 1,400 engeneers joined it More than 5,000 visitors came to Elixir Communities events

Slide 10

Slide 10 text

並行/分散/データ処理言語「Elixir」で大手企業向け開発 2015年 2016年 2017年 2018年 2019年 2020年 2021年 国民の1/4が利用する 60,000tps大規模基盤で JVM300台FGC連発 ↓↓↓ Elixir10台で収容成功 LiveView導入 x 3案件 ・動画配信SaaS ・EC SaaS ・DM送付SaaS 大量行動データ 社内分析ツール を試験的に開発 Elixirを実験する助走期間 Elixirエッジサーバ開発 x 2案件 ・3D点群ゴミ取りサーバ ・IoTデータ収集サーバ 2022年 スマホアプリ案件用APIサーバ x 2案件 社内勉強会を開催 fukuoka.ex発足 kokura.ex発足 Elixir Digitalization Implementors発足 LiveView JP発足 Esuna (データ分析PF) x 3案件 Vue.js/React/Angularアプリ案件用サーバ x 3案件 介護者応対GoogleHome連携用APIサーバ ElixirImp Vue.js/React/Angularアプリ案件用サーバ x 2案件 工場内カメラIoT開発 DD.Acadmy ※Eixir教材提供も その他自社プロダクト Elixirプロダクション採用 Elixirプロダクション採用 高知AIセミナー2023 & ElixirImp#20より転載

Slide 11

Slide 11 text

世界的には高額報酬第3位の言語、Elixir (日本は違う…) ● ElixirはStackOverflow「TopPayment」で4年間、上位ランカー https://insights.stackoverflow.com/survey/2021#section-top-paying-technologies-top-paying-technologies

Slide 12

Slide 12 text

国内Elixirコミュニティは28箇所 (世界最多) もあります 1. Shinjuku.ex(Tokyo)- since 2013 2. tokyo.ex 3. Sapporo.beam(Hokkaido) 4. fukuoka.ex - since 2017 5. kokura.ex(Fukuoka) 6. hibikino.ex(Fukuoka) 7. Elijo【Elixir women’s club】 8. Elixir |> College 9. Kyushu International Elixir Federation 10. Elixiroshima 11. Kochi.ex 12. Kyoto.ex 13. Seiryu-elixir(Gifu) 14. akiba.ex(Tokyo) 15. daimon.ex(Tokyo) 16. OkazaKirin.beam(Aichi) 17. Pelemay Meetup(Fukuoka) 18. space.ex(Kyushu) 19. autoracex(Kyushu) 20. Wedmoku(Kyushu) 21. Erlang & Elixir Fest 22. japan.ex 23. ElixirConf JP 24. NervesJP 25. EDI 【Elixir Digitalization Implementors】 26. piyopiyo.ex 27. Neos.ex 28. LiveView JP JP

Slide 13

Slide 13 text

Advent Calendarでは、全カテゴリ2位、言語1位獲得! ● 計400コラムを1ヶ月で…「Advent Ranking 2022」で検索

Slide 14

Slide 14 text

Elixirで会員制Webアプリを20分で構築・改造するライブ 「ElixirConf Mori」で検索してください(YouTube検索でも) 海外登壇でライブコーディングしています (YouTubeも) https://www.youtube.com/watch?v=t5TT0-mI2O4

Slide 15

Slide 15 text

No content

Slide 16

Slide 16 text

100名以上が参加

Slide 17

Slide 17 text

DigiDockConsulting: 先端技術で世界を改変する企業 Elixir DX / Digitalization D2C SaaS a Box / IoT Digital Marketing Low Latency Huge Connections Micro Service Distributed System Concurrent System VR / AR Data Science Machine Learning Edge Computing Insourcing IT Material Creation Business Optimize Data Analysis HRD Space Data Utilize DX Diagnostic Tool Elixir-Prod. Support Elixir HRD Support

Slide 18

Slide 18 text

(エンジニア/PMの評価を負担無で)

Slide 19

Slide 19 text

AR測量レス (同左) 起工測量 光波 GIS (RTK測位) 丁張設置 AR丁張レス ICT丁張レス 起工測量 光波 従来施行 中小企業 約1週間以上 (5~20倍) ※丁張運搬の負荷や 資材不足、天候 不良等で長引く ICT施行 大手企業 1日以内 (数時間) AR施行 企業規模 問わずに 利用可能 2cm精度のCADを現場で見ながら測量・丁張不要の即日施行で20倍速+費用10倍低下 丁張重機施行 ICT重機施行 図面検証 図面検証レス 図面検証レス GNSS搭載重機 月レンタル100万 GNSS搭載重機と 同等以上の快適な 体験を月数万円で AR重機施行 内業CAD帰社 帰社レスCAD A B C 内業CAD 内業CAD修正 内業CAD帰社 内業CAD修正 Nonfi①:CADデータを現実上に位置情報で合成

Slide 20

Slide 20 text

Nonfi①:CADデータを現実上に位置情報で合成

Slide 21

Slide 21 text

VRに取り込んだ都市や山林の点群データ上に、VR内で 建物を建てて「VR建築」し、それをARで現実上に投影 する「AR建築」により、現実空間で歩き回りながら実在 の建物同様に見渡したり、建物内に入って内見できます AR建築により、建設業や土木業のプロトタイピングを VRとARで可能とし、まるでソフトウェア開発のように 建築や都市計画を気軽にシミュレーションできます 他にも、アバターやアーティストのフォトグラメトリを AR建築すれば、音楽アーティストやアニメ等の聖地巡礼 イベントや、地方創生などの領域にも応用が可能です NrealLightやApple Glass等のARグラスや、MojoVisionと Innovegaが開発しているARコンタクト、もしくはQuest ProのようなMRデバイスを使えば、現実と地続きでこの 世界に没入できます VR空間に建てた建物や都市、モニュメントを現実上に「AR建築」し、内見も可能 Nonfi②:VR空間を現実空間に投影する(現実改変)

Slide 22

Slide 22 text

DD.デジマパック:AI・MLがWeb最適化し、D2C実現 All in one デジタルマーケティングプラットフォーム DD.デジマパック Web/SNS行動解析 Web/SNS課題抽出 AIによる改善提案 改善施策実施 改善効果検証 ECサイト制作支援 掲載商品撮影支援 受注管理支援 商品保管、管理支援 商品配送支援 ①WebサイトとSNSのファン行動分析から改善施策をAIが自動で提案、効果検証も可 ②ファンとの交流起点となるEC構築と、受注/商品保管/配送の実業務まで全カバー 顧客データ分析・管理 営業活動支援 顧客アプローチ D2C/ファンコミュニティ ③D2Cを立上げ、ファンと共に成長していく世界標準の事業 DD.デジマパック D2Cアドバンストエディション

Slide 23

Slide 23 text

Bright:エンジニア/PMの評価を人事や上司は負担無で

Slide 24

Slide 24 text

24 AI・MLを取り巻く10年の変化 03 24

Slide 25

Slide 25 text

AIの歴史はコンピュータが生まれたのと同じ70年前から この2度目の冬にニューラル ネットワークとマイクロカーネルOS の研究・開発を並行していました それらが今の活動に繋がってます ここの内訳を解説します 2023年 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 26

Slide 26 text

2012~2017年:ディープラーニング誕生、過剰な期待 ● 2度に渡る「AIの冬」の間もAI研究を続けた「AIの父」、ジ ェフ・ヒントン博士 (75歳!) が所属するGoogle AI研究チ ーム (現在は「Google Brain」と呼ばれています) が、猫の 画像だけを見て、まるで人のように「これは猫だ」「これは 猫では無い」と識別できるデモをしたことで、ディープラー ニングは脚光を浴びました ○ 人が猫の概念を一切教えなかった点が革新的で、AIがデ ータ (ここでは大量のYouTube動画の猫) から勝手に学 習したことで、知識に関するプログラミングが不要とな った点が、当時のAI研究を覆す衝撃でした ● ここから、人のように物事を認識できるAIを生み出すこと ができると期待が募った訳ですが…それは過剰な期待でした 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 27

Slide 27 text

2018~2020年:失望期 (しかし水面下では革命前夜) ● 鮮烈なディープラーニングの誕生から6年経過した頃には、 当初AIに抱いた期待が叶わなかったり、入門しても仕事が あまり無い等のハードルにより、ブームに翳りが見えました ○ 本AIセミナー講義が始まったのも、この時期でしたw ● しかし水面下では、下記を代表とするモデルが生まれ、これ が現在の桁違いなAI発展に寄与しています ○ 自然言語モデルのブレイクスルー ■ Transformer、BERT (Attention) ○ 自然言語モデルから他タスクのモデルへの転用 ■ ViT (Vision Transformer)…画像解析 ○ AIがAIを生み出す (人は学習させたいデータ提供のみ) ■ AutoML、AutoML Zero 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 28

Slide 28 text

2021年~現在:人に近いAI出現+コロナでデジタル浸透 ● 前述したモデル群およびその進化系モデルが生み出す出力が 「人にとって違和感を感じないレベル」へと洗練され、実務 での利用や、テック企業での採用が一気に進み、一般層にも 急速にAIの有用性が浸透していきました ● このブレイクスルーには、以下2点の発見が大きく影響 ○ 膨大なデータからの学習 ≒「事前学習」 ○ 事前学習済みモデルの高速な再学習 ≒「転移学習」 ● また社会的背景として、コロナ到来により仕事観や生活観が 大きく変わったことで価値観が変容し、対面や口頭の交流が 絶対的なもので無くなったことで、デジタル活用が当たり前 となった点も、AI浸透に大きく影響したと考えます 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 29

Slide 29 text

70年に渡りAIに抱いた夢がとうとう叶い始めた10年間 2023年 ● 人と同等の知的処理を「強いAI」と呼び そのレベルに至らない知的処理を「弱い AI」と呼びますが、近年のAIは、膨大な データ量から学ぶことで、前者に近づき つつあります ● 自我を持つレベルは至っていないものの 人に近いかソレ以上の振る舞いの始まり 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 30

Slide 30 text

AI?ML?ディープラーニング?…これらの関係性 https://qiita.com/piacerex/items/0871b54b41128d426da5

Slide 31

Slide 31 text

「機械学習 (ML:Machine Learning)」とは? https://qiita.com/piacerex/items/0871b54b41128d426da5

Slide 32

Slide 32 text

MLはなぜ流行中? (通常のプログラミングと何が違う?)

Slide 33

Slide 33 text

機械学習はどういった場面で活躍する? こうした特性を、現実社会の中で応用した場合、どのようなAI が構築可能で、どんなことが可能となるのか (社会実装される のか) を、これから実例と共に見ていきましょう

Slide 34

Slide 34 text

34 最近のAIで何が可能か? 04 34

Slide 35

Slide 35 text

①消しゴムマジック…特定の画像を削除し、背景を補完 ● Google Pixel 6標準搭載の機能ですが、以下アプリでも可能です ● 両OS対応 Snapseed PhotoDirector YouCam Perfect ● iPhone専用 iOS 16標準 MagicEraser DG ● Webブラウザ上 Cleanup.picture

Slide 36

Slide 36 text

②チケットレス駐車場…ナンバープレートの数字を照合 ● 「ららぽーと福岡」は入出場や精算をナンバー文字認識で自動化 ● 入場時にナンバ ープレートをカ メラ撮影し、ナ ンバーの数字列 を読み取り、チ ケット無しで店 舗内での精算が できます ● 出場時も精算済 ナンバーで照合 できてゲートが 勝手に空きます

Slide 37

Slide 37 text

③リアルタイム翻訳…現実世界の文章を文字認識し、翻訳 ● 「Googleレンズ」はカメラで撮影した文章の翻訳もできます ● 英語などの文章 もGoogleレンズ を通すと、日本 語などの母国語 にリアルタイム で翻訳されます ● 日本の名所等に 海外の方を観光 案内するとき、 とても便利です

Slide 38

Slide 38 text

Googleレンズ翻訳をお手元のスマホで試してみましょう Google Playから Googleレンズを インストールして 試してみましょう

Slide 39

Slide 39 text

ここからは、けっこう SF的でサイバーパンクな AIのご紹介

Slide 40

Slide 40 text

④物体検知…リアルの車や人、標識をリアルタイム識別 ● Teslaの車は、車や人を識別し、危険時に自動ブレーキをかけます ● 道路上の標識も 識別し、クルー ズコントロール による速度制限 などもできます ● 完全自動運転が 確立すれば車は デジタルツイン 上の「デジタル オブジェクト」 に変わります

Slide 41

Slide 41 text

現実空間がデジタル空間で処理され、現実に反映される ● Teslaが現実の車をAIで処理する際、車の挙動や、他の車、 人などの「現実」が「データ化」され、デジタル空間で処理 ● このような、「現実」と「デジタル空間」で全く同じ情報を 持つことを「デジタルツイン」と呼びます 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 42

Slide 42 text

⑤お絵描きAI…現実に無い人や物体を文字や画像から生成 ● 複数の文字列や元画像から、膨大な知識を使って画像生成します ● 人では不可能な 速度で高いクオ リティの画像を 簡単に生み出す ことができます (後で実際に開発 してみます) ● なお実物の人間 写真から架空の アバターを生成 することも可能

Slide 43

Slide 43 text

⑥ChatGPT…人と同じかソレ以上の知識で対話できるAI ● テキストで質問すると、膨大な知識から適切な回答を行います ● 文脈も解釈して くれることで、 物知りを相手に 会話してる感覚 ● 企業(Google) の 採用試験で上級 を合格し、執筆 した論文が査読 で見抜けない… ● プログラミング もできてしまう

Slide 44

Slide 44 text

ChatGPTを試してみましょう 公式サイトで 試してみます ● お手元にPCがあれば、要ユーザ登録ですが、お試しいただけます (「ChatGPT」で検索してください) ○ リモートワークの良い点と悪い点を知りたい ○ 先端のAIについて教えて → 他には? ○ 最近、流行っているAIは? → 他には? ○ Pythonで3つの単語を繋げて3個の文章を作るコードを頂戴 → もっとスマートなコードにして → 別のバージョンは? → 上記コードを接続詞もリストから選択するようにして

Slide 45

Slide 45 text

45 はじめての機械学習…先端の前に 05

Slide 46

Slide 46 text

お題:画像データの「分類」 ● 「犬」と「猫」を、どこで分割しますか?(xy軸は特徴の強弱) 毛が白地に黒 耳が丸い 耳が尖っている 毛が茶色

Slide 47

Slide 47 text

分割する線をデータから自動学習するのが「機械学習」 ● 最初はランダムな線から始め、正解率が高まった線で終了させる 毛が白地に黒 耳が丸い 耳が尖っている 毛が茶色

Slide 48

Slide 48 text

分割する線をデータから自動学習するのが「機械学習」 ● 最初はランダムな線から始め、正解率が高まった線で終了させる 毛が白地に黒 耳が丸い 耳が尖っている 毛が茶色 1 0.103 0.211 0.415 0.461 0.307 0.448 0.278 0.583 0.797 0.563 0.837 0.690 0.932 0.971 y = 1.2x - 1.1 0

Slide 49

Slide 49 text

2種類の分類だけで無く、複数の種類への分類もあります ● 1種類ずつをクラスと呼び、これが多数で「多クラス分類」と呼ぶ 角ばっている 直線で構成 直線で構成できない 0 8 1 2 9 7 3 6 5 4 丸い ※実際はもっと 複雑な特徴で 表される

Slide 50

Slide 50 text

たまにハズレも出します…予測は学習した通りにならない ● 全14匹中、1匹のハズレは、正解率92.8%という評価になります 毛が白地に黒 耳が丸い 耳が尖っている 毛が茶色 1 0.103 0.211 0.415 0.461 0.307 0.278 0.583 0.797 0.563 0.837 0.690 0.932 0.971 0.503 0.5 0

Slide 51

Slide 51 text

現実で未知データを予測できるようになるまでの流れ ⅰ)モデルの学習(学習データとラベルの関係性を学習) ⅱ)検証データによる評価(予測とラベルの一致率を確認) ⅲ)未知データに対する予測(期待する正解が出れば成功) 学習データ AI・MLモデル 検証データ 予測 未知データ 予測 関係性を学習 学習済み モデル ラベル ラベル ラベル 一致率で評価 ※悪い場合は 学習をやり直し 一致していれば 良いAI・ML ※悪化した場合は 再度、学習し直し 犬(=0) 犬(=0) 犬(=0) 猫(=1) 犬(=0) 「猫だ」 ⅰ) ⅱ) ⅲ)

Slide 52

Slide 52 text

ディープラーニングの「Hello World」…手書き文字識別 ● 直線で分類できた「犬」「猫」よりも複雑な分類はDLのなせる技 角ばっている 直線で構成 直線で構成できない 丸い ※実際はもっと 複雑な特徴で 表される 0 8 1 2 9 7 3 6 5 4

Slide 53

Slide 53 text

今回の手書き文字識別で行うことの流れ ⅰ)60,000文字分データをDLし、学習データと検証データに分割 ⅱ)モデルの学習(学習データとラベルの関係性を学習) ⅲ)検証データによる評価(予測とラベルの一致率を確認) ⅳ)未知データに対する予測(期待する正解が出れば成功) 学習データ (48,000文字) AI・MLモデル 検証データ (12,000文字) 予測 未知データ 予測 関係性を学習 学習済み モデル ラベル (48,000文字) ラベル (12,000文字) ⅱ) ⅲ) ⅳ) ラベル 6 2 「4だ」 ⅰ) MNIST データセット (60,000文字のデ ータ+ラベル)

Slide 54

Slide 54 text

今回の手書き文字識別で行うことの流れ ⅰ)60,000文字分データをDLし、学習データと検証データに分割 ⅱ)モデルの学習(学習データとラベルの関係性を学習) ⅲ)検証データによる評価(予測とラベルの一致率を確認) ⅳ)未知データに対する予測(期待する正解が出れば成功) 学習データ (48,000文字) AI・MLモデル 検証データ (12,000文字) 予測 未知データ 予測 関係性を学習 学習済み モデル ラベル (48,000文字) ラベル (12,000文字) ⅱ) ⅲ) ⅳ) ラベル 6 2 「4だ」 ⅰ) MNIST データセット (60,000文字のデ ータ+ラベル) ココは割愛 ココは割愛

Slide 55

Slide 55 text

ブラウザだけで手書き文字識別AIを作ってみます ● 「手書き文字 Livebook」で検索すると作り方が書いてあります https://qiita.com/piacerex/items/6a9a5cc5d0e9dd9398ff

Slide 56

Slide 56 text

ブラウザだけで手書き文字識別AIを作ってみます コラムに沿って 手書き文字認識を Livebookで 動かしてみます

Slide 57

Slide 57 text

②チケットレス駐車場/③リアルタイム翻訳が構築可能 ● 印刷もしくは手書きの文字を識別できるAIがあれば、先ほど紹介 した「②チケットレス駐車場」と「③リアルタイム翻訳」の前半 部分である文字識別が可能となります ● 残りはそれぞれ、下記のような構築をすれば完成です ○ ②チケットレス駐車場 ■ 清算時のナンバー入力とナンバー文字列の照合 ■ 入場時の自動カメラ撮影/ナンバー識別 ■ 出場時の自動ナンバー照合 ○ ③リアルタイム翻訳 ■ 文字へのバウンディングボックス※追加 ※以降は「BB」と省略 ■ 文章の翻訳、翻訳後の文字列への置換 ● 翻訳にはBERT等の別モデルも必要

Slide 58

Slide 58 text

58 先端AIの仕組みと開発の最前線 06

Slide 59

Slide 59 text

①消しゴムマジック…Inpainting (Segmentaion+GAN) ● 削除したい対象を下記いずれかで特定した上で、そこに背景画像 を生成することで実現します ○ Segmentaion ○ 物体検知 (詳細は後述) ● 「Segmentaion」は、画像の特徴 から、同じ領域と見なす面を特定 ○ U-Net、FCN、SegNetなど ● 背景画像はどう生成しているか? ○ 削除した周辺の画像の特徴から 学習し、偽物の背景画像を生成し、 本物と識別できるまで繰り返す ■ GAN…ノイズから偽物を生成

Slide 60

Slide 60 text

③リアルタイム翻訳…Transformer/BERT ● どのようなタスクにでも応用できるAttentionを搭載したモデル ○ 自然言語解析以外のタスクにも応用できる ■ 画像解析・生成など…ViT (Vision Transformer) ■ 対話応答など…T5 (Text-to-Text Transfer Transformer) ● 「Attention」とは? ○ 「どこにどの情報があるからこうなるよね…」という「ある 情報から注目すべき情報」を判断して、処理ができる ■ あの単語とこの単語があるから、こういう文章だろう ■ 画像のココがこうだから、この画像は恐らくコレだろう ■ 将棋の駒がこの配置だから、次の手はこれかな などなど ○ 情報と情報が隣接していなくても処理できる (距離に無関係) ○ 並列計算に強い (RNN等のTransformer以前の時系列の弱点) 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 61

Slide 61 text

④物体検知…YOLO ● YOLO (You Only Look Once:一度見るだけで良い) という名前 が示すように、一度見ただけで物体を識別できることを目指した ①画像をn x n個の正方形に分割 ②上記①をm個のBBに分割し、信頼度(物体である確率) を算定 ③上記①の各々を多クラス分類 ④上記②の信頼度が高いBBのみ残して、上記③のクラスを付ける ● 上記②の切り方が不運だったり 上記③が部分画像で分類する 都合上、上手く分類できない などで精度が低下する要因は YOLOのバージョンが上がると 改善されます (速度向上も)

Slide 62

Slide 62 text

⑤ChatGPT…GPT-3 ● GPT (Generative Pre-trained Transformer) の三世代目 ○ 前述したTransformerを改良 (decoder、層入替、Attention) ○ 「Pre-trained」 ≒ 「事前学習」で「次の単語予測」を学習 することで文法や文脈、意味解釈ができるようになっている ○ 下記データ量で学習 (かつて無い規模の学習が実行されてる) ■ GPT …7,000冊の書籍 (文章)+10億個の単語 ■ GPT-2…40GByte:800万件Reddit (3いいね付で質担保) ■ GPT-3…600GByte:Wikipediaほか4種類の巨大データ ○ 事前学習済みモデルをベースに、「転移学習」で予測したい 対象の少量データを再学習することで高精度モデルを構築 ■ なお、「事前学習」では100周学習しなければならないが 「転移学習」ではたった3周で学習が完了する ● ChatGPTは、チャット利用者の履歴で、更なる改善を図っている 高知県工業技術センター【技術者養成講座】AIの基本から最近トレンドAI手法まで より

Slide 63

Slide 63 text

⑥お絵描きAI…Stable Diffusion、Midjourneyなど ● 以下2パートがで画像生成されます ①ノイズ画像からノイズを除去していくことでの画像生成 ②指定されたテキストに該当する画像の特徴を付与 ● なぜノイズ画像からのノイズ除去で鮮明な 画像を生成することができる? ○ 鮮明な画像に徐々にノイズを乗せる過程 を学習しており、その逆の変換が可能と なっているから ● なぜテキストを入れるたびに異なる画像が 生成される? ○ 画像生成の元となるノイズ画像が異なる から (ノイズ画像が同じなら同じ画像を 生成できる) ● テキストからの画像生成はViTが使われます

Slide 64

Slide 64 text

開発の最前線①:マウスだけで「⑤お絵描きAI」を作る お絵描きAIを Livebookで 作ってみます

Slide 65

Slide 65 text

開発の最前線②:学習済みモデルをロード or 転移学習 ● 現在、多くのタスクが一般化され、それに応じた学習済みモデル が利用可能となったため、それらをそのまま使うか、予測したい 対象の少量データで「転移学習」させて使うことで済むケースが 多くなりました ○ ゼロからモデルを学習・構築させなくても良くなりました ■ GPT-3のところでも説明した通り、学習済みモデルを少量 データで再学習させるだけで、高精度モデルは構築可能 ○ 逆に、GPT-3クラスの事前学習は、もはや個人では手が出し づらいレベルのコンピューティングパワーが必要

Slide 66

Slide 66 text

開発の最前線③:開発AI・MLをWebやシステムに組み込む ● ご興味ある方はLiveView JPの毎月開催イベントにお越しください

Slide 67

Slide 67 text

67 そんなに遠くない未来のAIの姿 07

Slide 68

Slide 68 text

お絵描きAIアバター同士でChatGPTにフォローされて会話 ● 今の技術が性能向上すると、リアルの人同士の会話が改善される ● リアルタイムに アバターを生成 することで親密 性が向上 (後述) ● リアルタイムで 翻訳され、言語 が壁で無くなる ● 会話内容も曖昧 な内容から自動 的に詳細化して くれるように

Slide 69

Slide 69 text

● FacebookのWorkroomsは、現実よりフレンドリーな空間 コロナ以降、現実は本格的に「オマケ」「サブ」に ● この4人は全員 がアバターだが 和気あいあい ● 一方、Zoomや Teamsは実物 の顔が見えるが 距離感は縮まら ないのでコミュ ニケーションに 実物の顔は不要 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 70

Slide 70 text

● バーチャル(AR、VR)と融合された現実+AI・MLの世界 コロナ以降、現実は本格的に「オマケ」「サブ」に ● 現実の作業場所 とバーチャル上 の会議ルームを 切り替え可能 ● もはや、現実と デジタルの区別 に意味は無い ● 情報主体の体験 に限らず現実の 視覚/接触体験 もやがて移行 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 71

Slide 71 text

人の意思決定や組織もデータに過ぎない:DAO+AI・ML ● 経営者やリーダーといった人すらシステムで置き換えできる ○ DAO (自律分散組織) は投票での意思決定/資金調達/ 分配が、ネット上に配置されたルール (≒スマートコント ラクト) によって実現できる仕組み ○ AI・MLは、ルールを規定せずとも利用者の行動データ からの学習により意思決定を行えるので、DAOとの組み 合わせにより、資金調達/分配 (と業務) を自動化できる 経営者や リーダー が必要 株式会社 経営者や リーダー は不要 DAO システム/ロボット で運用される企業 AI・MLで意思決定 /運用される企業 働く人が必要 働く人は不要 ● 人類はすでに上記の テクノロジーを手に 入れており、企画と 技術、UXがあれば、 働く人が不要になる 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 72

Slide 72 text

DD.デジマパック:AI・MLがWeb最適化し、D2C実現 All in one デジタルマーケティングプラットフォーム DD.デジマパック Web/SNS行動解析 Web/SNS課題抽出 AIによる改善提案 改善施策実施 改善効果検証 ECサイト制作支援 掲載商品撮影支援 受注管理支援 商品保管、管理支援 商品配送支援 ①WebサイトとSNSのファン行動分析から改善施策をAIが自動で提案、効果検証も可 ②ファンとの交流起点となるEC構築と、受注/商品保管/配送の実業務まで全カバー 顧客データ分析・管理 営業活動支援 顧客アプローチ D2C/ファンコミュニティ ③D2Cを立上げ、ファンと共に成長していく世界標準の事業 DD.デジマパック D2Cアドバンストエディション

Slide 73

Slide 73 text

Bright:エンジニア/PMの評価を人事や上司は負担無で

Slide 74

Slide 74 text

2021年度AIセミナー「意思決定のためのAI・機械学習 講座」より引用

Slide 75

Slide 75 text

2021年度AIセミナー「意思決定のためのAI・機械学習 講座」より引用

Slide 76

Slide 76 text

②世界は、現実世界の方が「オマケ」「サブ」になる ● 「デジタルオブジェクトが物理現実の基本的な素材になる」 とは? ○ デジタルツインで現実がデータ化されると、「データ」 がもはや「現実」と同じである…と扱われる ○ このとき現実とは「情報源」の1つでしか無い ○ 現実を表現するには、「データ」による「デジタルオブ ジェクト」で充分で、それは現実よりも扱いやすくなる ● ここから更に一歩先に進むと、 「デジタル側の変更により現実 が改変される」というデジタル がメインとなる世界が構築され ていく 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 77

Slide 77 text

● IoTやMIDI楽器、3Dプリンタなどをメタバースに接続し、 リアルタイムに操作/現実反映することは、ご家庭レベルで すでに可能で、現代の技術は、そのレベルまで来ている メタバースから現実世界の改変も可能…SFは現実に ● こうした技術に より、情報主体 の体験に限らず 現実の視覚体験 や接触体験も、 デジタル中心に 移行が可能 ● 仕事だけで無く 生活も現実から 引き剥がされる 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 78

Slide 78 text

メタバースに没入するハードも手が出しやすい範囲に ・2年前にリリースされ、未だ 先端を走り続けるモデル ・軽量で、外利用も可能な造形 ・ARモードでも3Dモデル密閉 すればVR体験でき、Quest Proと同じ体験も可能 ・冒頭の測量レスARはこれを 使って実装しています NrealLight:69,799円 Nreal Air:46,980円 ・先月出たばかりの最新機 ・VRモードとARモードを 瞬時に切り替えれる ・先ほどのVRとARを切り 替えるデモはコレ ・2年前にリリースのHMD ・家電量販店でも販売され 最近はTV CMもされる 最も個人普及している VR入門者向けモデル Quest Pro:226,800円 Meta Quest 2:46,000円 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 79

Slide 79 text

AIやメタバース、Web3等 ITの影響が大きくなった現在 「現実」が唯一の世界だった頃 のルールと社会が 終わりを告げようとしている…

Slide 80

Slide 80 text

③変形/技術を踏まえて企画を練れる人の存在が重要 1. イノベーター ・Web3は国内先行が可 ・健康な高齢者向け産業 ・ITが無いから試せる 2. リードメンター ・メタバース世界トップ ・高齢者介護世界トップ ・エンジニア数世界4位 3. サステイナー ・市民が市民を支える ・若者に教えられる年配 ・SDGs 高齢化の先行性 人口減少の先行性 他都市より先回り ◎高齢者特化の行動 センサ+ARグラス 観光 ◎徘徊高齢者向けの 屋内外GIS捕捉 ◎VR内業+AR現場 製造/土木/建設等 ◎屋内AR施設案内 ◎NFT特区の成立 (福岡市も制定中) ◎DAOの法人化 (ワイオミング州が先行) ◎遠隔VR移住体験 ◎居宅ケアワーカー のギグワーク化 ◎VR/ARによるケア ワーカー遠隔訓練 ◎IT企業とフリーラ ンスのためのVR オフィス誘致 ◎世界進出可能企業 のDX積極支援 ◎メタバース x アニメ ◎測量レスAR土木 ◎高齢有識者による 教育YouTuber輩出 ◎音声AI介護による 高齢者雇用に特化 した企業運営の確立 ◎市民向けサービス を市民自身が行う (イギリスgov.ukが先行) ◎ビル管理システム (BIM) のVR/AR化 (現在、国内大手と協業) ◎SDG9 = Socirty 5.0を都市で実証 (都市センサNW+API化) ◎市主催の年金破綻 世代向けESG投資 ワークショップ 北九州市魏会向け「DX講義スライド」より引用

Slide 81

Slide 81 text

現実世界のみ(現実はデータ化されていない) 現実にデジタル/バーチャルが融合した世界(現実はデータ化されてる) ≒アフターデジタル DXは「現実世界の延長上」に無い、非連続な進化 現在 未来 デジタイゼーション ≒ タダのIT化 DX(デジタルトランスフォーメーション) デジタライゼーション 過去 スタート地点が 現在の延長上に無い (着想が異なる) 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 82

Slide 82 text

DXで未来を担う準備④:DXで課題解決にトライしてみる! ● Web3文化の「アイデアもソースコードもオープン」を踏襲 ● 「polipoli 北九州」で検索してください 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 83

Slide 83 text

DXで未来を担う準備②:SF的でサイバーパンクに慣れる ● 「Elixir Chip」で検索してください & 他コラムにも飛んで 総務省主催「自分ごとにするDX」「本当のDXはSF的で未来志向、そしてサイバーパンク」より引用

Slide 84

Slide 84 text

勉強会 (毎月開催中) やコミュニティで続きを学べます connpassと Discordのご紹介

Slide 85

Slide 85 text

That’s all for my talk Thank you very much