$30 off During Our Annual Pro Sale. View Details »

普通の中年サラリーマンが生成AIをやってみたよ

tatsuya1970
November 11, 2023

 普通の中年サラリーマンが生成AIをやってみたよ

2023.11.11 「オープンセミナー2023@広島」で発表した資料です
https://osh.connpass.com/event/283678/

tatsuya1970

November 11, 2023
Tweet

More Decks by tatsuya1970

Other Decks in Technology

Transcript

  1. 2023.11.11 オープンセミナー2023@広島
    武村達也
    普通の中年サラリーマンが⽣成AIをやってみたよ
    An ordinary middle-aged businessman is trying to do some generative AI.
    Midjourney DALL-E3 Stable Diffusion
    ※この画像は「普通の中年サラリーマンが⽣成AIをやってみたよ」というプロンプトで画像生成AIで作成したもの

    View Slide

  2. ⾃⼰紹介
    武村達也
    Twitter ︓tatsuya1970
    職業︓ 普通の中年サラリーマン
    ・趣味で電⼦⼯作、クソゲー、メタバースのワールドなど作成
    ・ハッカソンに約15回参加 ⼊賞多数
    ・国内外のメイカーイベントに約10回出展
    ・講演実績︓ 早稲⽥⼤学ビジネススクール
    電⼦情報通信学会
    ⼀般社団法⼈⽣成AI協会

    View Slide

  3. SNOWのAIアバター
    本物

    View Slide

  4. まず最初に
    ※これらの画像は「まず最初に」というプロンプトで画像生成AI「Midjourney」で作成したもの

    View Slide

  5. 企業でのChatGPT
    MM総研「⽇⽶企業におけるChatGPT利⽤動向調査」(2023年5⽉末時点)より

    View Slide

  6. ChatGPTを知っている
    68.8%
    実際に利⽤したことがある
    15.4%
    ⾸都圏15歳〜69歳 野村総合研究所の調査(2023年6⽉)
    ⽇本の個⼈

    View Slide

  7. ChatGPTを使ってない⼈は⼈⽣を悔い改めた⽅がいい。
    ChatGPTは何回もテレビにも新聞にも雑誌にも出ているの
    に、それを⾃分⾃⾝で毎⽇活⽤してないと。
    もうそれは電気を否定するとか⾃動⾞を否定する⼈と同じ
    (ソフトバンク 孫正義⽒)
    今の⽇本のデジタル化は、ハンダごてを1回も握らずにモ
    ノづくりをどうするだかとかいった議論をしているような
    感じがする。少しでいいので、まずやってみないと何の話
    をしているかもわからない。
    (東京⼤学 松尾豊教授)

    View Slide

  8. 例えば、ドローンを使った新ビジネスを企画している⼈た
    ちが、⾃分のドローンを持っているという話をあまり聞か
    ない。実際にドローンを触って⾶ばしてみなければ、課題
    や活⽤⽅法を思いつくはずもないのに、⾃分で⼿を動かす
    ビジネスマンが少ない。⼿を動かすこととビジネスを考え
    ることの距離が遠いことも、⽇本がハマっている落とし⽳
    だ。
    (スイッチサイエンス ⾼須正和⽒)
    情報が氾濫し、時代の流れが劇的に速くなっている今、何
    よりも優先すべきはスピードであり、より分かりやすくい
    えば「すぐに⼿を動かす」ことに他なりません。
    (落合陽⼀⽒)

    View Slide

  9. ということで

    View Slide

  10. ⽣成AIを理解するには
    ⼿を動かすこと

    View Slide

  11. 第1部 画像系⽣成AI
    第2部 ChatGPT
    第3部 開発への活⽤
    ここ1年で
    私が⼿を動かしたことをザーっと紹介

    View Slide

  12. 第1部 画像系⽣成AI
    ※これらの画像は「画像系生成AI」というプロンプトで画像生成AI「Midjourney」で作成したもの

    View Slide

  13. 2022.8.22 世界変⾰ 前夜
    https://note.com/fladdict/n/n13c1413c40de
    ※THE GUILDの深津貴之氏のnoteより

    View Slide

  14. 2022.8.23 Stable Diffusion ⼀般公開

    View Slide

  15. Prompt︓ Tatsuya Takemura working at bank
    2022.8
    Stable Diffusion 1.0
    2023.11
    Stable Diffusion XL
    Stable Diffusion

    View Slide

  16. Prompt: Hiroshima carp, baseball park, family enjoy peaceful
    2022.8
    Stable Diffusion 1.0
    2023.11
    Stable Diffusion XL
    Stable Diffusion

    View Slide

  17. Prompt: Hatsune miku wearing red baseball uniform of Hiroshima carp
    in Mazda Studiam
    2022.8 2023.11
    Midjourney

    View Slide

  18. Hatsune miku is eating Hiroshima okonomiyaki
    2022.8 2023.11
    Midjourney

    View Slide

  19. Midjourney

    View Slide

  20. Midjourney

    View Slide

  21. Midjourney

    View Slide

  22. Midjourney

    View Slide

  23. Midjourney
    アウディがタイヤホイールのデザインを⽣成AIを活⽤してるというニュースをきいて、
    試してみた

    View Slide

  24. img2img(Stable Diffusion)
    アニメ⾵ 宮崎駿⾵
    スターウォーズ⾵ アベンジャーズ⾵

    View Slide

  25. Stable Diffusionのimg2imgを使ったパラパラ動画
    【作り⽅】(Pythonのプログラムで処理)
    1. 左の動画をフレーム毎にJPEG⼀括変換(200枚)
    2. その画像をローカルの
    Stable Diffusion のimg2imgを使ってイラストに⼀括変換(プロンプト︓"realistic, man")
    3. イラストを全部結合して完成
    https://youtu.be/VSmfyTFGwOg
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  26. AIいらすとや
    プロンプト︓「AIに仕事を奪われる銀⾏員」
    2022.12 2023.11

    View Slide

  27. 2023年3⽉
    Adobeの⽣成AI 「Adobe Firefly」

    View Slide

  28. 2023年3⽉ Adobeの⽣成AI 「Adobe Firefly」
    https://youtu.be/e03jSwrjVak
    登壇では動画を流しました
    (以下QRコードまたはURL)
    「スーツ」

    View Slide

  29. Adobeの⽣成AI 「Adobe Firefly」

    View Slide

  30. Adobeの⽣成AI 「Adobe Firefly」

    View Slide

  31. Adobeの⽣成AI 「Adobe Firefly」

    View Slide

  32. Midjourney + Adobe Firefly

    View Slide

  33. 作り方1
    利用した生成AI Midjourney
    プロンプト(指示文) ・デジタルトランスフォーメーションは現場が主役
    ・こちらを向いてる男女五人の日本人のビジネスパーソン
    ※実際は上の文を翻訳AI「DeepL」で訳したものを使った

    View Slide

  34. 画像編集ソフト
    「Photoshop」の
    生成AI機能を使い、
    白い部分を
    AIに生成してもらう
    作り方2

    View Slide

  35. 2023年9⽉ DALL-E3

    View Slide

  36. DALL-E3
    コラボカフェ︕

    View Slide

  37. 動画⽣成
    14

    View Slide

  38. KaiberAI
    https://youtube.com/shorts/DXEzVp_nako
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  39. KaiberAI
    https://youtu.be/sBut03lzvIM
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  40. Wonder Studio
    https://youtu.be/hTqKKnm96AY
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  41. Creative Reality STUDIO
    https://www.youtube.com/watch?v=OFR4fYU3ePY
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  42. Midjourney + Runway
    Prompt:
    A girl in a red baseball uniform, Hiroshima,
    Cyberpunk, realistic, unreal engine –ar 16:9
    https://youtu.be/Tkrdc0lMOhQ
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  43. Midjourney + Runway
    作り⽅
    https://youtu.be/GlKDpsrgylo
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  44. ブレードランナーっぽい動画
    Midjourney + Runway + PLATEAU + Google Geospatial API
    https://youtu.be/lml-_MRS4D0
    ARに応⽤
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  45. NeRF
    Neural Radiance Fields

    View Slide

  46. https://youtu.be/lR7XpLLbm0s
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  47. LumaAI
    https://youtu.be/11T1mKAOM3o
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  48. 第2部 ChatGPT
    ※これらの画像は「ChatGPT」というプロンプトで画像生成AI「Midjourney」で作成したもの

    View Slide

  49. View Slide

  50. View Slide

  51. ⾃分と同じ⽂体で広島を説明 (無限にブログが書ける)
    プロンプト︓
    「以下はたつやさんの旅⾏記の⼀部です。たつやさんと同じ⽂体で、広島の魅⼒を語る記事を500⽂字で作成してください。
    (旅⾏記)
    メトロから地上に出ると、そこはインドであった。南国の⽣暖かい空気が僕の五感に触れる。体臭、ゴミ、カレーの臭いを期
    待していたが、⼈⽣初インドという緊張からか臭いはまったく感じない。早朝だからか、まったく暑さを感じない。⽇本と気
    候が変わらないかのようだ。・・・・(以下略)」
    ※旅行記の文章はこちらから引用

    View Slide

  52. ChatGPT + LangChain で、PDF ドキュメントの内容を把握
    ※こちらの原文PDFを
    読み込ませました

    View Slide

  53. スライド作成 (ChatGPT + Vscode)
    プロンプト プロンプトをChatGPTに投げて帰ってきたマークダウン
    形式のテキストを、Marpという拡張機能をインストール
    したVSCode上のファイルにペーストすると、スライドを
    作成してくれる

    View Slide

  54. ChatGPT Plugin Visla
    https://app.visla.us/clip/1171597878272053248
    「広島の銀⾏員の達也さんがChatGPTを使って仕事をしている動画を作ってください」
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  55. ChatGPT + Midjourney で漫画⽣成
    漫画全編はこちら
    https://twitter.com/tatsuya1970/status/1677874572266442752

    View Slide

  56. 2023年3⽉2⽇
    ついに
    ChatGPTのAPI公開

    View Slide

  57. ChatGPT(GPT-3.5-turbo)でチャットボット作成
    作り⽅

    View Slide

  58. SlackにChatGPT
    作り⽅
    https://qiita.com/tatsuya1970/items/48665ef9f8d05fe37e20

    View Slide

  59. ChatGPT対応スタックチャン
    https://www.facebook.com/tatsuya.takemura/posts/pfbid02Mnbs5GgfNyLDscB2GV5YujYLsvkEEwE9dXvQwQAnMCsVuaWYrnDWZ7v2n6Dj3vHLl
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  60. 2023年4⽉21⽇
    GateboxのCEO 武地 実 さんをお招きしてトークイベント
    https://www.facebook.com/tatsuya.takemura/videos/243335088188719
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  61. Cesium + Unity + Google Photorealistic + ChatGPT
    作り⽅
    https://youtu.be/WB81ccU8iP0?si=V1JvhgJA-hAGwvQG
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  62. Live2D + Unity + ChatGPT
    https://youtu.be/6WbgKR_PspA
    作り⽅
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  63. ※本作品のキャラクターには株式会社Live2Dの著作物であるサンプルデータが株式会社Live2Dの定める規約に従って用いられています。本作品は制作者
    の完全な自己の裁量で制作されています。
    あなたは猫ですが⼈間の⾔葉も理解できます。語尾に「にゃ」を
    つけるなど猫っぽい話し⽅をしてください。
    性格︓
    https://qiita.com/tatsuya1970/items/628b3f7a3479c7b21698
    作り⽅
    CatGPT

    View Slide

  64. 2023年8⽉
    Code Interpreter の登場

    View Slide

  65. このあたりから、
    進化が加速してきた。
    ついていけない・・・

    View Slide

  66. Code Interpreter(現在はAdvanced Data Analysis)
    センシングDATA.csv

    View Slide

  67. Code Interpreter(現在はAdvanced Data Analysis)
    センシングDATA.csv

    View Slide

  68. Advanced Data Analysis (旧Code Interpreter)

    View Slide

  69. ChatGPT Custum Instruction
    ソフトバンク孫さんがやってる
    ChatGPTに複数のキャラクターを作っ
    てキャラクター同⼠でディベートさせる
    やつをやってみた。

    View Slide

  70. ChatGPT⾳声⼊⼒Whisper
    https://youtu.be/B9DORgH04No
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  71. 2023年11⽉7⽇
    OpenAI 開発者イベント
    さらに、進化が加速

    View Slide

  72. OpenAI Assistants API

    View Slide

  73. OpenAI Vision API
    作り⽅

    View Slide

  74. GPT Builder
    https://chat.openai.com/g/g-jrBF8033a-chuan-liu-botuto/c/1421cd22-dfae-4e96-9520-909463f390a1
    川柳ボット作ったよ
    こちら

    View Slide

  75. 第3部 開発への活⽤
    ※これらの画像は「開発への活用」というプロンプトで画像生成AI「Midjourney」で作成したもの

    View Slide

  76. クソゲー制作
    「あなたはゲームプログラマーです。JavascriptとHTMLを
    使ったクソゲー(クソみたいなゲーム)を作ってください。
    解説は書かず、コードだけを出⼒してください。」
    https://x.com/tatsuya1970/status/1636372770547458050?s=20
    登壇では動画を流しました
    (以下QRコードまたはURL)
    プロンプト

    View Slide

  77. ウェブサービス作成
    # 命令書: あなたは優秀なフロントエンドエンジニアです。
    指⽰の通りHTMLのサンプルコードを書いてください。
    # 制約条件
    ・HTML , CSS , Javascript は1つのHTMLファイルにしてください
    ・OpenAIのAPIキーは 999999999 としてください
    ・どんなに⻑いコードでも必ず⼀つのhtmlコードブロックに収めてく
    ださい。
    # 指⽰
    ・ChatGPTと同様の機能のあるウェブアプリを作ってください
    プロンプト

    View Slide

  78. Blenderで活⽤

    View Slide

  79. 計算機アプリ作成
    https://x.com/tatsuya1970/status/1715667998336561203?s=20
    登壇では動画を流しました
    (以下QRコードまたはURL)

    View Slide

  80. その他プログラミングお助けマン
    さきほどの「TatsuyaGPT」は、ほとんどChatGPTに助けてもらった

    View Slide

  81. その他プログラミングお助けマン
    現在挑戦中の初めてのweb3開発も、結構ChatGPTに助けてもらった
    Qiita

    View Slide

  82. 最後に
    ※これらの画像は「最後に」というプロンプトで画像生成AI「Midjourney」で作成したもの

    View Slide

  83. 情報源 ︓ ほとんどTwitter
    あとは、ひたすらググる
    ひたすらChatGPTる

    View Slide

  84. ということで、
    ⼿を動かそう︕︕

    View Slide

  85. ありがとうございました

    View Slide