Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

深層学習技術のサーベイとNASの今後の展望について(2023/4)

 深層学習技術のサーベイとNASの今後の展望について(2023/4)

チーム内で使用した発表資料を公開します。
深層学習技術に関する情報のキャッチアップ方法や自分の研究分野のNeural Architecture Search(NAS)の立ち位置について再考しています。
参考文献ArXiv多めです(時間あれば正式な論文の方に変えときます)

Avatar for Kazuki Hemmi

Kazuki Hemmi

April 27, 2023
Tweet

Other Decks in Research

Transcript

  1. 研究テーマ Neural Architecture Search(NAS) 研究内容は次々回のチームMTGで話すので 今回は自分自身の研究分野の見つめ直し 筑波大学 博士後期課程1年 逸見一喜 自己紹介 Hemmi Kazuki

    University of Tsukuba National Institute of Advanced Industrial Science and Technology (AIST) Reasoning Speed Conciseness 特技:GPT4(2023/4/27)より返信が速いこと
  2. 国際会議で出ている関連分野の論文のサーベイ 01 トップ国際会議 機械学習系では ICLR(253), NeurIPS(245), ICML(204) 人工知能系では AAAI(157), IJCAI(105)

    画像系では CVPR(356), ECCV(197), ICCV(184) 02 関連しそうなキーワードを調べて出てきた物を読む Semantic Scholarで被引用,関連論文を更に読む 論文だけ読んでても疲れるのでスライドが有ると嬉しい 最新のAI動向調査方法
  3. 2022年 4・5月 DALL・E 2 Imagen Gato PaLM MaxViT 6・7月 GitHub

    Copilot Minerva YOLOv7 Midjourney 8・9月 Stable Diffusion Real-ESRGAN Make-A-Video Whisper 10・11月 AudioLM Cicero Galactica MC-DARTS MC-PC-DARTS ChatGPT 12月・1月 Point・E Perplexity AI ConvNext V2 Make-A-Video 3D GraphGPT DetectGPT 2月~ ControlNet GPT-4 VisualChatGPT NotionAI LLaMA Bard AutoGPT 1年間(2022年度)のAIの大きなトピックを時系列的に紹介 近年の流行 2023年
  4. MaxViT:CNN+Vision Transformer(ViT)モデル / ECCV'22 PaLM:LLM(大規模言語モデル,5400億パラメータ) / Google Gato :マルチモーダルAI /

    DeepMind Imagen:画像生成モデル / Google DALL・E 2:画像生成モデル / OpenAI 2022年4・5月:画像生成AIの登場 近年の流行
  5. ChatGPT:RLHFとGPT-3.5を用いたLLM / OpenAI MC-PC-DARTS:PC-DARTSを拡張した革新的なNAS手法 MC-DARTS:モデルサイズ制約付き勾配法NAS / NeurIPS WS'22 Galactica:科学記事自動生成モデル ,

    2日で公開中止 / Meta Cicero:対話エンジンと計画エンジンを持つモデル / Meta AudioLM:LLMを用いた音声生成モデル / Google 2022年10・11月:ChatGPTの衝撃 近年の流行
  6. ChatGPT:RLHFとGPT-3.5を用いたLLM / OpenAI RLHF(=Reinforcement Learning from Human Feedback) Helpfulness(有益性):ユーザーのタスク を解決してくれるか

    Harmlessness(無害性):人や環境を物理 的・精神的に傷つけていないか Truthfullness(真実性):デマやミスリード の情報ではないか 人間の好みに合った文を出力するように 微調整したInstructGPTをベースとしたモデル 近年の流行
  7. DetectGPT:ChatGPT生成文章検出ツール GraphGPT :GPT-3を用いたText to 知識グラフ生成ツール Make-A-Video 3D:Text to 動く3D生成モデル /

    Meta ConvNext V2:画像系のConvNeXtの改良モデル(MAEを参考) Perplexity AI:LLMを用いた対話型検索エンジン Point・E:Text to 3D点群生成モデル(間に画像生成) / OpenAI 2022年12月・1月:ChatGPT APIを用いたツールの大量登場 近年の流行
  8. AutoGPT:GPT-4を用いた完全自立型AIエージェント Bard:LaMDAをベースとした最新のLLM / Google LLaMA :新しい位置埋め込みを用いた小型のLLM / Meta NotionAI:Notionで文章自動生成や要約が可能に(一般公開) VisualChatGPT:入出力が画像+テキストのGPT

    / Microsoft GPT-4:推定パラメータ1~10兆の最新LLM / OpenAI ControlNet:ポーズを自由自在に調整可能な画像生成モデル 2023年2月:大規模モデル競争勃発、AI進化速度が10倍に 近年の流行
  9. Scaling Transformer to 1M tokens and beyond with RMT[ArXiv 2023/4/19]

    通常32000トークン - > 最大 20 0 万トークンまで入出力が可能に 近年の流行
  10. 今の流行:大規模データ、大規模モデル、大規模な計算時間 POINT 01 Transformerの発展 POINT 02 OpenAIが出したScaling Law POINT 03

    モデルは重要ではなく、今後はクラウドベース? Neural Architecture Searchの立ち位置