Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ECCV2024現地参加報告

hinako0123
December 23, 2024
51

 ECCV2024現地参加報告

hinako0123

December 23, 2024
Tweet

Transcript

  1. ECCVとは? 7  European Conference on Computer Vision - AI/CV分野における世界最大規模の国際学会

    - Google scholarでは3位 (20位くらいまでの学会は評価されやすい) - 提出:14 page (+参考文献) - 〆切:2024/3/7 - 採択:27.9% (2387/8585本) うちOralは200本(2.3%)
  2. 流行・トレンド 10  研究分野の動向 - 3D computer vision:NeRF/3DGS等 - Generative

    models:Diffusion系 - Workshopも含めMambaやSAMも人気な印象 投稿数は他分野の2倍超!
  3. 余談 11  LLMによる査読/Desk reject - 規約上査読者はLLM使用禁止→64件のLLMによる査読が報告 - Meta reviewをLLMで作成したACも

    - 検出ツールもあるが査読のために論文をLLMに入力してしまった例と 査読をブラッシュアップするためLLMに入力した例の判別が困難 - 二重投稿/剽窃によるDesk rejectが20件
  4. Best paper 12  Minimalist Vision with Freeform Pixels (Oral)

    - 従来のカメラは不要情報も取得→必要情報を効率的に取得する手法を提案 - タスクを解くために必要な最小限の数の任意形状Freeform Pixelを使用 - シーンの詳細を取得できないためプライバシー保護の観点でも優れる - 側面のソーラーパネルで自律動作
  5. Best paper 13  Minimalist Vision with Freeform Pixels (Oral)

    - 光学マスクとフォトダイオードで構成→レンズレスなカメラ - NNを用いて光学マスクの形状をタスクに応じて最適化 - タスク解決に焦点を置いておりシーンの視覚的再構成は行わない
  6. 気になった論文 14  Tackling Structural Hallucination in ImageTranslation with Local

    Diffusion(Oral) - 凍結DDPMによるOODハルシネーションに対処する研究 - OODとINDを分割し別のDDPMに入力 - 適切にFusionし自然な生成画像を実現 - 下流タスクの精度も従来法から向上
  7. 気になった論文 15  Unsupervised Multi-modal Medical Image Registration via Invertible

    Translation(Poster) - 教師なしの医用画像位置合わせ - INNにより変換→逆変換を行い再構成損失で学習/教師なしでも質向上 - 位置ずれを予測しfake_y(Φ)をyに近づける - 位置はx/モダリティはyの画像を教師なしでより高精度に生成可能
  8. まとめ 16  感想など - 著名な企業/著者の方と直接話せる貴重な機会 - Oralの発表者の方が自分のポスターを見に来てくれたり意見をくれたり - 国内の学会ではなかった視点の質問がもらえたりする

    - ポスター発表はアイデアを大量にインプットでき有益 - Workshopは〆切時期的に本会議よりも新しい手法がある場合もあり 聞いていて面白かった(Mambaの枝刈り等)