$30 off During Our Annual Pro Sale. View Details »

atmaCup#8 Opening

atmaCup#8 Opening

Yamaguchi Takahiro

December 04, 2020
Tweet

More Decks by Yamaguchi Takahiro

Other Decks in Technology

Transcript

  1. 1
    atmaCup
    onsite data competition

    View Slide

  2. このスライドは後で共有いたします。
    はじめに

    View Slide

  3. 情報公開について
    ハッシュタグは #atmaCup です!
    twitter / instagram 等で発信していただけると嬉しいです

    View Slide

  4. 情報公開ポリシー
    OKなこと: なんでもOKです。
    **自分が取り組んでいることに関して、開催中に公開することはアイディアの共有
    になる可能性がありますので禁止とします。

    View Slide

  5. Hello!!
    atma(アートマ)株式会社 取締役
    山口貴大 @nyker_goto (twitter)
    担当領域: データ分析・フロントエンド・バックエンド・
    インフラ
    京都大学大学院 最適化数理卒 SGDが好き
    Kaggle Master kaggle.com/nyk510
    5

    View Slide

  6. 目次 1. atmaについて
    2. 課題発表
    3. 賞金
    4. ルール
    5. スケジュール

    View Slide

  7. atmaについて

    View Slide

  8. atmaが成し遂げたいこと
    テクノロジーの価値はそれ自体にあるのではなく、価値がある営みに滑らかに
    接続されて初めて真価を発揮します。
    私達はテクノロジーが日常・事業に滑らかに接続し、人々がより豊かに過ごす
    未来を作る企業です。お客様の事業にテクノロジーを滑らかに接続されるよう
    アルゴリズムを提供、支援しています。
    https://www.atma.co.jp/
    物理と情報を滑らかに接続し、
    人の営みを豊かにする。

    View Slide

  9. atma株式会社・メンバー構成
    代表取締役・上浦 伸也 取締役・山口 貴大
    京都大学大学院にて最適化数学を専攻
    在学中に学生ベンチャーを立ち上げて取締役とし
    てジョイン。大学卒業と同時に売却しatma株式会
    社を設立
    京都大学大学院にて最適化数学を専攻
    インターンにて不動産の価格推定エンジンを作成し
    たことがきっかけでデータサイエンティストとして
    atmaへ入社
    Kaggle Master: https://www.kaggle.com/nyk510
    従業員 プロパー社員8名 全体30名 平均年齢28歳
    各メンバーが一人でサービスを立ち上げられるフルスタックエンジニア
    データコンペティションプラットフォーム kaggle のトップ1%のプレイヤーなども在籍
    アカデミックに強く論文ベースの最先端技術のキャッチアップ速度

    View Slide

  10. 事業概要
    ● アルゴリズムコンサルティング事業
    ー 具体的アプローチが決まっていない状態からサポート
    ー どういったことが出来るのかを議論しつつ実現したい内容を固めていく
    ● アルゴリズムモジュール事業
    ― 基幹システムにアルゴリズムをモジュールとして提供
    ― 予測・分類エンジン, 画像査定エンジン, 最適化エンジン, 自然言語処理エンジン
    ● システム開発事業
    ― 最新の技術を用いて使いやすいを形に
    ― PWAでのWeb開発, Webサービスのインフラ構築, クローラー実装

    View Slide

  11. 11
    atmaCup
    onsite data competition

    View Slide

  12. 主催: atma株式会社
    12
    atmaCup#5
    2020-05-29 ~ 06-06 (1 week)
    @Online
    参加者: 300人 (振返り会 205人)
    #submissions: 4602
    はじめてオンラインでの開催となり定員を大幅に増やしました
    が300人を上回る応募(316)があり、Expert以上が100名以
    上と数・レベルともに過去最高となりました。参加者同士での
    活発な議論が白熱し、分析結果に対する議論・討論が過去最
    高の盛り上がりとなりました
    (*)。
    初のオンライン開催!
    ぐるぐる: atmaCup#5 https://www.guruguru.ml/competitions/9
    atmaCupとしてはじめて、学術業界からデータ提供していた
    だいたコンペティションでした。今後も産学が連携できるような
    場としてatmaCupを提供できれば良いと考えています。
    初の学術的な課題設定
    *ディスカッション(データに関する議論をする掲示板)の投稿数・コメント数ともに過去最高

    View Slide

  13. 課題説明

    View Slide

  14. ゲームの売上予測
    ゲームの属性情報を使って世界全体での売上を予測する問題です。
    (諸事情で珈琲は没になりました…)
    ● ジャンル・メーカー・開発会社 etc
    評価指標: RMSLE / Root Mean Squared Logarithmic Error

    View Slide

  15. 賞金

    View Slide

  16. 豪華な商品 private leaderboard 上位 (通常LB + 敢闘賞
    LB) のチームに atma 謹製のメダルをお送りし
    ます。
    開催期間中ディスカッションで最も「いいね」
    をもらえたユーザーにも nyk510 賞をお送りし
    ます。
    (上記入賞については submit に使用したコードの提出、並びに submit の再現が
    取れると運営が判断した後お送りいたします。内容の再現が取れない等、場合に
    よっては表彰を取りやめる場合がございますこと、ご承知おきくださいませ。)

    View Slide

  17. ルール

    View Slide

  18. 予測値の提出と評価
    コンペに参加するとサブミッションタブから予
    測ファイルを提出することができます。提出は
    チームで合計50回行えます。
    提出が成功すると、ぐるぐるはテストデータの
    一部に対する公開スコア public score を計算し
    ユーザへ開示します。
    最終的な評価は公開スコアで使わなかった部分
    で計算されたスコア private score で行われま
    す。
    Public
    PrivateScore
    =???
    Test Data
    提出したタイミングで
    スコアが見れる部分
    Private
    最終評価で用いられる
    部分。コンペ終了後ま
    でスコアがいくつかわ
    からない。
    PublicScore
    =0.300

    View Slide

  19. 最終順位の決定方法
    PublicScoreによるランキングは提出したすべてのファイルのなかで最も
    良いものでランク付けされています。
    最終的な評価は 個別のチームが選択したファイル のスコアでランク付け
    されます。あなたが最も良いと思う submission を選択するようにしてく
    ださい(*)。
    今回は最大で 2 個選択できます。
    * 最終 submit が選ばれていない場合には public score が良いものを選択したとみなして、
    スコア計算が実行されます。

    View Slide

  20. チームについて
    他の参加者とともに最大で3人までのチームを組むことが出来ます。
    チームを組んだユーザー同士はアイディア等のシェアOKです。(チームでない参
    加ユーザー同士でのアイディア・コードの共有は禁止です。)
    チームを組むとボーナスとして submission 上限がメンバー一人あたり10回増加
    します。

    View Slide

  21. 最大チームコスト
    Kaggle Rank point
    GrandMaster 10
    Master 7
    Expert 4
    それ以外 1
    ユーザーにはKaggleRankによってコストが設
    定されています。チームの合計コスト数が14
    を超えるようなチームは作成することはでき
    ません。
    チームコストはユーザープロフィールに紐づ
    くKaggleRank から計算されるようになって
    います。コンペ参加前にユーザー設定画面か
    ら現在のKaggleRankを入力して保存するよう
    にしてください。

    View Slide

  22. スケジュール

    View Slide

  23. スケジュール
    Date Time Contents
    12/4[金] 17:40~18:30 コンペティション開始(本説明終了後)
    12/5[土] 14:00~15:00 [初心者講座1] データを眺めて submission する
    12/6[火] 14:00~15:00 [初心者講義2] より深くデータを見て予測性能
    を改善する
    12/13[土] 18:00 DEADLINE (提出締め切り)
    18:00~19:00 結果発表・表彰
    *リアルタイムでなくても振り返って見れるよう配信する予定です

    View Slide

  24. おわり

    View Slide

  25. コンペサイトの説明

    View Slide