Slide 1

Slide 1 text

1 atmaCup onsite data competition

Slide 2

Slide 2 text

このスライドは後で共有いたします。 はじめに

Slide 3

Slide 3 text

情報公開について ハッシュタグは #atmaCup です! twitter / instagram 等で発信していただけると嬉しいです

Slide 4

Slide 4 text

情報公開ポリシー OKなこと: なんでもOKです。 **自分が取り組んでいることに関して、開催中に公開することはアイディアの共有 になる可能性がありますので禁止とします。

Slide 5

Slide 5 text

Hello!! atma(アートマ)株式会社 取締役 山口貴大 @nyker_goto (twitter) 担当領域: データ分析・フロントエンド・バックエンド・ インフラ 京都大学大学院 最適化数理卒 SGDが好き Kaggle Master kaggle.com/nyk510 5

Slide 6

Slide 6 text

目次 1. atmaについて 2. 課題発表 3. 賞金 4. ルール 5. スケジュール

Slide 7

Slide 7 text

atmaについて

Slide 8

Slide 8 text

atmaが成し遂げたいこと テクノロジーの価値はそれ自体にあるのではなく、価値がある営みに滑らかに 接続されて初めて真価を発揮します。 私達はテクノロジーが日常・事業に滑らかに接続し、人々がより豊かに過ごす 未来を作る企業です。お客様の事業にテクノロジーを滑らかに接続されるよう アルゴリズムを提供、支援しています。 https://www.atma.co.jp/ 物理と情報を滑らかに接続し、 人の営みを豊かにする。

Slide 9

Slide 9 text

atma株式会社・メンバー構成 代表取締役・上浦 伸也 取締役・山口 貴大 京都大学大学院にて最適化数学を専攻 在学中に学生ベンチャーを立ち上げて取締役とし てジョイン。大学卒業と同時に売却しatma株式会 社を設立 京都大学大学院にて最適化数学を専攻 インターンにて不動産の価格推定エンジンを作成し たことがきっかけでデータサイエンティストとして atmaへ入社 Kaggle Master: https://www.kaggle.com/nyk510 従業員 プロパー社員8名 全体30名 平均年齢28歳 各メンバーが一人でサービスを立ち上げられるフルスタックエンジニア データコンペティションプラットフォーム kaggle のトップ1%のプレイヤーなども在籍 アカデミックに強く論文ベースの最先端技術のキャッチアップ速度

Slide 10

Slide 10 text

事業概要 ● アルゴリズムコンサルティング事業 ー 具体的アプローチが決まっていない状態からサポート ー どういったことが出来るのかを議論しつつ実現したい内容を固めていく ● アルゴリズムモジュール事業 ― 基幹システムにアルゴリズムをモジュールとして提供 ― 予測・分類エンジン, 画像査定エンジン, 最適化エンジン, 自然言語処理エンジン ● システム開発事業 ― 最新の技術を用いて使いやすいを形に ― PWAでのWeb開発, Webサービスのインフラ構築, クローラー実装

Slide 11

Slide 11 text

11 atmaCup onsite data competition

Slide 12

Slide 12 text

主催: atma株式会社 12 atmaCup#5 2020-05-29 ~ 06-06 (1 week) @Online 参加者: 300人 (振返り会 205人) #submissions: 4602 はじめてオンラインでの開催となり定員を大幅に増やしました が300人を上回る応募(316)があり、Expert以上が100名以 上と数・レベルともに過去最高となりました。参加者同士での 活発な議論が白熱し、分析結果に対する議論・討論が過去最 高の盛り上がりとなりました (*)。 初のオンライン開催! ぐるぐる: atmaCup#5 https://www.guruguru.ml/competitions/9 atmaCupとしてはじめて、学術業界からデータ提供していた だいたコンペティションでした。今後も産学が連携できるような 場としてatmaCupを提供できれば良いと考えています。 初の学術的な課題設定 *ディスカッション(データに関する議論をする掲示板)の投稿数・コメント数ともに過去最高

Slide 13

Slide 13 text

課題説明

Slide 14

Slide 14 text

ゲームの売上予測 ゲームの属性情報を使って世界全体での売上を予測する問題です。 (諸事情で珈琲は没になりました…) ● ジャンル・メーカー・開発会社 etc 評価指標: RMSLE / Root Mean Squared Logarithmic Error

Slide 15

Slide 15 text

賞金

Slide 16

Slide 16 text

豪華な商品 private leaderboard 上位 (通常LB + 敢闘賞 LB) のチームに atma 謹製のメダルをお送りし ます。 開催期間中ディスカッションで最も「いいね」 をもらえたユーザーにも nyk510 賞をお送りし ます。 (上記入賞については submit に使用したコードの提出、並びに submit の再現が 取れると運営が判断した後お送りいたします。内容の再現が取れない等、場合に よっては表彰を取りやめる場合がございますこと、ご承知おきくださいませ。)

Slide 17

Slide 17 text

ルール

Slide 18

Slide 18 text

予測値の提出と評価 コンペに参加するとサブミッションタブから予 測ファイルを提出することができます。提出は チームで合計50回行えます。 提出が成功すると、ぐるぐるはテストデータの 一部に対する公開スコア public score を計算し ユーザへ開示します。 最終的な評価は公開スコアで使わなかった部分 で計算されたスコア private score で行われま す。 Public PrivateScore =??? Test Data 提出したタイミングで スコアが見れる部分 Private 最終評価で用いられる 部分。コンペ終了後ま でスコアがいくつかわ からない。 PublicScore =0.300

Slide 19

Slide 19 text

最終順位の決定方法 PublicScoreによるランキングは提出したすべてのファイルのなかで最も 良いものでランク付けされています。 最終的な評価は 個別のチームが選択したファイル のスコアでランク付け されます。あなたが最も良いと思う submission を選択するようにしてく ださい(*)。 今回は最大で 2 個選択できます。 * 最終 submit が選ばれていない場合には public score が良いものを選択したとみなして、 スコア計算が実行されます。

Slide 20

Slide 20 text

チームについて 他の参加者とともに最大で3人までのチームを組むことが出来ます。 チームを組んだユーザー同士はアイディア等のシェアOKです。(チームでない参 加ユーザー同士でのアイディア・コードの共有は禁止です。) チームを組むとボーナスとして submission 上限がメンバー一人あたり10回増加 します。

Slide 21

Slide 21 text

最大チームコスト Kaggle Rank point GrandMaster 10 Master 7 Expert 4 それ以外 1 ユーザーにはKaggleRankによってコストが設 定されています。チームの合計コスト数が14 を超えるようなチームは作成することはでき ません。 チームコストはユーザープロフィールに紐づ くKaggleRank から計算されるようになって います。コンペ参加前にユーザー設定画面か ら現在のKaggleRankを入力して保存するよう にしてください。

Slide 22

Slide 22 text

スケジュール

Slide 23

Slide 23 text

スケジュール Date Time Contents 12/4[金] 17:40~18:30 コンペティション開始(本説明終了後) 12/5[土] 14:00~15:00 [初心者講座1] データを眺めて submission する 12/6[火] 14:00~15:00 [初心者講義2] より深くデータを見て予測性能 を改善する 12/13[土] 18:00 DEADLINE (提出締め切り) 18:00~19:00 結果発表・表彰 *リアルタイムでなくても振り返って見れるよう配信する予定です

Slide 24

Slide 24 text

おわり

Slide 25

Slide 25 text

コンペサイトの説明