1atmaCuponsite data competition
View Slide
このスライドは後で共有いたします。はじめに
情報公開についてハッシュタグは #atmaCup です!twitter / instagram 等で発信していただけると嬉しいです
情報公開ポリシーOKなこと: なんでもOKです。**自分が取り組んでいることに関して、開催中に公開することはアイディアの共有になる可能性がありますので禁止とします。
Hello!!atma(アートマ)株式会社 取締役山口貴大 @nyker_goto (twitter)担当領域: データ分析・フロントエンド・バックエンド・インフラ京都大学大学院 最適化数理卒 SGDが好きKaggle Master kaggle.com/nyk5105
目次 1. atmaについて2. 課題発表3. 賞金4. ルール5. スケジュール
atmaについて
atmaが成し遂げたいことテクノロジーの価値はそれ自体にあるのではなく、価値がある営みに滑らかに接続されて初めて真価を発揮します。私達はテクノロジーが日常・事業に滑らかに接続し、人々がより豊かに過ごす未来を作る企業です。お客様の事業にテクノロジーを滑らかに接続されるようアルゴリズムを提供、支援しています。https://www.atma.co.jp/物理と情報を滑らかに接続し、人の営みを豊かにする。
atma株式会社・メンバー構成代表取締役・上浦 伸也 取締役・山口 貴大京都大学大学院にて最適化数学を専攻在学中に学生ベンチャーを立ち上げて取締役としてジョイン。大学卒業と同時に売却しatma株式会社を設立京都大学大学院にて最適化数学を専攻インターンにて不動産の価格推定エンジンを作成したことがきっかけでデータサイエンティストとしてatmaへ入社Kaggle Master: https://www.kaggle.com/nyk510従業員 プロパー社員8名 全体30名 平均年齢28歳各メンバーが一人でサービスを立ち上げられるフルスタックエンジニアデータコンペティションプラットフォーム kaggle のトップ1%のプレイヤーなども在籍アカデミックに強く論文ベースの最先端技術のキャッチアップ速度
事業概要● アルゴリズムコンサルティング事業ー 具体的アプローチが決まっていない状態からサポートー どういったことが出来るのかを議論しつつ実現したい内容を固めていく● アルゴリズムモジュール事業― 基幹システムにアルゴリズムをモジュールとして提供― 予測・分類エンジン, 画像査定エンジン, 最適化エンジン, 自然言語処理エンジン● システム開発事業― 最新の技術を用いて使いやすいを形に― PWAでのWeb開発, Webサービスのインフラ構築, クローラー実装
11atmaCuponsite data competition
主催: atma株式会社12atmaCup#52020-05-29 ~ 06-06 (1 week)@Online参加者: 300人 (振返り会 205人)#submissions: 4602はじめてオンラインでの開催となり定員を大幅に増やしましたが300人を上回る応募(316)があり、Expert以上が100名以上と数・レベルともに過去最高となりました。参加者同士での活発な議論が白熱し、分析結果に対する議論・討論が過去最高の盛り上がりとなりました(*)。初のオンライン開催!ぐるぐる: atmaCup#5 https://www.guruguru.ml/competitions/9atmaCupとしてはじめて、学術業界からデータ提供していただいたコンペティションでした。今後も産学が連携できるような場としてatmaCupを提供できれば良いと考えています。初の学術的な課題設定*ディスカッション(データに関する議論をする掲示板)の投稿数・コメント数ともに過去最高
課題説明
ゲームの売上予測ゲームの属性情報を使って世界全体での売上を予測する問題です。(諸事情で珈琲は没になりました…)● ジャンル・メーカー・開発会社 etc評価指標: RMSLE / Root Mean Squared Logarithmic Error
賞金
豪華な商品 private leaderboard 上位 (通常LB + 敢闘賞LB) のチームに atma 謹製のメダルをお送りします。開催期間中ディスカッションで最も「いいね」をもらえたユーザーにも nyk510 賞をお送りします。(上記入賞については submit に使用したコードの提出、並びに submit の再現が取れると運営が判断した後お送りいたします。内容の再現が取れない等、場合によっては表彰を取りやめる場合がございますこと、ご承知おきくださいませ。)
ルール
予測値の提出と評価コンペに参加するとサブミッションタブから予測ファイルを提出することができます。提出はチームで合計50回行えます。提出が成功すると、ぐるぐるはテストデータの一部に対する公開スコア public score を計算しユーザへ開示します。最終的な評価は公開スコアで使わなかった部分で計算されたスコア private score で行われます。PublicPrivateScore=???Test Data提出したタイミングでスコアが見れる部分Private最終評価で用いられる部分。コンペ終了後までスコアがいくつかわからない。PublicScore=0.300
最終順位の決定方法PublicScoreによるランキングは提出したすべてのファイルのなかで最も良いものでランク付けされています。最終的な評価は 個別のチームが選択したファイル のスコアでランク付けされます。あなたが最も良いと思う submission を選択するようにしてください(*)。今回は最大で 2 個選択できます。* 最終 submit が選ばれていない場合には public score が良いものを選択したとみなして、スコア計算が実行されます。
チームについて他の参加者とともに最大で3人までのチームを組むことが出来ます。チームを組んだユーザー同士はアイディア等のシェアOKです。(チームでない参加ユーザー同士でのアイディア・コードの共有は禁止です。)チームを組むとボーナスとして submission 上限がメンバー一人あたり10回増加します。
最大チームコストKaggle Rank pointGrandMaster 10Master 7Expert 4それ以外 1ユーザーにはKaggleRankによってコストが設定されています。チームの合計コスト数が14を超えるようなチームは作成することはできません。チームコストはユーザープロフィールに紐づくKaggleRank から計算されるようになっています。コンペ参加前にユーザー設定画面から現在のKaggleRankを入力して保存するようにしてください。
スケジュール
スケジュールDate Time Contents12/4[金] 17:40~18:30 コンペティション開始(本説明終了後)12/5[土] 14:00~15:00 [初心者講座1] データを眺めて submission する12/6[火] 14:00~15:00 [初心者講義2] より深くデータを見て予測性能を改善する12/13[土] 18:00 DEADLINE (提出締め切り)18:00~19:00 結果発表・表彰*リアルタイムでなくても振り返って見れるよう配信する予定です
おわり
コンペサイトの説明