Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
我々がデータを公開する意義と課題
Search
Recruit Technologies
June 19, 2018
Technology
0
530
我々がデータを公開する意義と課題
2018年6月19日 Japan Open Science Summit 2018での櫻井の講演資料になります。
Recruit Technologies
June 19, 2018
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
障害はチャンスだ! 障害を前向きに捉える
rtechkouhou
1
740
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
12k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.6k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
2k
【61期 新人BootCamp】TOC入門
rtechkouhou
3
42k
【RTC新人研修 】 TPS
rtechkouhou
1
41k
Android Boot Camp 2020
rtechkouhou
0
41k
HTML/CSS
rtechkouhou
10
51k
TypeScript Bootcamp 2020
rtechkouhou
9
46k
Other Decks in Technology
See All in Technology
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
170
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
510
pool.ntp.orgに ⾃宅サーバーで 参加してみたら...
tanyorg
0
1.2k
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
210
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
登壇駆動学習のすすめ — CfPのネタの見つけ方と書くときに意識していること
bicstone
3
130
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.4k
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
240
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
510
Context Engineeringの取り組み
nutslove
0
380
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
210
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
It's Worth the Effort
3n
188
29k
Automating Front-end Workflow
addyosmani
1371
200k
Raft: Consensus for Rubyists
vanstee
141
7.3k
Unsuck your backbone
ammeep
671
58k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Optimising Largest Contentful Paint
csswizardry
37
3.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Why Our Code Smells
bkeepers
PRO
340
58k
Transcript
我々がデータを公開する意義と課題 JOSS 2018 セッションB4 ⺠間企業データによるオープンサイエンスの可能性 ♥
櫻井 ⼀貴 Kazutaka Sakurai 株式会社リクルートテクノロジーズ 経営企画部 広報コミュニケーショングループ 兼 アドバンスドテクノロジーラボ 情報処理学会
DBS研究会 運営委員 関⻄学院⼤学 社会情報学研究センター 客員研究員
アジェンダ 1 リクルートとリクルートテクノロジーズ 2 データ公開の実態 3 データ公開をする意義 4 公開に関して感じている課題 5 さいごに
1-1 リクルートについて 私たちは、誰かと誰かを結ぶ「場」を提供しています
1-1 リクルートについて 主なビジネスドメイン
1-1 リクルートについて 主なビジネスドメインと代表的なサービス
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development 事業横断でデータを取り扱う ことができるポジション
2 データ公開の実態 1)情報学研究データリポジトリ(IDR) 2)DBSJ Data Challenge 3)PBL型授業・プログラム 4)⾃社開催ハッカソン 5)個別契約
2 データ公開の実態 ⻑期 狭 広 短期
2 データ公開の実態 IDR DBSJ 個別 PBL ハッカ ソン ⻑期 狭
広 短期
2-1 情報学研究データリポジトリ
主な活⽤状況 ご意⾒・感想 ・論⽂「感情極性値を⽤いたレビューの有⽤性⾃動評価」 ・論⽂「価値観ベース協調フィルタリングのユーザ特性解析による 推薦性能向上に関する研究」(修⼠論⽂) ・⼝コミデータを使った時系列分析、計量テキスト分析 ・⾃作⾃演の印象を与える⼝コミにどのような特徴があるかの分析 ・たくさんの種類のデータがあって、さまざまな⾓度から分析できる ・データの形式がそろっていない部分があり、扱いにくい ・肯定的なレビューの数の⽅が圧倒的に多く、学習時などその偏りを
どう克服するかが⼤変だった ・売上データなどもわかると分析の幅が広がるためありがたい 2-1 情報学研究データリポジトリ
2-2 DBSJ Data Challenge http://dbsj.org/events/project/data_challenge_2018/
2-2 DBSJ Data Challenge + 世界中で公開されているLinked Open Data (LOD)を収集、⼀括検索 を実現するLOD活⽤基盤。利⽤可能
なLinked Dataの横断的なブラウジン グ/検索/アクセスを提供。
2-3 PBL型授業・プログラム http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ API提供+ メンタリング
2-3 PBL型授業・プログラム http://dss.i.u-tokyo.ac.jp/advance.html http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ データ提供+ メンタリング API提供+ メンタリング
2-4 ⾃社開催ハッカソン
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート :研究レベル向上のために⺠間企業として資することのできる余地 :最先端の研究結果をビジネスに接続、世の中をハッピーにしたい
:私たちの「仲間」を増やしたい
4 公開に関して感じている課題 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み 2015 2018
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み
さいごに
さいごに ⾯⽩い データを 提供 研究成果 の質が向 上 賛同者が 増える
さいごに ⾯⽩いデータを提供できるか vs ⾯⽩い研究成果を出せるか
ご清聴ありがとうございました リクルートテクノロジーズ