Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
我々がデータを公開する意義と課題
Search
Recruit Technologies
June 19, 2018
Technology
0
510
我々がデータを公開する意義と課題
2018年6月19日 Japan Open Science Summit 2018での櫻井の講演資料になります。
Recruit Technologies
June 19, 2018
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
障害はチャンスだ! 障害を前向きに捉える
rtechkouhou
1
660
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
11k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.5k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
1.9k
【61期 新人BootCamp】TOC入門
rtechkouhou
3
42k
【RTC新人研修 】 TPS
rtechkouhou
1
41k
Android Boot Camp 2020
rtechkouhou
0
41k
HTML/CSS
rtechkouhou
10
51k
TypeScript Bootcamp 2020
rtechkouhou
9
45k
Other Decks in Technology
See All in Technology
Zenn のウラガワ ~エンジニアのアウトプットを支える環境で Google Cloud が採用されているワケ~ #burikaigi #burikaigi_h
kongmingstrap
18
6.8k
企業テックブログにおける執筆ネタの考え方・見つけ方・広げ方 / How to Think of, Find, and Expand Writing Topics for Corporate Tech Blogs
honyanya
0
810
panicを深ぼってみる
kworkdev
PRO
2
150
業務ツールをAIエージェントとつなぐ - Composio
knishioka
0
110
サービスローンチを成功させろ! 〜SREが教える30日間の攻略ガイド〜
mmmatsuda
2
4.4k
NOSTR, réseau social et espace de liberté décentralisé
rlifchitz
0
130
あなたの興味は信頼性?それとも生産性? SREとしてのキャリアに悩むみなさまに伝えたい選択肢
jacopen
6
3.1k
一人から始めたSREチーム3年の歩み - 求められるスキルの変化とチームのあり方 - / The three-year journey of the SRE team, which started all by myself
vtryo
7
5.7k
GraphRAG: What I Thought I Knew (But Didn’t)
sashimimochi
1
230
Microsoft Ignite 2024 最新情報!Microsoft 365 Agents SDK 概要 / Microsoft Ignite 2024 latest news Microsoft 365 Agents SDK overview
karamem0
0
190
Site Reliability Engineering on Kubernetes
nwiizo
6
4.4k
“自分”を大切に、フラットに。キャリアチェンジしてからの一年 三ヶ月で見えたもの。
maimyyym
0
300
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Cult of Friendly URLs
andyhume
78
6.2k
Navigating Team Friction
lara
183
15k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Become a Pro
speakerdeck
PRO
26
5.1k
GitHub's CSS Performance
jonrohan
1030
460k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
20
2.4k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
A designer walks into a library…
pauljervisheath
205
24k
Done Done
chrislema
182
16k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Transcript
我々がデータを公開する意義と課題 JOSS 2018 セッションB4 ⺠間企業データによるオープンサイエンスの可能性 ♥
櫻井 ⼀貴 Kazutaka Sakurai 株式会社リクルートテクノロジーズ 経営企画部 広報コミュニケーショングループ 兼 アドバンスドテクノロジーラボ 情報処理学会
DBS研究会 運営委員 関⻄学院⼤学 社会情報学研究センター 客員研究員
アジェンダ 1 リクルートとリクルートテクノロジーズ 2 データ公開の実態 3 データ公開をする意義 4 公開に関して感じている課題 5 さいごに
1-1 リクルートについて 私たちは、誰かと誰かを結ぶ「場」を提供しています
1-1 リクルートについて 主なビジネスドメイン
1-1 リクルートについて 主なビジネスドメインと代表的なサービス
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development 事業横断でデータを取り扱う ことができるポジション
2 データ公開の実態 1)情報学研究データリポジトリ(IDR) 2)DBSJ Data Challenge 3)PBL型授業・プログラム 4)⾃社開催ハッカソン 5)個別契約
2 データ公開の実態 ⻑期 狭 広 短期
2 データ公開の実態 IDR DBSJ 個別 PBL ハッカ ソン ⻑期 狭
広 短期
2-1 情報学研究データリポジトリ
主な活⽤状況 ご意⾒・感想 ・論⽂「感情極性値を⽤いたレビューの有⽤性⾃動評価」 ・論⽂「価値観ベース協調フィルタリングのユーザ特性解析による 推薦性能向上に関する研究」(修⼠論⽂) ・⼝コミデータを使った時系列分析、計量テキスト分析 ・⾃作⾃演の印象を与える⼝コミにどのような特徴があるかの分析 ・たくさんの種類のデータがあって、さまざまな⾓度から分析できる ・データの形式がそろっていない部分があり、扱いにくい ・肯定的なレビューの数の⽅が圧倒的に多く、学習時などその偏りを
どう克服するかが⼤変だった ・売上データなどもわかると分析の幅が広がるためありがたい 2-1 情報学研究データリポジトリ
2-2 DBSJ Data Challenge http://dbsj.org/events/project/data_challenge_2018/
2-2 DBSJ Data Challenge + 世界中で公開されているLinked Open Data (LOD)を収集、⼀括検索 を実現するLOD活⽤基盤。利⽤可能
なLinked Dataの横断的なブラウジン グ/検索/アクセスを提供。
2-3 PBL型授業・プログラム http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ API提供+ メンタリング
2-3 PBL型授業・プログラム http://dss.i.u-tokyo.ac.jp/advance.html http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ データ提供+ メンタリング API提供+ メンタリング
2-4 ⾃社開催ハッカソン
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート :研究レベル向上のために⺠間企業として資することのできる余地 :最先端の研究結果をビジネスに接続、世の中をハッピーにしたい
:私たちの「仲間」を増やしたい
4 公開に関して感じている課題 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み 2015 2018
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み
さいごに
さいごに ⾯⽩い データを 提供 研究成果 の質が向 上 賛同者が 増える
さいごに ⾯⽩いデータを提供できるか vs ⾯⽩い研究成果を出せるか
ご清聴ありがとうございました リクルートテクノロジーズ