Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
我々がデータを公開する意義と課題
Search
Recruit Technologies
June 19, 2018
Technology
0
530
我々がデータを公開する意義と課題
2018年6月19日 Japan Open Science Summit 2018での櫻井の講演資料になります。
Recruit Technologies
June 19, 2018
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
障害はチャンスだ! 障害を前向きに捉える
rtechkouhou
1
730
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
12k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.5k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
1.9k
【61期 新人BootCamp】TOC入門
rtechkouhou
3
42k
【RTC新人研修 】 TPS
rtechkouhou
1
41k
Android Boot Camp 2020
rtechkouhou
0
41k
HTML/CSS
rtechkouhou
10
51k
TypeScript Bootcamp 2020
rtechkouhou
9
46k
Other Decks in Technology
See All in Technology
Gemini でコードレビュー知見を見える化
zozotech
PRO
1
250
エンジニアとPMのドメイン知識の溝をなくす、 AIネイティブな開発プロセス
applism118
4
1.2k
寫了幾年 Code,然後呢?軟體工程師必須重新認識的 DevOps
cheng_wei_chen
1
1.3k
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
260
ガバメントクラウド利用システムのライフサイクルについて
techniczna
0
190
regrowth_tokyo_2025_securityagent
hiashisan
0
220
世界最速級 memcached 互換サーバー作った
yasukata
0
330
生成AI時代におけるグローバル戦略思考
taka_aki
0
120
多様なデジタルアイデンティティを攻撃からどうやって守るのか / 20251212
ayokura
0
420
AWS Trainium3 をちょっと身近に感じたい
bigmuramura
1
140
Lambdaの常識はどう変わる?!re:Invent 2025 before after
iwatatomoya
1
450
乗りこなせAI駆動開発の波
eltociear
1
1.1k
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Visualization
eitanlees
150
16k
Embracing the Ebb and Flow
colly
88
4.9k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Docker and Python
trallard
47
3.7k
Faster Mobile Websites
deanohume
310
31k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Balancing Empowerment & Direction
lara
5
790
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
97
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
Context Engineering - Making Every Token Count
addyosmani
9
500
Transcript
我々がデータを公開する意義と課題 JOSS 2018 セッションB4 ⺠間企業データによるオープンサイエンスの可能性 ♥
櫻井 ⼀貴 Kazutaka Sakurai 株式会社リクルートテクノロジーズ 経営企画部 広報コミュニケーショングループ 兼 アドバンスドテクノロジーラボ 情報処理学会
DBS研究会 運営委員 関⻄学院⼤学 社会情報学研究センター 客員研究員
アジェンダ 1 リクルートとリクルートテクノロジーズ 2 データ公開の実態 3 データ公開をする意義 4 公開に関して感じている課題 5 さいごに
1-1 リクルートについて 私たちは、誰かと誰かを結ぶ「場」を提供しています
1-1 リクルートについて 主なビジネスドメイン
1-1 リクルートについて 主なビジネスドメインと代表的なサービス
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development 事業横断でデータを取り扱う ことができるポジション
2 データ公開の実態 1)情報学研究データリポジトリ(IDR) 2)DBSJ Data Challenge 3)PBL型授業・プログラム 4)⾃社開催ハッカソン 5)個別契約
2 データ公開の実態 ⻑期 狭 広 短期
2 データ公開の実態 IDR DBSJ 個別 PBL ハッカ ソン ⻑期 狭
広 短期
2-1 情報学研究データリポジトリ
主な活⽤状況 ご意⾒・感想 ・論⽂「感情極性値を⽤いたレビューの有⽤性⾃動評価」 ・論⽂「価値観ベース協調フィルタリングのユーザ特性解析による 推薦性能向上に関する研究」(修⼠論⽂) ・⼝コミデータを使った時系列分析、計量テキスト分析 ・⾃作⾃演の印象を与える⼝コミにどのような特徴があるかの分析 ・たくさんの種類のデータがあって、さまざまな⾓度から分析できる ・データの形式がそろっていない部分があり、扱いにくい ・肯定的なレビューの数の⽅が圧倒的に多く、学習時などその偏りを
どう克服するかが⼤変だった ・売上データなどもわかると分析の幅が広がるためありがたい 2-1 情報学研究データリポジトリ
2-2 DBSJ Data Challenge http://dbsj.org/events/project/data_challenge_2018/
2-2 DBSJ Data Challenge + 世界中で公開されているLinked Open Data (LOD)を収集、⼀括検索 を実現するLOD活⽤基盤。利⽤可能
なLinked Dataの横断的なブラウジン グ/検索/アクセスを提供。
2-3 PBL型授業・プログラム http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ API提供+ メンタリング
2-3 PBL型授業・プログラム http://dss.i.u-tokyo.ac.jp/advance.html http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ データ提供+ メンタリング API提供+ メンタリング
2-4 ⾃社開催ハッカソン
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート :研究レベル向上のために⺠間企業として資することのできる余地 :最先端の研究結果をビジネスに接続、世の中をハッピーにしたい
:私たちの「仲間」を増やしたい
4 公開に関して感じている課題 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み 2015 2018
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み
さいごに
さいごに ⾯⽩い データを 提供 研究成果 の質が向 上 賛同者が 増える
さいごに ⾯⽩いデータを提供できるか vs ⾯⽩い研究成果を出せるか
ご清聴ありがとうございました リクルートテクノロジーズ