Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
我々がデータを公開する意義と課題
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Recruit Technologies
June 19, 2018
Technology
530
0
Share
我々がデータを公開する意義と課題
2018年6月19日 Japan Open Science Summit 2018での櫻井の講演資料になります。
Recruit Technologies
June 19, 2018
More Decks by Recruit Technologies
See All by Recruit Technologies
障害はチャンスだ! 障害を前向きに捉える
rtechkouhou
1
760
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
12k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.6k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
2k
【61期 新人BootCamp】TOC入門
rtechkouhou
3
42k
【RTC新人研修 】 TPS
rtechkouhou
1
41k
Android Boot Camp 2020
rtechkouhou
0
41k
HTML/CSS
rtechkouhou
10
52k
TypeScript Bootcamp 2020
rtechkouhou
9
46k
Other Decks in Technology
See All in Technology
レガシーシステムをどう次世代に受け継ぐか
tachiiri
0
180
Zephyr(RTOS)でARMとRISC-Vのコア間通信をしてみた
iotengineer22
0
120
Oracle Cloud Infrastructure:2026年3月度サービス・アップデート
oracle4engineer
PRO
0
340
Cortex Code君、今日から内製化支援担当ね。
coco_se
0
230
互換性のある(らしい)DBへの移行など考えるにあたってたいへんざっくり
sejima
PRO
0
540
Why we keep our community?
kawaguti
PRO
0
390
Babylon.js Japan Activities (2026/4)
limes2018
0
150
TUNA Camp 2026 京都Stage ヒューリスティックアルゴリズム入門
terryu16
0
670
脳が溶けた話 / Melted Brain
keisuke69
1
1.2k
40代からのアウトプット ― 経験は価値ある学びに変わる / 20260404 Naoki Takahashi
shift_evolve
PRO
5
770
20260326_AIDD事例紹介_ULSC.pdf
findy_eventslides
0
450
Move Fast and Break Things: 10 in 20
ramimac
0
120
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
42
3k
sira's awesome portfolio website redesign presentation
elsirapls
0
200
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
The SEO Collaboration Effect
kristinabergwall1
0
410
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
190
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
310
How STYLIGHT went responsive
nonsquared
100
6k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
140
Writing Fast Ruby
sferik
630
63k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Transcript
我々がデータを公開する意義と課題 JOSS 2018 セッションB4 ⺠間企業データによるオープンサイエンスの可能性 ♥
櫻井 ⼀貴 Kazutaka Sakurai 株式会社リクルートテクノロジーズ 経営企画部 広報コミュニケーショングループ 兼 アドバンスドテクノロジーラボ 情報処理学会
DBS研究会 運営委員 関⻄学院⼤学 社会情報学研究センター 客員研究員
アジェンダ 1 リクルートとリクルートテクノロジーズ 2 データ公開の実態 3 データ公開をする意義 4 公開に関して感じている課題 5 さいごに
1-1 リクルートについて 私たちは、誰かと誰かを結ぶ「場」を提供しています
1-1 リクルートについて 主なビジネスドメイン
1-1 リクルートについて 主なビジネスドメインと代表的なサービス
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development 事業横断でデータを取り扱う ことができるポジション
2 データ公開の実態 1)情報学研究データリポジトリ(IDR) 2)DBSJ Data Challenge 3)PBL型授業・プログラム 4)⾃社開催ハッカソン 5)個別契約
2 データ公開の実態 ⻑期 狭 広 短期
2 データ公開の実態 IDR DBSJ 個別 PBL ハッカ ソン ⻑期 狭
広 短期
2-1 情報学研究データリポジトリ
主な活⽤状況 ご意⾒・感想 ・論⽂「感情極性値を⽤いたレビューの有⽤性⾃動評価」 ・論⽂「価値観ベース協調フィルタリングのユーザ特性解析による 推薦性能向上に関する研究」(修⼠論⽂) ・⼝コミデータを使った時系列分析、計量テキスト分析 ・⾃作⾃演の印象を与える⼝コミにどのような特徴があるかの分析 ・たくさんの種類のデータがあって、さまざまな⾓度から分析できる ・データの形式がそろっていない部分があり、扱いにくい ・肯定的なレビューの数の⽅が圧倒的に多く、学習時などその偏りを
どう克服するかが⼤変だった ・売上データなどもわかると分析の幅が広がるためありがたい 2-1 情報学研究データリポジトリ
2-2 DBSJ Data Challenge http://dbsj.org/events/project/data_challenge_2018/
2-2 DBSJ Data Challenge + 世界中で公開されているLinked Open Data (LOD)を収集、⼀括検索 を実現するLOD活⽤基盤。利⽤可能
なLinked Dataの横断的なブラウジン グ/検索/アクセスを提供。
2-3 PBL型授業・プログラム http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ API提供+ メンタリング
2-3 PBL型授業・プログラム http://dss.i.u-tokyo.ac.jp/advance.html http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ データ提供+ メンタリング API提供+ メンタリング
2-4 ⾃社開催ハッカソン
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート :研究レベル向上のために⺠間企業として資することのできる余地 :最先端の研究結果をビジネスに接続、世の中をハッピーにしたい
:私たちの「仲間」を増やしたい
4 公開に関して感じている課題 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み 2015 2018
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み
さいごに
さいごに ⾯⽩い データを 提供 研究成果 の質が向 上 賛同者が 増える
さいごに ⾯⽩いデータを提供できるか vs ⾯⽩い研究成果を出せるか
ご清聴ありがとうございました リクルートテクノロジーズ