Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
我々がデータを公開する意義と課題
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Recruit Technologies
June 19, 2018
Technology
0
530
我々がデータを公開する意義と課題
2018年6月19日 Japan Open Science Summit 2018での櫻井の講演資料になります。
Recruit Technologies
June 19, 2018
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
障害はチャンスだ! 障害を前向きに捉える
rtechkouhou
1
760
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
12k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.6k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
2k
【61期 新人BootCamp】TOC入門
rtechkouhou
3
42k
【RTC新人研修 】 TPS
rtechkouhou
1
41k
Android Boot Camp 2020
rtechkouhou
0
41k
HTML/CSS
rtechkouhou
10
51k
TypeScript Bootcamp 2020
rtechkouhou
9
46k
Other Decks in Technology
See All in Technology
進化するBits AI SREと私と組織
nulabinc
PRO
0
150
親子 or ペアで Mashup for the Future! しゃべって楽しむ 初手AI駆動でものづくり体験
hiroramos4
PRO
0
110
[E2]CCoEはAI指揮官へ。Bedrock×MCPで構築するコスト・セキュリティ自律運用基盤
taku1418
0
150
AI時代の「本当の」ハイブリッドクラウド — エージェントが実現した、あの頃の夢
ebibibi
0
110
[JAWSDAYS2026]Who is responsible for IAM
mizukibbb
0
580
JAWSDAYS2026_A-6_現場SEが語る 回せるセキュリティ運用~設計で可視化、AIで加速する「楽に回る」運用設計のコツ~
shoki_hata
0
3k
JAWS DAYS 2026 ExaWizards_20260307
exawizards
0
420
アーキテクチャモダナイゼーションを実現する組織
satohjohn
1
690
OCI技術資料 : コンピュート・サービス 概要
ocise
4
54k
Claude Code Skills 勉強会 (DevelersIO向けに調整済み) / claude code skills for devio
masahirokawahara
1
20k
非情報系研究者へ送る Transformer入門
rishiyama
11
7.4k
Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent
nrslib
13
7.7k
Featured
See All Featured
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
150
How to train your dragon (web standard)
notwaldorf
97
6.6k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
150
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
51k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
110
How to make the Groovebox
asonas
2
2k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
130
Mobile First: as difficult as doing things right
swwweet
225
10k
A designer walks into a library…
pauljervisheath
210
24k
Transcript
我々がデータを公開する意義と課題 JOSS 2018 セッションB4 ⺠間企業データによるオープンサイエンスの可能性 ♥
櫻井 ⼀貴 Kazutaka Sakurai 株式会社リクルートテクノロジーズ 経営企画部 広報コミュニケーショングループ 兼 アドバンスドテクノロジーラボ 情報処理学会
DBS研究会 運営委員 関⻄学院⼤学 社会情報学研究センター 客員研究員
アジェンダ 1 リクルートとリクルートテクノロジーズ 2 データ公開の実態 3 データ公開をする意義 4 公開に関して感じている課題 5 さいごに
1-1 リクルートについて 私たちは、誰かと誰かを結ぶ「場」を提供しています
1-1 リクルートについて 主なビジネスドメイン
1-1 リクルートについて 主なビジネスドメインと代表的なサービス
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development
1-2 リクルートテクノロジーズについて Solutions (IT & Internet marketing) Marketing Support Development
Infrastructure Service Design Impact Analysis Smart Device Big Data Solution PC & N/W Support Research & Development 事業横断でデータを取り扱う ことができるポジション
2 データ公開の実態 1)情報学研究データリポジトリ(IDR) 2)DBSJ Data Challenge 3)PBL型授業・プログラム 4)⾃社開催ハッカソン 5)個別契約
2 データ公開の実態 ⻑期 狭 広 短期
2 データ公開の実態 IDR DBSJ 個別 PBL ハッカ ソン ⻑期 狭
広 短期
2-1 情報学研究データリポジトリ
主な活⽤状況 ご意⾒・感想 ・論⽂「感情極性値を⽤いたレビューの有⽤性⾃動評価」 ・論⽂「価値観ベース協調フィルタリングのユーザ特性解析による 推薦性能向上に関する研究」(修⼠論⽂) ・⼝コミデータを使った時系列分析、計量テキスト分析 ・⾃作⾃演の印象を与える⼝コミにどのような特徴があるかの分析 ・たくさんの種類のデータがあって、さまざまな⾓度から分析できる ・データの形式がそろっていない部分があり、扱いにくい ・肯定的なレビューの数の⽅が圧倒的に多く、学習時などその偏りを
どう克服するかが⼤変だった ・売上データなどもわかると分析の幅が広がるためありがたい 2-1 情報学研究データリポジトリ
2-2 DBSJ Data Challenge http://dbsj.org/events/project/data_challenge_2018/
2-2 DBSJ Data Challenge + 世界中で公開されているLinked Open Data (LOD)を収集、⼀括検索 を実現するLOD活⽤基盤。利⽤可能
なLinked Dataの横断的なブラウジン グ/検索/アクセスを提供。
2-3 PBL型授業・プログラム http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ API提供+ メンタリング
2-3 PBL型授業・プログラム http://dss.i.u-tokyo.ac.jp/advance.html http://www-dsc.naist.jp/dsc_jp/index.php/pbl2018a/ データ提供+ メンタリング API提供+ メンタリング
2-4 ⾃社開催ハッカソン
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート
3 データを公開する意義 ① 対アカデミック ② 対カスタマー・クライアント ③ 対リクルート :研究レベル向上のために⺠間企業として資することのできる余地 :最先端の研究結果をビジネスに接続、世の中をハッピーにしたい
:私たちの「仲間」を増やしたい
4 公開に関して感じている課題 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み 2015 2018
4 公開に関して感じている課題 〜解決の⽅向性 ① パワー(リソース)不⾜ ② 「⾯⽩いデータ」を提供できるか ・「公開」に対する賛同者を増やす ・そのためにも 実績
を増やしていきたい ・「攻め」の姿勢で臨む事業の巻き込み
さいごに
さいごに ⾯⽩い データを 提供 研究成果 の質が向 上 賛同者が 増える
さいごに ⾯⽩いデータを提供できるか vs ⾯⽩い研究成果を出せるか
ご清聴ありがとうございました リクルートテクノロジーズ