Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Science Report 04 - データサイエンティストのつながり分析 / DSR4

Sansan R&D
November 09, 2018

Data Science Report 04 - データサイエンティストのつながり分析 / DSR4

■ データサイエンティストのつながり分析

統計分析を行う能力だけでなく、ビジネスを進める力やスキルを求められるデータサイエンティストは、どのような人脈を持っているのか。データサイエンティストの名刺交換傾向を分析する。その結果、名刺交換枚数が一定以上になると、IT関連部署の名刺の割合が低下し、他の部署の割合が高まっていた。他社と積極的に交流している人ほど、さまざまな部署の人たちと幅広く交流していることが分かった。

※本誌は当社サービスで定める利用規約の許諾範囲内で匿名化したデータを統計的に利用しています。

■ R&Dの採用情報
https://media.sansan-engineering.com/randd

Sansan R&D

November 09, 2018
Tweet

More Decks by Sansan R&D

Other Decks in Research

Transcript

  1. 01 |  © Sansan, Inc. Data Science Report データサイエンティストのつながり分析 1 概要 ビッグデータの蓄積や計算技術の向上に伴い、データを分析しビジネス上の課題に対してソリューションを導くデータサイ

    エンティストが活躍している。マネジメント誌『Harvard Business Review』がデータサイエンティストを21世紀で最もセ クシーな職業であると表現したのが、2012年10月であった。それから年月が経過しても、そのセクシーさにますます磨きを かけていると言える。経済産業省(2016)は、2025年までの予測においてデータサイエンティストのニーズがさらに高まる ことを示しており、企業にとってはデータサイエンティストの確保がますます課題になると指摘しているからである。本稿で は、 そのようなデータサイエンティストがどのような人たちと名刺交換をしているのかについて、 個人向け名刺アプリ「Eight」 のデータを基に分析をしたい。 データサイエンティストのつながりに注目する理由は、データサイエンティストに求められているスキルが多岐にわたるた め、複数のスキルを身に付けることや仕事での活躍を目的にどのような人と交流をしているのかが複雑であり、目に見えない ものであることから、その実態を把握することに意義があると考えているためである。 日経情報ストラテジー編(2013)は、データサイエンティストに求められているスキルを3つ挙げている。一つ目は、着眼 点である。データ分析を通じて顧客が持つ潜在ニーズを引き出す、既存業務の問題点を浮き彫りにするといったことのために は、何にフォーカスを当てるかといったものの見方が求められる。二つ目は、ITの知識である。情報を分析することが求めら れるため、統計ツールの使い方やプログラミングに関する知識、データマイニングなどの手法を熟知しておく必要がある。ま た、 機械学習に代表されるようにモデルに関する知識も求められるために、 統計学についての理解も不可欠である。三つ目は、 業務理解と現場への説明能力である。データサイエンティストは、分析した内容を他部署の人間にも分かりやすく伝える必要 がある。 このように、データサイエンティストは、エンジニアリングとビジネスの両方について理解が求められる職業であり、その 理解が伴ってこそ仕事ができるといえる。仕事を進める上で他社の人間と接点を持つ際に、どのような人と交流をしているの か、データサイエンティストのつながりについて見ていきたい。 2 分析対象 分析に当たっては、Eightのデータについて個人を匿名化し、2017年1月から2018年6月の期間にユーザーが登録した名刺 の情報をEightの利用規約で許諾を得ている範囲で使用した。Eightのデータにおいて、データサイエンティストであること を判別するために、 ユーザー自身の名刺情報の役職に 「データサイエンティスト」 「データアナリスト」 「データストラテジスト」 と記載がある人を対象とした結果、数百名のサンプルが得られた。一般的には、データサイエンティストは「ビッグデータを 分析し、現場に働きかけてイノベーティブな商品やサービスを生み出し、業務プロセスを革新する人材」と定義される(日経 情報ストラテジー編、 2013) 。 データサイエンティストとデータアナリストは、 その役割が一部異なることも見られるようだが、 データに携わる人材ということでやや広めに定義をしている。分析対象とした数百名が対象期間中にどれだけ名刺交換をして いるかを以下で分析するが、一般的な人との違いが分かるようにランダムに抽出した数百名のユーザー(抽出の結果、データ サイエンティストは含まれなかった)についてのデータも参考サンプルとして結果を示した。 分析では、データサイエンティストと参考サンプルのそれぞれにおいて、名刺交換枚数の分布(ネットワーク分析では次数 分布と呼ばれる)を見た上で、名刺交換をしている相手の部署はどこかといった点について示している。名刺交換をした相手 のうち本人と同じ企業に所属している人を除いたため、他社の人間との交流を見ることになる。Eightは個人向け名刺アプリ であるため、登録されている名刺には、業務の一環として本人の意思によらず名刺を交換したケースも含まれているかもしれ ないが、自主的に勉強会やイベントなどに参加し、そこで受け取った名刺である可能性もあるだろう。そういった可能性も踏 まえ、Eightの名刺情報を分析することで、本人の意思によりどれだけ幅広い交流ができているかをある程度は把握できると 考える。
  2. 02 |  © Sansan, Inc. Data Science Report 3 分析結果 図1は、データサイエンティストがどれだけ名刺交換をしているかを表した分布である※1。データサイエンティストと参考 サンプルを比較すると、多少の増減はあるが、名刺交換枚数が多くなるにつれて構成比が減少していく傾向は共通している。

    平均名刺交換枚数は、データサイエンティストは255枚、参考サンプルは273枚と、参考サンプルの方が少し多いが、データ サイエンティストとそれほどの大差はないと言えるだろう。 図1:名刺交換枚数の分布        ߏ ੒ ൺ ʢˋʣ ʢຕʣ ໊ࢗަ׵ຕ਺ σʔλαΠΤϯςΟετ ࢀߟαϯϓϧ      次に、データサイエンティストがどのような部署に所属する人たちと名刺交換をしているかを見ていきたい。ここでは、特 に名刺交換枚数によって交換した相手の所属部署の分布に違いがあるかといった点を見ていく。名刺交換枚数が多い人につい ては、社外の人と積極的に交流している可能性があり、交流によって得た情報を仕事に生かしている可能性が高い。そうであ るとすれば、データサイエンティストとして活躍するために幅広い人脈と交流している可能性がある。こうした仮説を実際に 検証できることが、この分析のポイントになる。 ※1:次数は一つのノード当たりのエッジの数と定義されるが、本稿においては、個人がノードに対応しており、個人間で名刺交換をし、名刺の情報が登録されている関係をエッジ として表している。なお、サンプルサイズが大きくないため、Eightのユーザーと名刺交換している相手は必ずしもEightのユーザーとは限らず、また交換相手の重複もそれほど 見られないためネットワーク図やネットワーク分析における特徴を表す指標については掲載していない。
  3. 03 |  © Sansan, Inc. Data Science Report 図2は、名刺交換相手の所属部署分布である。所属部署については、データサイエンティストと名刺交換した相手の名刺情 報の部署名や役職の情報から「営業・マーケティング・企画」 「経営・管理」

    「研究・開発等専門部署」に分けた。なお、デー タサイエンティストは先ほども見たようにITのスキルが求められるため、 IT関連の部署とも名刺交換をしている可能性が高い として、 「研究・開発等専門部署」から情報システムやシステム開発の部署を独立させている。 「情報システム・システム開発 部署」には、 一般企業の情報システム部門だけでなく、 IT企業におけるシステム開発や設計を行っている部署も含まれており、 名刺情報からでは両者を識別できないケースも見られたため、一つにまとめている※2。 参考サンプルと比較して、 データサイエンティストはIT関連部署との名刺交換割合が高く、 先ほど述べた想定の通りである。 一方、データサイエンティストにおいても、参考サンプルにおいても割合が最も高いのは、営業・マーケティング・企画の部 署である。データサイエンティストのうち、 名刺交換枚数についてある程度サンプルサイズを確保できるように、 「100枚以下」 「101 〜 500枚」 「501枚以上」に分けて、交換相手の部署を見てみると、枚数が501枚を超えるとIT関連部署の割合がやや低 下する一方で、経営・管理や研究・開発等専門部署の割合がやや上昇している。名刺交換の枚数が多いデータサイエンティス トほど、仕事内容の近いIT部門だけでなく、その他の部門・部署の人と幅広く交流している姿が見られるが、大きな差が見 られなかったとも言える。 図2:名刺交換相手の所属部署分布            σ ồ λ α Π Τ ϯ ς ỹ ε τ  ຕҎԼ                 ʙ ຕ  ຕҎ্ ࢀߟαϯϓϧ ໊ࢗަ׵ຕ਺ ˙ӦۀɾϚʔέςΟϯάɾاը ˙ݚڀɾ։ൃ౳ઐ໳෦ॺ ˙ܦӦɾ؅ཧ ˙৘ใγεςϜɾγεςϜ։ൃ෦ॺ ʢˋʣ ※2: 「研究・開発等専門部署」における開発は、主に技術開発を意味し、システム開発を含んでいない。
  4. 04 |  © Sansan, Inc. Data Science Report 4 結論 本稿では、データサイエンティストの名刺交換の特徴について見てきた。分析をした結果、分かったことをまとめてみる。 第一に、名刺交換枚数についてはランダムに抽出した参考サンプル(データサイエンティストに該当しない人)と特に大き

    な違いがないことが分かった。参考サンプルと比較してデータサイエンティストの名刺交換枚数がそれほど少なくないことが 分かり、他社との交流を進めていることがうかがえる。 第二に、名刺交換相手の所属部署を見ると、参考サンプルと比べてIT関連部署の割合が高い。データサイエンティストは、 ITエンジニアが担うことが多く、IT関連部署で働く人と交流をする機会が多いものと推察できる。 第三に、データサイエンティストの名刺交換枚数別に名刺交換相手の所属部署を見てみると、交換枚数が一定以上になると IT関連部署の割合がやや低下し、他の部署との交換割合がやや高まっている。他社と積極的に交流している人ほど、いろい ろな所属部署の人たちと幅広く交流していることが分かった。 冒頭で述べたように、データサイエンティストのニーズが高まる一方で、データサイエンティストとして求められるスキル は多岐にわたる。そのため、データサイエンティストとして他社の人材とどのように交流し、スキルや経験を身に付けていく かが、今後ますます重要になってくるだろう。他社との交流を積極的にしている人ほど、IT関連の部署だけでなく幅広く交 流しているという相関関係が見られたものの、データサイエンティストとして活躍するためにどのような人脈を形成していけ ばよいのか、といった点は今後の課題となった。引き続き研究を進め、改めて分析を行うこととする。 5 Reference 経済産業省(2016) 「IT人材の最新動向と将来推計に関する調査結果」 日経情報ストラテジー編(2013) 『日経BPムック データサイエンティスト完全ガイド』日経BP社
  5. 2018೥11݄9೔ ൃߦ ୲౰ݚڀһ ށా३ਔɹAkihito Toda Data Science Report © Sansan,

    Inc. ໰͍߹Θͤ Data Science Reportࣄ຿ہ ʢSansanגࣜձࣾ ٕज़ຊ෦಺ʣ [email protected] https://jp.corp-sansan.com/ ˞ຊࢽ͸౰ࣾαʔϏεͰఆΊΔར༻ن໿ͷڐ୚ൣғ಺Ͱಗ໊Խͨ͠σʔλΛ౷ܭతʹར༻ͯ͠ ͍·͢ɻ ˞ຊࢽ͸৘ใఏڙͷ໨తͷΈͷͨΊʹఏڙ͞ΕΔ΋ͷͰ͢ɻຊࢽΛར༻͞ΕΔํ͸ɺ ͦͷ࢖༻ʹ ͍ͭͯಠࣗʹධՁ͢Δ੹೚Λෛ͏΋ͷͱ͠ɺ ໌ࣔ·ͨ͸໧ࣔΛ໰Θͣͦͷਖ਼֬ੑɺ ׬શੑɺ ༗༻ ੑ౳ͷ͍͔ͳΔอূ΋ຊࢽʹ͸൐͍·ͤΜɻ ˞ܝࡌ͞Ε͍ͯΔ৘ใ౳͸࡞੒࣌఺ͷ΋ͷͰ͢ɻ ˞ຊࢽͷҰ෦͋Δ͍͸શ෦ΛແஅͰෳ੡ɺ సࡌɺ ෳࣸ͢Δ͜ͱΛې͡·͢ɻ