Data Science Report 13 - 転職市場でアドバンテージを持つ業界は何か / DSR13

Yutaka Kuroki, Shohei Usui R&D Department Researcher, Engineering Division, Sansan,
Inc. Data Science Report 転職市場でアドバンテージを持つ業界は何か 13

Data Science Report 01　|　 © Sansan, Inc. 転職市場でアドバンテージを持つ業界は何か 1　概要 1.1　はじめに
近年、日本の中途採用市場はますます活発になってきている。厚生労働省の2019年雇用動向調査[1] によると、2019年に転職をした人は過去最多となっており、その数は約351万人に上る。その増加率は若年層で特に顕著であり、2018年から2019 年にかけての就業者数に占める転職者数の割合（転職者比率）は、15歳から24歳で12.3％の増加、25歳から34歳で7.8％の増加となっている。また、35歳以上でも緩やかな上昇傾向が続いている。雇用動向調査では転職の理由も調べられているが、これまで長らく2番目に多かった「会社都合」による退職は減少傾向で推移し、 3番目に落ち込んでいる。反対に、最も多い「より良い条件の仕事を探すため」の退職は8年連続で増加しており、全体に占める割合も2019年で過去最多となっている。これらの傾向は、これまで日本国内では支配的であった終身雇用慣行の形態が変化してきていることを示唆している。雇用慣行の変化に関する既存研究はいくつか存在する。例えば濱秋らは、1989年からの賃金構造基本統計調査を分析し、若年層では特に2000年代初頭から終身雇用者比率が低下していること、補完的関係にある年功賃金と終身雇用が同時に衰退していることなどを示している[2]。また、神林は日本的雇用慣行に関する既存研究をサーベイし、従来の雇用慣行が崩壊するほどではないとしながらも、長期雇用型慣行や年功賃金体系が変化していることを認めている[3]。以上から、雇用慣行の変化と転職市場の活性化が同時に起きていることは明らかであり、その実態を把握することは重要である。特に、個々の転職から成る解像度の高いデータを用い、どのような企業や業界が転職市場におけるアドバンテージを有しているのかを特定することの意義は非常に大きい。例えば、高いアドバンテージを有する企業・業界を特定することができれば、労働者を引きつける雇用慣行を明らかにする手掛かりとなるだろう。 1.2　アドバンテージの推定分析の単純なアプローチとして、業界ごとの流出入やその割合を集計することが挙げられるが、2つの大きな問題がある。 1つ目は、転職という事象を企業単位で考えた際、労働者を引きつけ採用する力と、逆に保持（リテンション）する力の綱引きによって成り立っていると考えられることである。例えば周辺に人気企業がある場合とない場合では、候補者を採用する難易度が異なることが考えられるが、転職者数の集計では、このような競合のメカニズムを考慮することはできない。2つ目は、転職市場で競合する企業の数や程度はその企業の特性・業界によってさまざまであり、流入者数や流出者数もそれに大きく左右されると予想されることである。実際に2章で示すように、幅広い業界と人材を奪い合う企業が存在する一方で、ほとんどの転職が特定の業界との間でのみ行われている企業も存在する。つまり、ある1単位の競合があった際にどの程度アドバンテージがあるかが興味の対象であり、これを割り引かない単純な集計では、特定の企業や業界を過大評価・過小評価してしまう恐れがある。さらに、転職市場において競合している程度を定量的に測ることができない、という問題も避けることができない。そのため、集計とは別のアプローチで、上記の問題を考慮したアドバンテージを考える必要がある。そこで本分析では、スポーツやゲームの分野で盛んに研究されてきたレーティング分析を転職市場に適用し、「採用力」や「リテンション力」から成るアドバンテージを定量化した。スポーツのレーティング分析を応用したのは、転職市場における採用力・リテンション力が、それぞれスポーツにおけるオフェンス力・ディフェンス力に対応すると考えたためである。そして、これらを推定できるレーティングアルゴリズムとして、 Masseyのレーティング[4] が知られており、本分析ではこれを用いた。また、転職ネットワークの埋め込み表現を作成することで、企業間の転職市場における競合状態を代替し、これをレーティング分析で用いた。

Data Science Report 02　|　 © Sansan, Inc. 2　分析対象本分析では、Sansan株式会社が提供する名刺アプリ「Eight」において、2015年から2020年10月に観測された転職データを扱う。分析に当たっては、
Eightのデータについて個人を匿名化し、 2015年1月1日から2020年10月31日までにEightのユーザーによって登録された名刺の情報をEightの利用規約で許諾を得ている範囲において使用する。転職データの作成は、Eight に登録された名刺の履歴から所属企業の遷移を抽出することで行う。この際、グループ企業への出向は転職市場の分析を行う上でノイズとなるため除去した。また、企業の業界分類にはBaseconnect株式会社の提供する区分を用いる。分析する転職データを企業間の重複あり有向ネットワークと捉え、そのネットワーク基本統計量を表1に示した。また、転職ネットワークの次数、入次数、出次数の累積分布をそれぞれ両対数グラフとして図1に、各ノードの入次数と出次数の散布図を図2に示した。表1：転職ネットワークの基本統計量図1から、次数分布はべき分布に近くなっており、観測された転職ネットワークはスケールフリー性を有していることが分かる。また図2から、入次数と出次数は非常に強く相関しており、流入者数と流出者数はいずれの企業でもほぼ等しくなることが分かる。図1：転職ネットワークの次数分布（両対数）ノード数エッジ数平均次数クラスター係数次数相関次数分布のべき指数 value 1981 191779 19.283 0.05 0.026 1.513 ೖ࣍਺ ग़࣍਺ ࣍਺ 1 10 100 1000 1 10 100 1000 1 10 100 1000 1eʵ04 1eʵ03 1eʵ02 1eʵ01 1e+00 ࣍਺ ྦྷੵ֬཰

Data Science Report 03　|　 © Sansan, Inc. 図2：転職ネットワークの入次数と出次数の散布図競合の程度を考慮することの参考情報として、転職データの具体例を挙げる。実際に2業界を取り上げ、それぞれの業界に所属する企業の流出入の割合を棒グラフとして図3に示した。エンタメ業界は「その他業界」との流出入が平均的に多いこと
が目立つが、企業によるばらつきが激しいことも分かる。一方、ゲーム業界では同業界間での転職が多く、企業によるばらつきもエンタメ業界ほどではないことが分かる。このように、転職市場における他社との競合状態は業界によって違いがあり、さらに企業によってもさまざまである。図3：エンタメ業界とゲーム業界における、各業界（大分類）に対する流出入者割合の平均値企業の採用力・リテンション力の推定に関しては、企業当たり一定数の転職データを確保するため、上記期間内に転職による流出入が100人以上行われた3390社を対象とした。また、競合状態として用いる転職ネットワークの埋め込み空間の作成には、全転職データを用いた。 0 200 400 600 0 200 400 600 ೖ࣍਺ ग़࣍਺ Τϯλϝۀք ήʔϜۀք 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.1 0.2 0.3 0.4 0.5 IT ΞύϨϧɾඒ༰ ΤωϧΪʔ Τϯλϝ ήʔϜ ίϯαϧςΟϯά ͦͷଞαʔϏε ͦͷଞۀք Ϛείϛ ෆಈ࢈ ਓࡐ Խֶ ҩྍɾ෱ࢱ ঎ࣾ ֎৯ ઐ໳αʔϏε খച ޿ࠂ ݐઃɾ޻ࣄ ڭҭ ػց ػցؔ࿈αʔϏε ੜ׆༻඼ ࣗಈंɾ৐Γ෺ ੡଄ ௨৴ ௨৴ػث ӡ༌ɾ෺ྲྀ ۚ༥ ిؾ੡඼ ৯඼ ׂ߹ ૬खاۀͷۀք ※ エラーバーは 5％点から 95％点の区間を表す。

Data Science Report 04　|　 © Sansan, Inc. 3　分析方法 3.1　Massey レーティング
スポーツやゲームの分野では、プレーヤーやチームの強さを定量的に評価するため、レーティングアルゴリズムの開発が盛んに行われてきた。中でも、Masseyレーティング[4] は、正規方程式に基づいたシンプルなレーティングアルゴリズムとして、さまざまな場面で用いられている。また、Masseyのアルゴリズムによって推定されたレートは、ネットワーク中心性の一つであるKatz中心性とも関連する[5]。 Masseyのレーティングでは、ある試合の得点差が、試合を行ったプレーヤー間のレーティング差に誤差項が加わったものと仮定する。つまり、推定されたレーティングは、異なるプレーヤーが1試合行ったときの期待される得点差として解釈することができる。いま、プレーヤー集合を{1,2,…,n}とし、さまざまな組み合わせで異なる2プレーヤーによって試合が行われているとする。また、プレーヤー i, jによって行われた試合l (l =1,2,…,L)において、iのjに対する得点差をy(i, j) l と表す。この状況において、Masseyのレーティングは式（1）で表される。ここで、 ri ,rj はプレーヤーi,jのレーティングであり、 εl は独立同分布な観測誤差である。全試合をまとめて表記するため、試合ごとの点差ベクトルy、試合のマッチを表すL × nの行列Xを用意する。レーティングベクトルをr=(r1 ,…,rn )T とすれば、nプレーヤーによってL試合行われた場合、その結果はXr=y+εと表すことができる。正規方程式によって、ここで未知のレーティングベクトルrは式（3）のように推定することができる。さらにM=XTX, p=XTyとし、各プレーヤーをノード、試合をエッジと見なすと、Xの定義から、Mはグラフラプラシアンと分かる。グラフラプラシアンは特異行列であり逆行列を持たないが、MasseyはMの任意の1行を1に、対応するyの成分を0にすることでこの問題を回避している[4]。これは、推定されるレーティングベクトルr̂ の平均値を常に0にすることに相当し、本分析でも同様の作業を行った。 Masseyのレーティングの性質については、いくつかの先行研究が存在する。Chartierらは、理想的な状況下で、レーティングアルゴリズムの番狂わせに対する感度を調査している[6]。ここでの理想的な状況とは、プレーヤーi,j(i<j)による試合ではiがjにj−i点差で勝利するという状況であり、逆転時にはjがiにj−i点差で勝利する。Masseyのレーティングと PageRankの比較結果では、PageRankの方が感度が高く、逆転の影響を大きく受けることを解析的に示している。また、 Masseyのレーティングは静的なアルゴリズムであるが、その時系列拡張も研究されている[7]。 r ˆ = (XTX)−1XTy y ≔ (yl , …, yL)T= ∑ ∑ (yij, …, yij ) i=1 n−1 j=i+1 n 1 L X ≔ [xl,i ]l=1,… ,L,i=1,…,N, xl,i = 1 i and j matched at game l (i<j), 0 Otherwise xl,j = −1 i and j matched at game l (i<j), 0 Otherwise yl(i,j) = ri − rj + ɛl i and j matched at game l 0 i and j did not match at game l 式（1）式（2）式（3）

Data Science Report 05　|　 © Sansan, Inc. 3.2　オフェンス力・ディフェンス力の推定 Massey[4] は、
レーティングの推定だけでなく、プレーヤーのオフェンス力とディフェンス力の推定についても提案している。グラフラプラシアンMは、対角行列Tと非負対称行列Pを用いてM=T−Pと分解することができる。Tの i, i成分はプレーヤー i が行った合計試合数となり、Pのi, j 成分はプレーヤー i, jの行った試合数となる。オフェンス力とディフェンス力の推定では、さらに以下の2つを追加で仮定する。 1. 　オフェンス力oとディフェンス力dの合計がレートであり、r=o+dである。 2. 　各プレーヤーの総得点 fは自身のオフェンス力と相手のディフェンス力の差に由来し、総失点aは相手のオフェンス力と自身のディフェンス力の差に由来する。 1つ目の仮定から、XTXr=XTyは式（4）のように整理できる。さらに2つ目の仮定からTo−Pd=f, Td−Td= f−aであるので、すでに推定されたレーティングベクトルr̂を用いて式（5）のように推定することができる。 d ˆ = (T+P)−1 (Tr ˆ−f ), o ˆ = r ˆ −d ˆ To−Pd = f T(r−d)−Pd = f (T+P)d = Tr−f, ⇔ ⇔ 式（5） XTy XTXr = Mr = p (T−P)(o+d) = ( f−a) To−Po+Td−Pd = ( f−a) (To−Pd)+(Td−Po) = f−a ⇔ ⇔ ⇔ ⇔ 式（4）

Data Science Report 06　|　 © Sansan, Inc. 3.3　転職ネットワークの埋め込み表現による転職市場における競合状態 Masseyのレーティングの推定では、各プレーヤー同士の試合数が必要であるが、企業間の転職市場における試合数（競合の程度）は測ることができない。そこで本分析では、転職市場における試合を転職市場における「近さ」であるとし、離散的
な転職ネットワークを連続空間に埋め込み、その距離の逆数を試合数として用いることとした。ノード集合𝒱とエッジ集合Ɛから成るネットワークG=(𝒱,Ɛ)が与えられたとき、ノードi ∈𝒱をより低次元の空間に埋め込み、表現することはnode embeddingとよばれる。このとき、もとのネットワーク上でより「似ている」ノード同士は、埋め込み先の空間でもより「近い」ことが望まれる。ここで、任意のノードi ∈𝒱を連続空間に写像するエンコーダー ENC:i→zi ∈ ℝd ∀i ∈ [n], (d≪|𝒱|)を考えると、式（6）を満たすようにENCを最適化することがnode embeddingの目標である。ノード同士が「似ている」度合いを測るsimilarity(i,j)は定義する必要があり、さまざまなnode embeddingの手法が提案されている。一般に、大規模ネットワークのnode embeddingは膨大なメモリを要するが、現実的な計算資源と時間で実行可能なように工夫されたnode embeddingの手法とその実装として、PyTorch-BigGraph[8] が知られており、本分析でもこれを用いることとした。PyTorch-BigGraphは有向グラフや知識グラフの埋め込みにも対応しており、similarity(i, j)にはさまざまな関数を指定することができるが、本実験では内積を用いた。また、近年では深層学習を用いた手法も盛んに開発されている。これらnode embeddingのさまざまな特性についてはCai らの研究[9] などを参照されたい。 4　分析結果・考察対象である3390社の採用力とリテンション力の推定値を図4に示した。図4から、採用力とリテンション力の推定値は強い負の相関を持っており、採用力とリテンション力を同時に高く併せ持つ企業が少ないことが分かる。このことから、リテンション力が高い企業群は採用力が高くなく人材の流動が穏やかで安定的であり、逆に採用力の高い企業群ではリテンション力が高くなく人材の流動が激しい、という傾向があると解釈できる。また、図の右上に位置している一部の企業は、採用力もリテンション力も高く、その合計値である推定レーティングベクトルの高い企業である。これらの企業は、転職市場で競合する周辺企業に対しアドバンテージを持ち、成長中でかつ人材の流出も抑えられていると言える。図4：推定された採用力とリテンション力の散布図 ʵ0.12 ʵ0.08 ʵ0.04 0.00 0.00 0.04 0.08 0.12 ࠾༻ྗ Ϧςϯγϣϯྗ ENC = arg min ∑ similarity(ENC(i), ENC(j)) i,j∈ 式（6）

Data Science Report 07　|　 © Sansan, Inc. 業界の傾向を見るため、推定した採用力、リテンション力の業界ごとの平均を取り、
図5に示した。また、平均推定レーティングベクトルの上位10業界には業界名も併せて示した。つまり、これらの業界に属する企業は、転職市場で競合する他企業に比べて平均的に人材の流出を防ぎ、かつ人材を獲得する力を有しているということである。その中でも、保険業界や総合コンサルティング業界では特に流動性が高くなっていることや、クラウド・フィンテック業界が転職市場において突出して高いアドバンテージを有していることが分かる。図5：推定された採用力、リテンション力の業界ごと平均の散布図次に、本分析で使用したデータ期間と同期間における、労働人口の変化率を総務省統計局の労働力調査[10] から算出し、表2 に示した。区分が異なるため単純な比較はできないが、総合コンサルティング業界が該当する「学術研究・専門・技術サービス業」の増加率が最も高くなっていること、クラウド・フィンテック業界やWebサービス・アプリ運営業界が該当する「サービス業（ほかに分類されないもの）」、「情報通信業」が上位に来ていることなどから、労働人口の増減ともある程度一貫性のある分析になっていると考えられる。表2：分析対象と同期間における労働人口の変化率 Ϋϥ΢υɾϑΟϯςοΫ ૯߹ίϯαϧςΟϯά ͦͷଞۚ༥ؔ࿈αʔϏε Ϗϧݐઃ WebαʔϏεɾΞϓϦӡӦ ۭௐػث อݥ୅ཧళ ύιίϯɾεϚϗपลػثൢച େܕ঎ۀࢪઃɾެڞࢪઃݐઃ อݥ ʵ0.015 ʵ0.010 ʵ0.005 0.000 0.000 0.005 0.010 0.015 ࠾༻ྗ Ϧςϯγϣϯྗ 業界区分割合学術研究・専門・技術サービス業 111.6 サービス業（ほかに分類されないもの） 111.2 教育・学習支援業 109.9 情報通信業 109.6 宿泊業・飲食サービス業 109.4 金融業・保険業 107.8 医療・福祉 107.0 不動産業・物品賃貸業 106.6 生活関連サービス業、娯楽業 105.2 業界区分割合公務 104.3 運輸業・郵便業 103.3 製造業 102.3 卸売業・小売業 100.1 建設業 99.4 農業・林業 99.0 電気・ガス・熱供給・水道業 96.6 複合サービス事業 91.5 漁業 75.0 工業・採石業・砂利採取業 66.7

Data Science Report 08　|　 © Sansan, Inc. さらに、推定された企業ごとのレーティングベクトル、採用力、リテンション力と、流入者数、流出者数、超過流入率の関係を図6に示した。ここで、超過流入率=(流入数－流出数)/(流入数+流出数)であり、流出数と流入数は分析に使用した3390 社の間での転職人数である。図6から、採用力と流入者数は強い相関を持ち、リテンション力と流出者数は強い負の相関を持
つことが分かる。採用力が高ければ流入者が増え、リテンション力が高ければ流出を抑えられると考えられるため、これは直感に沿う結果である。しかし、それぞれの相関が非常に高いことから、本分析で導入したように採用力とリテンション力を推定することは、それぞれ流入出者数を単に集計することとほとんど相違ないことが分かる。一方で、これらの足し合わせであり、転職市場での競合企業に対するアドバンテージである推定レーティングベクトルは、超過流入率と中程度の相関を持つにとどまっている。直感的に対応する推定レーティングベクトルと超過流入率はある程度整合性を保ちつつ、超過流入率が0付近でも推定レーティングベクトルが高い企業や、逆に低い企業が存在することが分かる。図6：レーティング分析による推定値と流入出数の散布図 ࠾༻ྗ ਪఆϨʔςΟ ϯάϕΫτϧ Ϧςϯγϣϯྗ ྲྀೖऀ਺ ྲྀग़ऀ਺ ௒աྲྀೖ཰ ࠾༻ྗ ਪఆϨʔς ΟϯάϕΫ τϧ Ϧςϯγϣϯྗ ྲྀೖऀ਺ ௒աྲྀೖ཰ −0.025 0.000 0.025 0.050 0.00 0.04 0.08 0.12 −0.12 −0.08 −0.04 0.00 0 200 400 600 0 200 400 600 −1.0 −0.5 0.0 0.5 1.0 0 100 200 300 0.00 0.04 0.08 0.12 −0.12 −0.08 −0.04 0.00 0 200 400 600 0 200 400 600 −1.0 −0.5 0.0 0.5 1.0 Corr: −0.023 ྲྀग़ऀ਺ Corr: 0.214*** Corr: 0.179*** Corr: −0.923*** Corr: 0.191*** Corr: 0.996*** Corr: −0.928*** Corr: −0.185*** Corr: 0.916*** Corr: −0.996*** Corr: 0.928*** Corr: 0.377*** Corr: 0.122*** Corr: 0.0253 Corr: 0.114*** Note: .p<0.1;*p<0.05;**p<0.01;***p<0.001

Data Science Report 09　|　 © Sansan, Inc. ここでも業界ごとの傾向を見るため、超過流入率と推定レーティングベクトルの平均を業界ごとに算出し、図7に示した。図5でも示した推定レーティングベクトルの上位10業界は、いずれも超過流入率が正であり、中途採用市場において獲得した人材が流出した人材を上回っていることが分かる。
しかし、突出して推定レーティングベクトルの高いクラウド・フィンテック業界をはじめとして、推定レーティングベクトル上位の業界が超過流入率でも上位であるとは限らないことも見て取れる。この現象について解釈を行うため、分析に使用した埋め込み空間における業界間の距離に注目した。具体的には、各企業について得られた埋め込み表現zi を業界ごとに平均し、その後に業界間のユークリッド距離を得た。図7：推定されたアドバンテージと超過流入率の業界ごと平均の散布図 Ϋϥ΢υ ɾ ϑΟϯςοΫ ૯߹ίϯαϧςΟϯά ͦͷଞۚ༥ؔ࿈αʔϏε Ϗϧݐઃ WebαʔϏε ɾ ΞϓϦӡӦ ۭௐػث อݥ୅ཧళ ύιίϯɾεϚϗपลػثൢച େܕ঎ۀࢪઃɾެڞࢪઃݐઃ อݥ ʵ0.4 ʵ0.2 0.0 0.2 0.4 ʵ0.0025 0.0000 0.0025 0.0050 ਪఆϨʔςΟϯάϕΫτϧ ௒աྲྀೖ཰

Data Science Report 10　|　 © Sansan, Inc. 図8は、各業界について他の業界との平均距離を算出し、示したヒストグラムである。点線で併せて示した「クラウド・フィ
ンテック」業界の位置から、クラウド・フィンテック業界の企業は他業界の企業との距離が平均的に近いことが分かる。つまり、クラウド・フィンテック業界の企業は平均的に多くの他企業と競合しながらも、流出を抑えながら人材を獲得できていることを反映した結果であると考えられる。図8：埋め込み空間における、業界間の平均距離のヒストグラム以上のことから本分析は、競合の数や程度を考慮し、転職市場においてある競合の単位があった際の企業のアドバンテージを算出できていると考えられる。またその集計から、転職市場において平均的に高いアドバンテージを持つ業界を特定できたと考えられる。 Ϋϥ΢υ ɾ ϑΟϯςοΫ 0 20 40 60 1.5 2.0 2.5 3.0 ຒΊࠐΈۭؒʹ͓͚Δଞۀքͱͷڑ཭ͷฏۉ஋ ౓਺

Data Science Report 11　|　 © Sansan, Inc. 5　結論本分析では、採用力とリテンション力から成る、転職市場において企業の持つアドバンテージを定量化した。分析には正規方程式に基づいたシンプルなレーティングアルゴリズムであるMasseyのレーティングと、転職ネットワークの埋め込み表現
を用いた。転職市場での競合状況として、埋め込み空間での企業間の距離の逆数を用いることで、競合の数や程度を考慮し割り引いた。競合状況を考慮することによって、クラウド・フィンテック業界の企業が多くの他業界と競合しながらも突出して高いアドバンテージを持つことを特定できた。このような、アドバンテージ上位業界に着目することで、雇用慣行の変化や日本の労働状況をより詳細に把握できると考えられる。例えば、クラウド・フィンテック業界に着目し、どのようなスキルを持つ人材にとって魅力的な環境があるのかを調査することなどがあるだろう。本分析で使用した転職データはEightにおける所属企業の遷移を基に作成しており、推定は100回以上の転職が観測された企業に対してのみ行った。このように抽出したデータは必ずしも日本の労働市場の良い代表になっているとは限らず、分析結果にも影響を及ぼしている可能性には注意が必要である。また、今後の方針としては、上記のバイアスを補正するようにモデルを改良すること、今回推定した転職市場におけるアドバンテージをさまざまな経済的指標と照らし合わせて解釈性を高めていくこと、レーティングを時系列拡張して中長期的な業界の動向を示すことなどが挙げられる。 6　Reference [1] 厚生労働省, 「雇用動向調査」, https://www.mhlw.go.jp/toukei/list/9-23-1.html（参照 2020/10/28） [2] 濱秋純哉, 堀雅博, 前田佐恵子ほか, 「低成長と日本的雇用慣行—年功賃金と終身雇用の補完性を巡って」, 『日本労働研究雑誌』, 独立行政法人労働政策研究・研修機構, 2011, no. 611, pp. 26-37 [3] 神林龍, 「日本的雇用慣行の趨勢：サーベイ」, 『組織科学』, 組織学会, 2016, vol. 50, no. 2, pp. 4-16 [4] Kenneth Massey, “Statistical Models Applied to the Rating of Sports Teams”, Massey Ratings - Sports Computer Ratings, Scores, and Analysis, 1997, https://masseyratings.com/theory/massey97.pdf (accessed 2020/10/28) [5] Enrico Bozzo, and Massimo Franceschet, “The Massey's method for sport rating: a network science perspective”, arXiv, 2017/1/13, arXiv:1701.03363 (accessed 2020/10/28) [6] Timothy P. Chartier, Erich Kreutzer, Amy N. Langville and Kathryn E. Pedings, “Sensitivity and Stability of Ranking Vectors”, SIAM Journal on Scientiﬁc Computing, Society for Industrial and Applied Mathematics, 2011, vol. 33, no. 3, pp. 1077-1102 [7] Massimo Franceschet, Enrico Bozzo and Paolo Vidoni, “The temporalized Masseyʼs method”, Journal of Quantitative Analysis in Sports, De Gruyter, 2017, vol. 17, no. 2, pp. 37-48 [8] Adam Lerer, Ledell Wu, Jiajun Shen, Timothee Lacroix, Luca Wehrstedt, Abhijit Bose and Alex Peysakhovich, “PyTorch- BigGraph: A Large-scale Graph Embedding System”, arXiv, 2019/4/9, arXiv:1903.12287 (accessed 2020/10/28) [9] HongYun Cai, Vincent W. Zheng and Kevin Chen-Chuan Chang, “A Comprehensive Survey of Graph Embedding: Problems, Techniques, and Applications”, IEEE Transactions on Knowledge and Data Engineering, Institute of Electrical and Electronics Engineers, 2018, vol. 30, no. 9, pp. 1616-1637 [10] 総務省統計局, 「労働力調査」, https://www.stat.go.jp/data/roudou/index.html（参照 2020/10/28）

© Sansan, Inc. Data Science Report事務局（Sansan株式会社技術本部内） [email protected] https://jp.corp-sansan.com/
問い合わせ 2021年3月26日発行担当研究員黒木裕鷹 Yutaka Kuroki 臼井翔平 Shohei Usui ※本誌は当社サービスで定める利用規約の許諾範囲内で匿名化したデータを統計的に利用しています。 ※本誌は情報提供の目的のみのために提供されるものです。本誌を利用される方は、その使用について独自に評価する責任を負うものとし、明示または黙示を問わずその正確性、完全性、有用性等のいかなる保証も本誌には伴いません。 ※掲載されている情報等は作成時点のものです。 ※本誌の一部あるいは全部を無断で複製、転載、複写することを禁じます。 Data Science Report

Data Science Report 13 - 転職市場でアドバンテージを持つ業界は何か ...

Data Science Report 13 - 転職市場でアドバンテージを持つ業界は何か / DSR13

Sansan R&D

More Decks by Sansan R&D

Other Decks in Science

Featured

Transcript

Yutaka Kuroki, Shohei Usui R&D Department Researcher, Engineering Division, Sansan,

Data Science Report 01　|　 © Sansan, Inc. 転職市場でアドバンテージを持つ業界は何か 1　概要 1.1　はじめに

Data Science Report 02　|　 © Sansan, Inc. 2　分析対象本分析では、Sansan株式会社が提供する名刺アプリ「Eight」において、2015年から2020年10月に観測された転職データを扱う。分析に当たっては、

Data Science Report 04　|　 © Sansan, Inc. 3　分析方法 3.1　Massey レーティング

Data Science Report 05　|　 © Sansan, Inc. 3.2　オフェンス力・ディフェンス力の推定 Massey[4] は、

Data Science Report 07　|　 © Sansan, Inc. 業界の傾向を見るため、推定した採用力、リテンション力の業界ごとの平均を取り、

Data Science Report 10　|　 © Sansan, Inc. 図8は、各業界について他の業界との平均距離を算出し、示したヒストグラムである。点線で併せて示した「クラウド・フィ

© Sansan, Inc. Data Science Report事務局（Sansan株式会社技術本部内） [email protected] https://jp.corp-sansan.com/