Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Science Report 13 -  転職市場でアドバンテージを持つ業界は何か ...

Sansan R&D
March 26, 2021

Data Science Report 13 -  転職市場でアドバンテージを持つ業界は何か / DSR13

■ 転職市場でアドバンテージを持つ業界は何か

近年、終身雇用や年功序列といった日本型雇用慣行の変化に伴い、転職市場が活性化している。本稿では、どの業界が転職市場においてアドバンテージを持つかを分析する。業界・企業ごとに競合の程度や傾向はさまざまであることを考慮し、転職者数の単純な流出入ではなくレーティング分析とノードの表現学習を利用する。分析の結果、アドバンテージを持つ業界の多くは労働人口が増加していること、特にクラウド・フィンテック業界が多くの他業界と競合しながらも、突出して高いアドバンテージを持つことを特定した。

※ 当社サービスで定める利用規約の許諾範囲内で 匿名化したデータを統計的に利用しています。

■ R&Dの採用情報
https://media.sansan-engineering.com/randd

Sansan R&D

March 26, 2021
Tweet

More Decks by Sansan R&D

Other Decks in Science

Transcript

  1. Yutaka Kuroki, Shohei Usui R&D Department Researcher, Engineering Division, Sansan,

    Inc. Data Science Report 転職市場でアドバンテージを持つ業界は何か 13
  2. Data Science Report 01 |  © Sansan, Inc. 転職市場でアドバンテージを持つ業界は何か 1 概要 1.1 はじめに

    近年、日本の中途採用市場はますます活発になってきている。厚生労働省の2019年雇用動向調査[1] によると、2019年に転 職をした人は過去最多となっており、その数は約351万人に上る。その増加率は若年層で特に顕著であり、2018年から2019 年にかけての就業者数に占める転職者数の割合(転職者比率)は、15歳から24歳で12.3%の増加、25歳から34歳で7.8%の 増加となっている。また、35歳以上でも緩やかな上昇傾向が続いている。雇用動向調査では転職の理由も調べられているが、 これまで長らく2番目に多かった「会社都合」による退職は減少傾向で推移し、 3番目に落ち込んでいる。反対に、 最も多い「よ り良い条件の仕事を探すため」の退職は8年連続で増加しており、全体に占める割合も2019年で過去最多となっている。 これらの傾向は、これまで日本国内では支配的であった終身雇用慣行の形態が変化してきていることを示唆している。雇用 慣行の変化に関する既存研究はいくつか存在する。例えば濱秋らは、1989年からの賃金構造基本統計調査を分析し、若年層 では特に2000年代初頭から終身雇用者比率が低下していること、補完的関係にある年功賃金と終身雇用が同時に衰退してい ることなどを示している[2]。また、神林は日本的雇用慣行に関する既存研究をサーベイし、従来の雇用慣行が崩壊するほどで はないとしながらも、長期雇用型慣行や年功賃金体系が変化していることを認めている[3]。 以上から、雇用慣行の変化と転職市場の活性化が同時に起きていることは明らかであり、その実態を把握することは重要で ある。特に、個々の転職から成る解像度の高いデータを用い、どのような企業や業界が転職市場におけるアドバンテージを有 しているのかを特定することの意義は非常に大きい。例えば、高いアドバンテージを有する企業・業界を特定することができ れば、労働者を引きつける雇用慣行を明らかにする手掛かりとなるだろう。 1.2 アドバンテージの推定 分析の単純なアプローチとして、業界ごとの流出入やその割合を集計することが挙げられるが、2つの大きな問題がある。 1つ目は、転職という事象を企業単位で考えた際、労働者を引きつけ採用する力と、逆に保持(リテンション)する力の綱引 きによって成り立っていると考えられることである。例えば周辺に人気企業がある場合とない場合では、候補者を採用する難 易度が異なることが考えられるが、転職者数の集計では、このような競合のメカニズムを考慮することはできない。2つ目は、 転職市場で競合する企業の数や程度はその企業の特性・業界によってさまざまであり、流入者数や流出者数もそれに大きく左 右されると予想されることである。実際に2章で示すように、幅広い業界と人材を奪い合う企業が存在する一方で、ほとんど の転職が特定の業界との間でのみ行われている企業も存在する。 つまり、 ある1単位の競合があった際にどの程度アドバンテー ジがあるかが興味の対象であり、これを割り引かない単純な集計では、特定の企業や業界を過大評価・過小評価してしまう恐 れがある。さらに、 転職市場において競合している程度を定量的に測ることができない、 という問題も避けることができない。 そのため、集計とは別のアプローチで、上記の問題を考慮したアドバンテージを考える必要がある。 そこで本分析では、 スポーツやゲームの分野で盛んに研究されてきたレーティング分析を転職市場に適用し、 「採用力」 や 「リ テンション力」 から成るアドバンテージを定量化した。 スポーツのレーティング分析を応用したのは、 転職市場における採用力 ・ リテンション力が、それぞれスポーツにおけるオフェンス力・ディフェンス力に対応すると考えたためである。そして、これ らを推定できるレーティングアルゴリズムとして、 Masseyのレーティング[4] が知られており、 本分析ではこれを用いた。また、 転職ネットワークの埋め込み表現を作成することで、企業間の転職市場における競合状態を代替し、これをレーティング分析 で用いた。
  3. Data Science Report 02 |  © Sansan, Inc. 2 分析対象 本分析では、Sansan株式会社が提供する名刺アプリ「Eight」において、2015年から2020年10月に観測された転職データ を扱う。分析に当たっては、

    Eightのデータについて個人を匿名化し、 2015年1月1日から2020年10月31日までにEightのユー ザーによって登録された名刺の情報をEightの利用規約で許諾を得ている範囲において使用する。転職データの作成は、Eight に登録された名刺の履歴から所属企業の遷移を抽出することで行う。この際、グループ企業への出向は転職市場の分析を行う 上でノイズとなるため除去した。また、企業の業界分類にはBaseconnect株式会社の提供する区分を用いる。 分析する転職データを企業間の重複あり有向ネットワークと捉え、そのネットワーク基本統計量を表1に示した。また、転 職ネットワークの次数、入次数、出次数の累積分布をそれぞれ両対数グラフとして図1に、各ノードの入次数と出次数の散布 図を図2に示した。 表1:転職ネットワークの基本統計量 図1から、次数分布はべき分布に近くなっており、観測された転職ネットワークはスケールフリー性を有していることが分 かる。また図2から、入次数と出次数は非常に強く相関しており、流入者数と流出者数はいずれの企業でもほぼ等しくなるこ とが分かる。 図1:転職ネットワークの次数分布(両対数) ノード数 エッジ数 平均次数 クラスター係数 次数相関 次数分布のべき指数 value 1981 191779 19.283 0.05 0.026 1.513 ೖ࣍਺ ग़࣍਺ ࣍਺ 1 10 100 1000 1 10 100 1000 1 10 100 1000 1eʵ04 1eʵ03 1eʵ02 1eʵ01 1e+00 ࣍਺ ྦྷੵ֬཰
  4. Data Science Report 03 |  © Sansan, Inc. 図2:転職ネットワークの入次数と出次数の散布図 競合の程度を考慮することの参考情報として、転職データの具体例を挙げる。実際に2業界を取り上げ、それぞれの業界に 所属する企業の流出入の割合を棒グラフとして図3に示した。エンタメ業界は「その他業界」との流出入が平均的に多いこと

    が目立つが、企業によるばらつきが激しいことも分かる。一方、ゲーム業界では同業界間での転職が多く、企業によるばらつ きもエンタメ業界ほどではないことが分かる。このように、転職市場における他社との競合状態は業界によって違いがあり、 さらに企業によってもさまざまである。 図3:エンタメ業界とゲーム業界における、各業界(大分類)に対する流出入者割合の平均値 企業の採用力・リテンション力の推定に関しては、企業当たり一定数の転職データを確保するため、上記期間内に転職によ る流出入が100人以上行われた3390社を対象とした。また、競合状態として用いる転職ネットワークの埋め込み空間の作成 には、全転職データを用いた。 0 200 400 600 0 200 400 600 ೖ࣍਺ ग़࣍਺ Τϯλϝۀք ήʔϜۀք 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.1 0.2 0.3 0.4 0.5 IT ΞύϨϧɾඒ༰ ΤωϧΪʔ Τϯλϝ ήʔϜ ίϯαϧςΟϯά ͦͷଞαʔϏε ͦͷଞۀք Ϛείϛ ෆಈ࢈ ਓࡐ Խֶ ҩྍɾ෱ࢱ ঎ࣾ ֎৯ ઐ໳αʔϏε খച ޿ࠂ ݐઃɾ޻ࣄ ڭҭ ػց ػցؔ࿈αʔϏε ੜ׆༻඼ ࣗಈंɾ৐Γ෺ ੡଄ ௨৴ ௨৴ػث ӡ༌ɾ෺ྲྀ ۚ༥ ిؾ੡඼ ৯඼ ׂ߹ ૬खاۀͷۀք ※ エラーバーは 5%点から 95%点の区間を表す。
  5. Data Science Report 04 |  © Sansan, Inc. 3 分析方法 3.1 Massey レーティング

    スポーツやゲームの分野では、プレーヤーやチームの強さを定量的に評価するため、レーティングアルゴリズムの開発が盛 んに行われてきた。中でも、Masseyレーティング[4] は、正規方程式に基づいたシンプルなレーティングアルゴリズムとして、 さまざまな場面で用いられている。また、Masseyのアルゴリズムによって推定されたレートは、ネットワーク中心性の一つ であるKatz中心性とも関連する[5]。 Masseyのレーティングでは、ある試合の得点差が、試合を行ったプレーヤー間のレーティング差に誤差項が加わったもの と仮定する。つまり、推定されたレーティングは、異なるプレーヤーが1試合行ったときの期待される得点差として解釈する ことができる。いま、プレーヤー集合を{1,2,…,n}とし、さまざまな組み合わせで異なる2プレーヤーによって試合が行わ れているとする。また、プレーヤー i, jによって行われた試合l (l =1,2,…,L)において、iのjに対する得点差をy(i, j) l と表す。 この状況において、Masseyのレーティングは式(1)で表される。ここで、 ri ,rj はプレーヤーi,jのレーティングであり、 εl は独立同分布な観測誤差である。 全試合をまとめて表記するため、試合ごとの点差ベクトルy、試合のマッチを表すL × nの行列Xを用意する。 レーティングベクトルをr=(r1 ,…,rn )T とすれば、nプレーヤーによってL試合行われた場合、その結果はXr=y+εと表す ことができる。正規方程式によって、ここで未知のレーティングベクトルrは式(3)のように推定することができる。 さらにM=XTX, p=XTyとし、各プレーヤーをノード、試合をエッジと見なすと、Xの定義から、Mはグラフラプラシアン と分かる。グラフラプラシアンは特異行列であり逆行列を持たないが、MasseyはMの任意の1行を1に、対応するyの成分 を0にすることでこの問題を回避している[4]。これは、推定されるレーティングベクトルr̂ の平均値を常に0にすることに相 当し、本分析でも同様の作業を行った。 Masseyのレーティングの性質については、いくつかの先行研究が存在する。Chartierらは、理想的な状況下で、レーティ ングアルゴリズムの番狂わせに対する感度を調査している[6]。ここでの理想的な状況とは、プレーヤーi,j(i<j)による試 合ではiがjにj−i点差で勝利するという状況であり、逆転時にはjがiにj−i点差で勝利する。Masseyのレーティングと PageRankの比較結果では、PageRankの方が感度が高く、逆転の影響を大きく受けることを解析的に示している。また、 Masseyのレーティングは静的なアルゴリズムであるが、その時系列拡張も研究されている[7]。 r ˆ = (XTX)−1XTy y ≔ (yl , …, yL)T= ∑ ∑ (yij, …, yij ) i=1 n−1 j=i+1 n 1 L X ≔ [xl,i ]l=1,… ,L,i=1,…,N, xl,i = 1 i and j matched at game l (i<j), 0 Otherwise xl,j = −1 i and j matched at game l (i<j), 0 Otherwise yl(i,j) = ri − rj + ɛl i and j matched at game l 0 i and j did not match at game l 式(1) 式(2) 式(3)
  6. Data Science Report 05 |  © Sansan, Inc. 3.2 オフェンス力・ディフェンス力の推定 Massey[4] は、

    レーティングの推定だけでなく、 プレーヤーのオフェンス力とディフェンス力の推定についても提案している。 グラフラプラシアンMは、対角行列Tと非負対称行列Pを用いてM=T−Pと分解することができる。Tの i, i成分はプレー ヤー i が行った合計試合数となり、Pのi, j 成分はプレーヤー i, jの行った試合数となる。 オフェンス力とディフェンス力の推定では、さらに以下の2つを追加で仮定する。 1.  オフェンス力oとディフェンス力dの合計がレートであり、r=o+dである。 2.  各プレーヤーの総得点 fは自身のオフェンス力と相手のディフェンス力の差に由来し、総失点aは相手のオフェンス力 と自身のディフェンス力の差に由来する。 1つ目の仮定から、XTXr=XTyは 式(4)のように整理できる。 さらに2つ目の仮定からTo−Pd=f, Td−Td= f−aであるので、 すでに推定されたレーティングベクトルr̂を用いて式 (5) のように推定することができる。 d ˆ = (T+P)−1 (Tr ˆ−f ), o ˆ = r ˆ −d ˆ To−Pd = f T(r−d)−Pd = f (T+P)d = Tr−f, ⇔ ⇔ 式(5) XTy XTXr = Mr = p (T−P)(o+d) = ( f−a) To−Po+Td−Pd = ( f−a) (To−Pd)+(Td−Po) = f−a ⇔ ⇔ ⇔ ⇔ 式(4)
  7. Data Science Report 06 |  © Sansan, Inc. 3.3 転職ネットワークの埋め込み表現による転職市場における競合状態 Masseyのレーティングの推定では、各プレーヤー同士の試合数が必要であるが、企業間の転職市場における試合数(競合 の程度)は測ることができない。そこで本分析では、転職市場における試合を転職市場における「近さ」であるとし、離散的

    な転職ネットワークを連続空間に埋め込み、その距離の逆数を試合数として用いることとした。 ノード集合𝒱とエッジ集合Ɛから成るネットワークG=(𝒱,Ɛ)が与えられたとき、ノードi ∈𝒱をより低次元の空間に 埋め込み、表現することはnode embeddingとよばれる。このとき、もとのネットワーク上でより「似ている」ノード同士 は、埋め込み先の空間でもより「近い」ことが望まれる。ここで、任意のノードi ∈𝒱を連続空間に写像するエンコーダー ENC:i→zi ∈ ℝd ∀i ∈ [n], (d≪|𝒱|)を考えると、式(6)を満たすようにENCを最適化することがnode embeddingの目標 である。ノード同士が「似ている」度合いを測るsimilarity(i,j)は定義する必要があり、さまざまなnode embeddingの手法 が提案されている。 一般に、大規模ネットワークのnode embeddingは膨大なメモリを要するが、現実的な計算資源と時間で実行可能なように 工夫されたnode embeddingの手法とその実装として、PyTorch-BigGraph[8] が知られており、本分析でもこれを用いることと した。PyTorch-BigGraphは有向グラフや知識グラフの埋め込みにも対応しており、similarity(i, j)にはさまざまな関数を指 定することができるが、本実験では内積を用いた。 また、近年では深層学習を用いた手法も盛んに開発されている。これらnode embeddingのさまざまな特性についてはCai らの研究[9] などを参照されたい。 4 分析結果・考察 対象である3390社の採用力とリテンション力の推定値を図4に示した。図4から、採用力とリテンション力の推定値は強 い負の相関を持っており、採用力とリテンション力を同時に高く併せ持つ企業が少ないことが分かる。このことから、リテン ション力が高い企業群は採用力が高くなく人材の流動が穏やかで安定的であり、逆に採用力の高い企業群ではリテンション力 が高くなく人材の流動が激しい、という傾向があると解釈できる。また、図の右上に位置している一部の企業は、採用力もリ テンション力も高く、その合計値である推定レーティングベクトルの高い企業である。これらの企業は、転職市場で競合する 周辺企業に対しアドバンテージを持ち、成長中でかつ人材の流出も抑えられていると言える。 図4:推定された採用力とリテンション力の散布図 ʵ0.12 ʵ0.08 ʵ0.04 0.00 0.00 0.04 0.08 0.12 ࠾༻ྗ Ϧςϯγϣϯྗ ENC = arg min ∑ similarity(ENC(i), ENC(j)) i,j∈ 式(6)
  8. Data Science Report 07 |  © Sansan, Inc. 業界の傾向を見るため、 推定した採用力、 リテンション力の業界ごとの平均を取り、

    図5に示した。また、 平均推定レーティ ングベクトルの上位10業界には業界名も併せて示した。つまり、これらの業界に属する企業は、転職市場で競合する他企業 に比べて平均的に人材の流出を防ぎ、かつ人材を獲得する力を有しているということである。その中でも、保険業界や総合コ ンサルティング業界では特に流動性が高くなっていることや、クラウド・フィンテック業界が転職市場において突出して高い アドバンテージを有していることが分かる。 図5:推定された採用力、リテンション力の業界ごと平均の散布図 次に、本分析で使用したデータ期間と同期間における、労働人口の変化率を総務省統計局の労働力調査[10] から算出し、表2 に示した。区分が異なるため単純な比較はできないが、 総合コンサルティング業界が該当する「学術研究・専門・技術サービ ス業」の増加率が最も高くなっていること、クラウド・フィンテック業界やWebサービス・アプリ運営業界が該当する「サー ビス業(ほかに分類されないもの) 」 、 「情報通信業」が上位に来ていることなどから、労働人口の増減ともある程度一貫性の ある分析になっていると考えられる。 表2:分析対象と同期間における労働人口の変化率 Ϋϥ΢υɾϑΟϯςοΫ ૯߹ίϯαϧςΟϯά ͦͷଞۚ༥ؔ࿈αʔϏε Ϗϧݐઃ WebαʔϏεɾΞϓϦӡӦ ۭௐػث อݥ୅ཧళ ύιίϯɾεϚϗपลػثൢച େܕ঎ۀࢪઃɾެڞࢪઃݐઃ อݥ ʵ0.015 ʵ0.010 ʵ0.005 0.000 0.000 0.005 0.010 0.015 ࠾༻ྗ Ϧςϯγϣϯྗ 業界区分 割合 学術研究・専門・技術サービス業 111.6 サービス業 (ほかに分類されないもの) 111.2 教育・学習支援業 109.9 情報通信業 109.6 宿泊業・飲食サービス業 109.4 金融業・保険業 107.8 医療・福祉 107.0 不動産業・物品賃貸業 106.6 生活関連サービス業、娯楽業 105.2 業界区分 割合 公務 104.3 運輸業・郵便業 103.3 製造業 102.3 卸売業・小売業 100.1 建設業 99.4 農業・林業 99.0 電気・ガス・熱供給・水道業 96.6 複合サービス事業 91.5 漁業 75.0 工業・採石業・砂利採取業 66.7
  9. Data Science Report 08 |  © Sansan, Inc. さらに、推定された企業ごとのレーティングベクトル、採用力、リテンション力と、流入者数、流出者数、超過流入率の関 係を図6に示した。ここで、超過流入率=(流入数-流出数)/(流入数+流出数)であり、流出数と流入数は分析に使用した3390 社の間での転職人数である。図6から、採用力と流入者数は強い相関を持ち、リテンション力と流出者数は強い負の相関を持

    つことが分かる。採用力が高ければ流入者が増え、リテンション力が高ければ流出を抑えられると考えられるため、これは直 感に沿う結果である。しかし、それぞれの相関が非常に高いことから、本分析で導入したように採用力とリテンション力を推 定することは、それぞれ流入出者数を単に集計することとほとんど相違ないことが分かる。 一方で、これらの足し合わせであり、転職市場での競合企業に対するアドバンテージである推定レーティングベクトルは、 超過流入率と中程度の相関を持つにとどまっている。直感的に対応する推定レーティングベクトルと超過流入率はある程度整 合性を保ちつつ、超過流入率が0付近でも推定レーティングベクトルが高い企業や、逆に低い企業が存在することが分かる。 図6:レーティング分析による推定値と流入出数の散布図 ࠾༻ྗ ਪఆϨʔςΟ ϯάϕΫτϧ Ϧςϯγϣϯྗ ྲྀೖऀ਺ ྲྀग़ऀ਺ ௒աྲྀೖ཰ ࠾༻ྗ ਪఆϨʔς ΟϯάϕΫ τϧ Ϧςϯγϣϯྗ ྲྀೖऀ਺ ௒աྲྀೖ཰ −0.025 0.000 0.025 0.050 0.00 0.04 0.08 0.12 −0.12 −0.08 −0.04 0.00 0 200 400 600 0 200 400 600 −1.0 −0.5 0.0 0.5 1.0 0 100 200 300 0.00 0.04 0.08 0.12 −0.12 −0.08 −0.04 0.00 0 200 400 600 0 200 400 600 −1.0 −0.5 0.0 0.5 1.0 Corr: −0.023 ྲྀग़ऀ਺ Corr: 0.214*** Corr: 0.179*** Corr: −0.923*** Corr: 0.191*** Corr: 0.996*** Corr: −0.928*** Corr: −0.185*** Corr: 0.916*** Corr: −0.996*** Corr: 0.928*** Corr: 0.377*** Corr: 0.122*** Corr: 0.0253 Corr: 0.114*** Note: .p<0.1;*p<0.05;**p<0.01;***p<0.001
  10. Data Science Report 09 |  © Sansan, Inc. ここでも業界ごとの傾向を見るため、超過流入率と推定レーティングベクトルの平均を業界ごとに算出し、図7に示した。 図5でも示した推定レーティングベクトルの上位10業界は、いずれも超過流入率が正であり、中途採用市場において獲得し た人材が流出した人材を上回っていることが分かる。

    しかし、 突出して推定レーティングベクトルの高いクラウド ・ フィンテック 業界をはじめとして、推定レーティングベクトル上位の業界が超過流入率でも上位であるとは限らないことも見て取れる。 この現象について解釈を行うため、分析に使用した埋め込み空間における業界間の距離に注目した。具体的には、各企業に ついて得られた埋め込み表現zi を業界ごとに平均し、その後に業界間のユークリッド距離を得た。 図7:推定されたアドバンテージと超過流入率の業界ごと平均の散布図 Ϋϥ΢υ ɾ ϑΟϯςοΫ ૯߹ίϯαϧςΟϯά ͦͷଞۚ༥ؔ࿈αʔϏε Ϗϧݐઃ WebαʔϏε ɾ ΞϓϦӡӦ ۭௐػث อݥ୅ཧళ ύιίϯɾεϚϗपลػثൢച େܕ঎ۀࢪઃɾެڞࢪઃݐઃ อݥ ʵ0.4 ʵ0.2 0.0 0.2 0.4 ʵ0.0025 0.0000 0.0025 0.0050 ਪఆϨʔςΟϯάϕΫτϧ ௒աྲྀೖ཰
  11. Data Science Report 10 |  © Sansan, Inc. 図8は、各業界について他の業界との平均距離を算出し、示したヒストグラムである。点線で併せて示した「クラウド ・ フィ

    ンテック」業界の位置から、クラウド・フィンテック業界の企業は他業界の企業との距離が平均的に近いことが分かる。つま り、クラウド・フィンテック業界の企業は平均的に多くの他企業と競合しながらも、流出を抑えながら人材を獲得できている ことを反映した結果であると考えられる。 図8:埋め込み空間における、業界間の平均距離のヒストグラム 以上のことから本分析は、競合の数や程度を考慮し、転職市場においてある競合の単位があった際の企業のアドバンテージ を算出できていると考えられる。またその集計から、転職市場において平均的に高いアドバンテージを持つ業界を特定できた と考えられる。 Ϋϥ΢υ ɾ ϑΟϯςοΫ 0 20 40 60 1.5 2.0 2.5 3.0 ຒΊࠐΈۭؒʹ͓͚Δଞۀքͱͷڑ཭ͷฏۉ஋ ౓਺
  12. Data Science Report 11 |  © Sansan, Inc. 5 結論 本分析では、採用力とリテンション力から成る、転職市場において企業の持つアドバンテージを定量化した。分析には正規 方程式に基づいたシンプルなレーティングアルゴリズムであるMasseyのレーティングと、転職ネットワークの埋め込み表現

    を用いた。転職市場での競合状況として、埋め込み空間での企業間の距離の逆数を用いることで、競合の数や程度を考慮し割 り引いた。競合状況を考慮することによって、クラウド・フィンテック業界の企業が多くの他業界と競合しながらも突出して 高いアドバンテージを持つことを特定できた。このような、アドバンテージ上位業界に着目することで、雇用慣行の変化や日 本の労働状況をより詳細に把握できると考えられる。例えば、クラウド・フィンテック業界に着目し、どのようなスキルを持 つ人材にとって魅力的な環境があるのかを調査することなどがあるだろう。 本分析で使用した転職データはEightにおける所属企業の遷移を基に作成しており、推定は100回以上の転職が観測された 企業に対してのみ行った。このように抽出したデータは必ずしも日本の労働市場の良い代表になっているとは限らず、分析結 果にも影響を及ぼしている可能性には注意が必要である。また、今後の方針としては、上記のバイアスを補正するようにモデ ルを改良すること、今回推定した転職市場におけるアドバンテージをさまざまな経済的指標と照らし合わせて解釈性を高めて いくこと、レーティングを時系列拡張して中長期的な業界の動向を示すことなどが挙げられる。 6 Reference [1] 厚生労働省, 「雇用動向調査」, https://www.mhlw.go.jp/toukei/list/9-23-1.html(参照 2020/10/28) [2] 濱秋純哉, 堀雅博, 前田佐恵子ほか, 「低成長と日本的雇用慣行—年功賃金と終身雇用の補完性を巡って」, 『日本労働研究 雑誌』, 独立行政法人労働政策研究・研修機構, 2011, no. 611, pp. 26-37 [3] 神林龍, 「日本的雇用慣行の趨勢:サーベイ」, 『組織科学』, 組織学会, 2016, vol. 50, no. 2, pp. 4-16 [4] Kenneth Massey, “Statistical Models Applied to the Rating of Sports Teams”, Massey Ratings - Sports Computer Ratings, Scores, and Analysis, 1997, https://masseyratings.com/theory/massey97.pdf (accessed 2020/10/28) [5] Enrico Bozzo, and Massimo Franceschet, “The Massey's method for sport rating: a network science perspective”, arXiv, 2017/1/13, arXiv:1701.03363 (accessed 2020/10/28) [6] Timothy P. Chartier, Erich Kreutzer, Amy N. Langville and Kathryn E. Pedings, “Sensitivity and Stability of Ranking Vectors”, SIAM Journal on Scientific Computing, Society for Industrial and Applied Mathematics, 2011, vol. 33, no. 3, pp. 1077-1102 [7] Massimo Franceschet, Enrico Bozzo and Paolo Vidoni, “The temporalized Masseyʼs method”, Journal of Quantitative Analysis in Sports, De Gruyter, 2017, vol. 17, no. 2, pp. 37-48 [8] Adam Lerer, Ledell Wu, Jiajun Shen, Timothee Lacroix, Luca Wehrstedt, Abhijit Bose and Alex Peysakhovich, “PyTorch- BigGraph: A Large-scale Graph Embedding System”, arXiv, 2019/4/9, arXiv:1903.12287 (accessed 2020/10/28) [9] HongYun Cai, Vincent W. Zheng and Kevin Chen-Chuan Chang, “A Comprehensive Survey of Graph Embedding: Problems, Techniques, and Applications”, IEEE Transactions on Knowledge and Data Engineering, Institute of Electrical and Electronics Engineers, 2018, vol. 30, no. 9, pp. 1616-1637 [10] 総務省統計局, 「労働力調査」, https://www.stat.go.jp/data/roudou/index.html(参照 2020/10/28)
  13. © Sansan, Inc. Data Science Report事務局 (Sansan株式会社 技術本部内) [email protected] https://jp.corp-sansan.com/

    問い合わせ 2021年3月26日 発行 担当研究員 黒木 裕鷹 Yutaka Kuroki 臼井 翔平 Shohei Usui ※本誌は当社サービスで定める利用規約の許諾範囲内で匿名化したデータを統計的に利用して います。 ※本誌は情報提供の目的のみのために提供されるものです。本誌を利用される方は、 その使用に ついて独自に評価する責任を負うものとし、 明示または黙示を問わずその正確性、 完全性、 有用 性等のいかなる保証も本誌には伴いません。 ※掲載されている情報等は作成時点のものです。 ※本誌の一部あるいは全部を無断で複製、 転載、 複写することを禁じます。 Data Science Report