Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
有価証券報告書からデータ抽出した話
Search
homura
April 29, 2024
Technology
0
330
有価証券報告書からデータ抽出した話
M&Aクラウド・ROXX合同勉強会「LLMの事業活用勉強会」の資料
homura
April 29, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
事業貢献を考えるための技術改善の目標設計と改善実績 / Targeted design of technical improvements to consider business contribution and improvement performance
oomatomo
0
170
Yahoo! ズバトクにおけるフロントエンド開発
lycorptech_jp
PRO
0
110
[Oracle TechNight#85] Oracle Autonomous Databaseを使ったAI活用入門
oracle4engineer
PRO
1
160
[Ruby] Develop a Morse Code Learning Gem & Beep from Strings
oguressive
1
200
大規模言語モデルとそのソフトウェア開発に向けた応用 (2024年版)
kazato
1
160
スケールし続ける事業とサービスを支える組織とアーキテクチャの生き残り戦略 / The survival strategy for Money Forward’s engineering.
moneyforward
0
120
LINEスキマニにおけるフロントエンド開発
lycorptech_jp
PRO
0
360
Unlearn Product Development - Unleashed Edition
lemiorhan
PRO
2
140
AWS re:Invent 2024 Recap in ZOZO - Serverless で好きなものをしゃべってみた
chongmyungpark
0
490
MasterMemory v3 最速確認会
yucchiy
0
240
1等無人航空機操縦士一発試験 合格までの道のり ドローンミートアップ@大阪 2024/12/18
excdinc
0
190
ISUCON、今年も参加してみた / ISUCON, I challenged it again this year.
dero1to
0
110
Featured
See All Featured
How to Ace a Technical Interview
jacobian
276
23k
Six Lessons from altMBA
skipperchong
27
3.5k
Testing 201, or: Great Expectations
jmmastey
41
7.2k
Designing on Purpose - Digital PM Summit 2013
jponch
116
7k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
820
Rails Girls Zürich Keynote
gr2m
94
13k
The World Runs on Bad Software
bkeepers
PRO
66
11k
Fireside Chat
paigeccino
34
3.1k
RailsConf 2023
tenderlove
29
950
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Producing Creativity
orderedlist
PRO
342
39k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
3
190
Transcript
Copyright© M&Aクラウド 有価証券報告書からデータを ぶっこぬいた話 M&Aクラウド x ROXX 合同 LLMの事業活⽤勉強会 2024年4⽉24⽇ homura
Copyright© M&Aクラウド イントロダクション 2
Copyright© M&Aクラウド 3 ことの始まり(1年前) M&Aクラウド CTO 今年のハッカソンのテーマは、⽣成AIに 決まりました。 そこで、出てきたアイデアは実際に開発 し、業務で活⽤してもらいます。
へー、社内イベントでハッカソンなん て、やっているんだ。⾯⽩そう。 homura
Copyright© M&Aクラウド 4 ハッカソン当⽇(の様⼦は弊社ブログをご確認ください) 順位 詳細 出資シナジー⽣成 1位 出資企業と調達企業の組み合わせからも買収‧出資が成⽴ したときに期待されるシナジー⽂を⽣成
買収ニーズ作成 2位 IR情報から、買収ニーズを作成 発表したテーマ 当⽇の発表資料 M&A概要:以下の⽂書には、既存のアセットを活⽤し た新しい事業/プロダクトの開発、規律あるM&A戦略の 継続とグループ資本戦略の最適化の推進、グループ会 社とのシナジーによるインボイス戦略の推進、グルー プ各社のプロダクト、技術、⼈材を活⽤して、インボ イスシステムに関連する分野を中⼼に戦略を実施する など、M&A戦略に関する内容が含まれています。ま た、バックオフィス向けSaaSやHome Business / SaaS マーケティングなどの事業領域の拡⼤、福岡拠点担 当、Pay事業本部本部⻑、経理本部本部⻑などの役員紹 介も含まれています。 当⽇の成果物
Copyright© M&Aクラウド 5 ハッカソン後 M&Aクラウド CTO PJのリーダーがやめたので、 新しいリーダーは「尾村さん」 でお願いします。 え?
そのままPJリーダーとして、開発をやることになりました。
Copyright© M&Aクラウド 企画の検討 6
Copyright© M&Aクラウド 7 ハッカソンでやっていた時の課題点 - 定量的なデータとしてどの程度、効果が出そうかが不明 - ハッカソンではサンプル数2だった - 業務に使えるレベルで「買収ニーズ」を拾えているかは未検証
Copyright© M&Aクラウド 8 実際に他の資料でも試してみると。。。 M&Aに関する記述がまちまち。M&Aに関⼼ない企業だと、⼀切記述なし。 M&A戦略だけで1つの開⽰をしている 中期経営計画の本の⼀部に記述があるのみ ポート株式会社 M&A戦略に関する資料 出光興産株式会社
中期経営計画(2023年度~2025年度)
Copyright© M&Aクラウド 9 実際に他の資料でも試してみると。。。 ストロングバイヤーと⾔われる企業でも、書いてあることバラバラ。 株式会社SHIFT2023年8⽉期第2四半期決算説明会資料 株式会社エフ‧コード2022年12⽉期 通期決算説明資料
Copyright© M&Aクラウド 10 実際に他の資料でも試してみると。。。 そもそも買収ニーズって⾔っているけど、具体的にそれはなんだ? Aさん 投資予算がわかる といいよね Bさん 会社の成⻑戦略の
1つかな? Cさん 買収実績も 知りたい
Copyright© M&Aクラウド 11 実際に他の資料でも試してみると。。。 PDF資料なため、視覚的には理解できるが、PDFから抽出したテキストでは難しい。。。 © f-code Inc. All Rights
Reserved. 43CODE Marketing Cloud成⻑戦略: ②M&A -SaaS 事業と譲受プロダクト の期待シナジー M&A の実施によるプロダクトの獲得を通じて、 プロダクト群の強化 とクロスセリ ング によるシナジーを発揮 CODE プロダクト群拡張イメージ sincloEFO CUBEf-tra EFO GORILLA EFO 当期譲受の SaaS 事業 M&A 等による プロダクト拡張⾃社開発による プロダクト拡張‧機能追加商品強化 ‧提供プロダクト及びサービスの拡充 ‧CXデータの質および量の強化 営業強化 ‧当社既存顧客への譲受事業の提供 ‧譲受事業の顧客への当社既存サービスの提供SaaS 事業獲得のシナジー効果 SNS アプリ メール 広告…拡張候補のプロダクトイメージ hachi dori recitKaiU 43 株式会社エフ‧コード2022年12⽉期 通期決算説明資料 欲しいのここ 資料から抽出したテキスト文字列
Copyright© M&Aクラウド 12 ハッカソンでの課題の深掘りのまとめ - M&Aに関する記述がまちまち。 - 記述がある企業でも、書いてあることバラバラ(買収ニーズとは?) - PDF資料がデータソースのため、LLMが理解するのは難しい
Copyright© M&Aクラウド 13 そんな中、ある⽅との雑談中 資⾦調達アドバイザー 決算資料じゃ難しくない? 私はよく、有価証券報告書の 「経営⽅針、経営環境及び対処すべき課題等」 の項⽬をよくみるけど。 なるほど?
Copyright© M&Aクラウド 14 有価証券報告書を詳しく調べてみると ⼀定のまとまった⽂章が載っているので、使いやすい 1 【経営方針、経営環境及び対処すべき課題等】文中の将来に関する事項は、当連結会計年度末現在において、当社グループが判断したものです。〔経営方針〕当社グループは、「世界を フィールドに先進のICTをもって新しい価値を創造する」を企業理念として掲げています。グローバリゼーションや多様化する価値観から生まれる市場のニーズを汲み取り、先進のICTで新しい 価値を創造し続けることで、社会に貢献することを目指します。〔目標とする経営指標〕当社グループは、事業収益の継続的な拡大を通じて企業価値を向上させていくことを経営の目標としてお り、売上高、営業利益、経常利益、親会社株主に帰属する当期純利益を経営の指標として認識しています。また、現在進行中の中期経営計画を推し進めるため、2025年度の財務指標の目標
値として「ROE」に加え、「エクイティスプレッド」「DOE」を設定しました。〔中長期的な経営戦略〕CACグループは、1966年の創業以来、お客様の業界や業務に関する知識・技術を蓄積してIT サービスを提供しています。さらに海外展開も積極的に行い、グローバルで4,000名を超える従業員を有する企業グループに成長しました。変化が激しい昨今の状況を鑑み、短期的な変動に 左右されず持続的な成長を目指すため、本年度、当社グループは10年後のありたい姿としてCAC Vision 2030「テクノロジーとアイデアで、社会にポジティブなインパクトを与え続ける企業グ ループへ」を策定しました。CAC Vision 2030では、CACグループにおけるAIやIoT等のデジタル技術やデータを活用したソリューションにより人ならではの多様な想像力や創造力を発揮させ、 社会課題の解決につなげていくことを想定しています。そしてこのようなポジティブインパクトを与えるデジタルソリューションを定常的に生み出し成長させることで、高収益・高成長の企業グルー プとなることを目指していくものです。CAC Vision 2030の実現に向けた期間を、2022年度~2025年度までの前半(以降、「フェーズ1」)と、2026年度~2030年度までの後半(以降、「フェーズ 2」)とに分割します。フェーズ1は国内外における既存受託事業での安定した収益の確保とフェーズ2に向けて継続的にデジタルプロダクト&サービスを生み出す仕組みの構築を行う期間と し、フェーズ2ではフェーズ1での仕込みや努力の結果を得る期間と設定した上で、各フェーズにおいて中期経営計画を策定し、遂行していきます。CAC Vision 2030の実現に向けたフェーズ1 の中期経営計画では、国内外における既存受託事業での安定した収益の確保と、2026年度以降に向けてデジタルプロダクト&サービス創造のための準備として、「成長基盤の醸成」「高収益 化」「コーポレート機能の見直し、発展」の3つの戦略を中心に取り組んでいます。「成長基盤の醸成」は、既存事業の中心である受託事業を、内部資源の拡充を図りながら成長させることでダー との共創等によって継続的に新規事業を立ち上げていきます。また、人材採用を引き続き強化するとともに、技術者や次世代リーダーの育成、株式給付信託(J-ESO収益基盤の礎としつつ、新 規デジタルプロダクトやサービスを継続的に立ち上げる仕組みやビジネス基盤の構築を目指すものです。本年度は、新規事業を立ち上げるための仕組みや体制を整備し、採用活動にも注力し て人員強化につなげました。また、成長のために必要な投資を加速させるためにキャッシュ・アロケーションを策定すると同時に、事業投資の際のハードルレートの設定、撤退基準の厳格化な どの整備も実施しました。さらに、M&A推進のため、持株会社内にM&Aソーシング機能を持つ組織を設置しました。2023年度以降も、R&D強化やM&A、アライアンス、様々なステークホルP) の導入をはじめとした従業員エンゲージメント向上施策等にも取り組んでいきます。事業の整理や経営効率化を行うことで営業利益の改善を図る「高収益化」については、本年度は2024年度 以降の固定費削減の見通しをつけることができました。2023年度以降は、海外子会社の構造改革プロジェクトを一層推進していくことで、さらなる事業の高収益化を図ります。事業のガバナン ス強化と新規事業への理解や協力が生まれやすい仕組みの構築を目指す「コーポレート機能の見直し、発展」 については、グループ内体制やPDCAサイクルの見直しと強化、様々な組織風 土改革施策等を実施しました。2023年度以降もグループガバナンスの強化や組織風土改革を推進していきます。また、サステナビリティ経営についての議論を活発化させ、マテリアリティの特 定、サステナビリティ推進組織の設置、KPIの設定を行いました。当社グループにとっては人材が最重要資産であり、社員がそれぞれの能力を最大限に発揮して成長することが社会課題の解 決や当社グループの成長につながると捉え、社員にとって働き甲斐のある「選ばれる」職場環境となることを目指してサステナビリティ経営を推進してまいります。なお、中期経営計画の最終年 度となる2025年度の数値目標としては、売上高580億円、営業利益50億円、営業利益率8%以上、ROE10%以上を掲げておりましたが、より内外資金を効率的に活用し成長するため、「エク イティスプレッド2.5%以上」「DOE5%」を財務指標として追加しました。CAC Vision 2030では、経営層がCAC Vision 2030の実現にコミットし、サステナビリティを意識した経営に取り組み続け ることが求められます。また、社員の自ら考え自ら生み出す工夫や、仕事の成果を社員自身の成長につなげる意志、顧客と自社グループ双方の成長につなげる行動等が積み重なって達成す るものだと認識しています。CACグループ一丸となって取り組み、2030年度には売上高800億円、営業利益120億円、営業利益率15%以上の企業グループとなっていることを目標としておりま す。 例)株式会社CAC holdings 【経営⽅針、経営環境及び対処すべき課題等】 - ⼊⼒として、LLMで利⽤しやすい - M&Aについて⾔及されているものもある
Copyright© M&Aクラウド 15 有価証券報告書を詳しく調べてみると APIで有価証券報告書の全ての内容が取得できる ⾦融庁が運営する信頼できる(歴史がある)システム まず、ここに登録されるのでデータの鮮度も良い。 APIで取得すると、zipファイルで落とされてくる。
Copyright© M&Aクラウド 16 有価証券報告書を詳しく調べてみると 決まったフォーマットで提供されている XBRLというXMLベースの(謎の)⾔語(形式) (謎ではあるが)統⼀された形で取得できる
Copyright© M&Aクラウド 17 (pythonユーザー向け) yahooqueryというyahoo financeの⾮公式ラッパー 参考:財務情報の取得には? yahoo financeなどが、APIとして提供してくれていて使いやすいのでそれを使いましょう
Copyright© M&Aクラウド 18 有価証券報告書を利⽤する際の利点まとめ - 一定のまとまった文章が載っている - APIで有価証券報告書の全ての内容が取得できる - 決まったフォーマットで提供されている
Copyright© M&Aクラウド 19 また別の⽅と相談中 M&A アドバイザー 買収ニーズって⾔っているけど、対象企業がど のような業種やっているかだけいいのでは? え、そんなのでいいの?
Copyright© M&Aクラウド 20 やがて、私は考えるのをやめた
Copyright© M&Aクラウド 21 抽出する情報をシンプルな2つに変更 - 対象企業がM&Aに関⼼があるか(0~3点のスコアリング) - 既存事業と、今後の重点事業(とその他の取り組み)
Copyright© M&Aクラウド 実際に実装するにあたって 22
Copyright© M&Aクラウド 23 実際にどのような技術を使った? library language infrastructure 1. 実⾏環境はAWSを利⽤ 2.
LLMはAzure OpenAI Service 3. Langchainは利⽤しない
Copyright© M&Aクラウド 24 気になる点は? お⾦が⾼い! ⼀件あたりの⽣成で30円ぐらいかかる。 1年分(4,000件)を実⾏すると、それだけで12万円ほどかかる。 PDFファイルをページごとに解析させたり、 細かい情報を多段階で抽出したら、爆発的に増えるので注意。 時間がかかる!
1件あたり、3分ぐらいかかる。 有価証券報告書の提出が集中する6⽉に集中(2,500件) 1⽇あたり、400件ぐらい処理する必要がある⽇もある。
Copyright© M&Aクラウド 25 GPT3.5-turboとGPT-4の⽐較は?(精度) 株式会社フルキャストホールディングス 中期経営計画 P14 PDFファイルのページごとのM&Aニーズ有無安定 プロンプトとして、「M&Aに関連があるかを判定してください」と指⽰した結果 GPT3.5-turboだと取りこぼしが発⽣した
Copyright© M&Aクラウド 26 GPT3.5-turboとGPT-4の⽐較は?(精度以外) - お⾦は安い - 実⾏速度も早い - フォーマットを守らないことが多い
例) ⽇本語で回答しない、「カンマ」で区切ってくれない GPT4で⼗分精度が出たら、GPT3.5-turboでより効率的にできないか検討したい
Copyright© M&Aクラウド 27 プロンプトはどのようなもの? 有価証券報告書の【経営⽅針、経営環境及び対処すべき課題等】での記載が与えられます、その資料中の記載から判断して、M&Aへの関⼼ 度についてあなたの⾃信度を4段階で評価してください。 ### M&Aとは M&Aは、合併と買収のことで、企業が成⻑、拡⼤、または効率化を図るために他の企業を合併したり買収したりする戦略を指します。 -
合併:これは⼆つ以上の企業が⾃発的に協⼒して、⼀つの新しい企業を形成するプロセスです。 - 買収:これはある企業(買収者)が他の企業(買収対象)を買い取り、その所有権を取得するプロセスです。 ### 制約条件(必ず守ってください) - 回答は必ず、0,1,2,3のどれかで⾏なってください。 - M&Aへの⾔及がない場合は0、少しでもM&Aに関連する事項が書かれている場合は1を、少なくともM&Aを進めようとしている場合2を、 積極的にM&Aに⾔及がある場合、3としてください。 - 回答の先頭は必ず評価値で始めてください。 - 付加的な情報がある場合、コロンで区切ってください。 - ⾃信がある⽅から、⾼い数字(3)を使ってください。 - 回答は必ず、⽇本語で⾏なってください。それ以外の⾔語は使⽤禁⽌です。 ### 例 以下のような⽂章が存在する場合、2点と評価してください。 「当社内で新しい取り組みを進めると同時に、M&Aによる成⻑機会についても引き続き検討をしていきます。」 ### 回答例 2:この企業はM&Aへの関⼼度があります。 ################# ### 与えられる情報 ${text} 前提条件 制約条件 回答例
Copyright© M&Aクラウド まとめ 28
Copyright© M&Aクラウド 29 元データ:有価証券報告書 事業セグメント 作成データ M&A関⼼度:4段階評価 3:この企業は積極的なM&Aの推進を重点戦略項目として掲げてお り、M&Aへの関心度が高い 事業セグメント
既存事業領域:パッケージベースSI・サービス, ITサービス, クラウド化, DX(デジタ ルトランスフォーメーション)ビジネス 重点事業領域:DX(デジタルトランスフォーメーション)ビジネス その他の取り組み: M&Aの推進, 業務提携先との連携強化 , 直ユーザ取引拡大と 得意分野の強化, 既存SI分野の売上拡大, 新技術・高度技術への対応力強化 , ローコード開発やアジャイル開発等の新デジタル技術人材の技術習得 , クラウド技 術習得, 優秀な人材の確保, 人材育成の強化, プロジェクトマネジメント力の強化 , 品質の向上と安定的な収益確保 , グループシナジーの追求 , サステナビリティへの 取り組み 実際に作成したものがこちら
Copyright© M&Aクラウド 30 最後に - 雑談しましょう。思わぬところに解決策があるかも。 - LLMでもデータソースは重要 - おもちゃみたいに思える結果でも、案外役に立つのかも
Copyright© M&Aクラウド 31 じつは
Copyright© M&Aクラウド 32 開発のほぼ終盤で、画像⼊⼒ができるGPT-4Vが出てきた プロンプトの調整や入れ方を工夫すれば、 もっと具体的なニーズを得ることできそう。
Copyright© M&Aクラウド 33 以上