Slide 1

Slide 1 text

無料版Copilo × Google Colabで PDFデータを分析してみよう!! 2024/9/25 工藤 真理子

Slide 2

Slide 2 text

名前:工藤 真理子 言語: VBA、Python、SQL 好きなこと:美味しいものを食べながらおしゃべりすること 好きな音楽:椎名林檎、東京事変 業務:とあるサービス会社でデータ周りのことをやっています X: https://x.com/kudou32323 ブログ: Kの備忘録(仮) 技術同人誌: Excel VBA 配列入門 自己紹介

Slide 3

Slide 3 text

MSとGoogleの力を借りて 無料で何ができるのかの模索をしてみた ↓ 手軽なところでは、 無料版CopilotとGoogle colabが使える!! ※Google colab:Googleのサーバー上でPythonを実行できる環境。ブラウザで操作が可能。 参考①: https://colab.research.google.com/?hl=ja 参考②: 【Colab 入門】Google Colaboratory とは?使い方・メリットを徹底解説!

Slide 4

Slide 4 text

お題 楽天の2023年度の1Q~4Qの決算短信の PDFデータを読み取って 傾向をPythonで分析してみよう!!

Slide 5

Slide 5 text

注意 Copilotの調子によっては 期待通りの回答が得られない場合や 正しい結果を得られない可能性があります。 本日の発表内容については ご自身の責任の範囲でご利用ください。

Slide 6

Slide 6 text

手順 ①決算短信のPDFをダウンロードする ②EgdeでPDFを開く ③CopilotでPDFの内容を読み取る ④Copilotで出力結果をjson型で作る ⑤Copilotで分析用のPythonのコードを作る ⑥Google colabにコードを貼り付けて実行する ※Copilotの出力が微妙な時は、会話をつづけて新しい回答をもらったり、 新しいチャットにしたりしてほしい回答をもらってください

Slide 7

Slide 7 text

①決算短信のPDFをダウンロードする 2023年度決算短信・説明会資料|楽天グループ株式会社 (rakuten.co.jp)

Slide 8

Slide 8 text

②EgdeでPDFを開く

Slide 9

Slide 9 text

プロンプトは「今開いているPDFを日本語で要約してください」でやってみます。 1~4Qの分、4回同じプロンプトで先にPDFの内容を読み取り、3か月ごとの決算の比較をします。 ※Copilotの機嫌がよくないときは、1回ずつメモに内容を転記してください。 ※数字のマイナスをつけていない場合はメモに転記したときに「-」を書き足してください。 ③CopilotでPDFの内容を読み取る

Slide 10

Slide 10 text

④Copilotで出力結果をjson型で作る

Slide 11

Slide 11 text

⑤Copilotで分析用のPythonのコードを作る

Slide 12

Slide 12 text

⑥Google colabにコードを貼り付けて実行する

Slide 13

Slide 13 text

⑥Google colabにコードを貼り付けて実行する エラーが出たら、Copilotにエラー内容を貼り付けて修正してもらってください。 今回はCopilotの機嫌が悪く、正しい日本語対応のコードは生成できませんでした・・・。

Slide 14

Slide 14 text

おまけ 正しいコードで出力すると・・・ 四半期ごとの傾向がわかる ・売上収益は一定の金額で安定して上がっている ・営業損失はマイナススタートで、一定の金額で下がっている ・四半期純利益ははマイナススタートで、特に3-4Qで顕著に下がっている

Slide 15

Slide 15 text

結論 Copilotの機嫌によっては、 苦戦してしまうかもしれない・・・。 (最近ご機嫌斜めという情報が) 調子が良いときは、PDFから欲しい情報を抜粋して、 Pythonで分析が手軽にできます!! JSONファイルさえ作れたら何とかなりそう。

Slide 16

Slide 16 text

ご清聴ありがとうございました!!