Slide 1

Slide 1 text

Wikipedia × GASで 男役情報収集 自動化・IT活用ネタ|宝塚歌劇ファン達のライトニングトーク大会~初参加者大歓迎~ スクショ 投稿 ご自由に 2023.7.3(Mon)

Slide 2

Slide 2 text

やる気スイッチがオンになるとき5選 1.会社や上司からの指示 2.仕事上で必要になった時 3.自分自身ピンチに陥った時 4.楽しさ嬉しさを肌に感じた時 5.こんな風になりたいと憧れた時

Slide 3

Slide 3 text

IT推進者 ↯ やる気スイッチオン ↯ ITチャレンジ ↯ 仕事に活きる!

Slide 4

Slide 4 text

初観劇の感想 2023.3.12 憧れ ☟ やる気スイッチオン パンフレット ※念のためモザイク

Slide 5

Slide 5 text

男役の情報を集めてみよう ▼ 情報集めて一覧化しよう ▼ 公式データ群ある?なかった・・・ ▼ Wikipedia使ってみるか 今回の経緯 想い 目的 模索 手段 ※阪急電鉄さんwebページに 現在の各組一覧はあり

Slide 6

Slide 6 text

今回やったこと GAS スプレッドシート SPARQL エンドポイント SPARQL ① ②

Slide 7

Slide 7 text

Agenda 1.Wikipediaデータを知る 2.DBpediaを知る 3.RDFを知る 4.SPARQLを知る 5.GASで実装|実行

Slide 8

Slide 8 text

1.Wikipediaデータを知る 宝塚歌劇団の Wikipediaは存在 期別になってる・・・

Slide 9

Slide 9 text

1.Wikipediaデータを知る ※補足 クローリング ・・・ webを巡回し情報を収集 スクレイピング ・・・ web情報を抽出する

Slide 10

Slide 10 text

2.DBpediaを知る https://ja.dbpedia.org/page/宝塚歌劇団 構造化 データ dbo: や DBpedia-ja: は プレフィックス(※) ※ 長いURLやURIを短く表現するためのショートカット https://~page~ :ウェブページ https://~resource~ :データリソース DBpedia補足 Wikipedia DBpedia

Slide 11

Slide 11 text

2.DBpediaを知る https://ja.dbpedia.org/ Wikipediaから情報を抽出する際の問題の一つは、同じ概念で も異なるプロパティとして表現されることがあるということ。 例えば、「出身地」と「出生地」のように、同じ意味を持つ情 報でも、異なるテンプレートやラベルを使用して表現されるこ とがある。そのため情報の取得や処理の際に混乱がる生じる可 能性がある。DBpediaはウィキペディアの情報を統一されたデ ータセットとして提供することで、情報抽出問題の解決を目的 としている。

Slide 12

Slide 12 text

3.RDFを知る 主語(英: subject)述語(predicate)目的語(object)の3つの要素でリソースに関する 関係情報を表現し、これをトリプル(triple)と呼ぶ。 S P O ◀「トリプル」のイメージ ※Wikipediaより

Slide 13

Slide 13 text

3.RDFを知る RDBMS クエリ データ クライアント SQL テーブル形式 RDBMSの場合 RDF クエリ データ クライアント SPARQL トリプル形式 RDFの場合 ※これは イメージ

Slide 14

Slide 14 text

4.SPARQLを知る 例 ▼東京都のトリプル一覧 select distinct * where { ?p ?o . } ▼東京都出身の人物に関する情報を100件 select distinct * where { ?s dbo:birthPlace dbpedia-ja:東京都 . } LIMIT 100 ・distinct ・・・ 重複除外 ・? ・・・ 変数 ・LIMIT ・・・ 取得する件数 ※SQLと同様で様々な指定が可能 S P O 補足 https://www.w3.org/TR/sparql11-overview/ SPARQL概要

Slide 15

Slide 15 text

4.SPARQLを知る SPARQLクエリを受け取り、 結果を返してくれるウェブアドレス https://ja.dbpedia.org/sparql

Slide 16

Slide 16 text

5.GASで実装|実行 抽出結果格納先の一覧 実行用のボタン

Slide 17

Slide 17 text

5.GASで実装|実行 スプレッドシートIDは、スプレッドシートURLの ~ /d/ココの部分/~

Slide 18

Slide 18 text

5.GASで実装|実行 プレフィックス エンドポイント トリプル × 3

Slide 19

Slide 19 text

5.GASで実装|実行

Slide 20

Slide 20 text

5.GASで実装|実行 Q. なぜボタンを用意したの? A. ユーザーフレンドリー意識|「実行したぜ!」感の演出 GASエディタを呼び出さずにスプレッドシート上でパパっと実行したい ボタン上で右クリック 右上に三点リーダーが表示 ※GASのココがスクリプト名

Slide 21

Slide 21 text

5.GASで実装|実行

Slide 22

Slide 22 text

5.GASで実装|実行 https://comucal.co.jp/mitz20230703gas 今回のコード

Slide 23

Slide 23 text

5.GASで実装|実行(おまけ) GASエディタ上で「F1」 ➡ AppsScriptColor: GASエディタをダークモードにしたい Chrome拡張機能あります

Slide 24

Slide 24 text

Mitz(みっつ) 松岡 光隆 株式会社コミュカル 代表取締役 CEO  元ITエンジニア(10年以上)  COBOL ➡ Java ➡ JavaScript ➡ Python  IoTやブロックチェーン関連の開発経験  登壇経験 約100回  コミュニティイベント運営 500回以上  コミュニティ運営きっかけで起業 数百名から数千名のコミュニティがメイン 多いものでは1万人以上のコミュニティを 推進・サポート中

Slide 25

Slide 25 text

ご清聴ありがとうございました