Slide 1

Slide 1 text

何の画像か当てちゃるbot 開発作品紹介 発表者:静岡⼤学情報学部情報科学科3年 ⽵下拓秀

Slide 2

Slide 2 text

⾃⼰紹介(⼗進同好会について) メンバー ⽵下拓秀(静岡⼤学 情報学部) 友⼈K(◯◯⼤学 医学部医学科) ⼗進同好会とは 世界⼀愛されてもおかしくないプログラミング⾔語、⼗進BASICに魅せられてプログラミングを 始めた某中学校吹奏楽部OBのみが参加できる⾮常に敷居の⾼い同好会

Slide 3

Slide 3 text

作品概要 何の画像か当てちゃるbot botに対してリプで画像を送るとその画像が 何の画像かを考えて返してくれる。 この有名⼈誰だっけ、、、や、これって何て名前だっけ、、、 という⽇常の悩みを解決。 ちなみに⻑崎弁を操ります。

Slide 4

Slide 4 text

技術的な話 開発⾔語:python 使⽤API:Twitter API(Twython経由)

Slide 5

Slide 5 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ①

Slide 6

Slide 6 text

技術的な話 ①リプを発⾒ cron(⾃動実⾏するためのデーモンプロセス) により1分ごとにリプを確認。

Slide 7

Slide 7 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ① ②

Slide 8

Slide 8 text

技術的な話 ②画像URLの抽出 画像検索⽤のURLを抽出する。 Twitter APIを使⽤。

Slide 9

Slide 9 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ① ② ③

Slide 10

Slide 10 text

技術的な話 ③Google画像検索にかける requestにより検索にかける。 ※ヘッダー情報の中のUser-Agentを設定しないと検索結果を返 してくれなかったのでChromeに設定。

Slide 11

Slide 11 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ① ② ③ ④

Slide 12

Slide 12 text

技術的な話 ④検索結果ページをスクレイピング 検索結果ページのHTMLデータを正規表現を⽤いて⽇本語の部分 だけを切りだしてリストに格納。

Slide 13

Slide 13 text

技術的な話

Slide 14

Slide 14 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ① ② ③ ④ ⑤

Slide 15

Slide 15 text

技術的な話 ⑤最頻出単語を答えとして採⽤ リストの中の語句から、最も多く出現する単語が恐らくその画像 を説明してくれると決め打ち。

Slide 16

Slide 16 text

技術的な話 botの動き リプを発⾒ ↓ 画像URLを抽出 ↓ Google画像検索にかける ↓ 検索結果ページをスクレイピング ↓ 最頻出単語を答えとして採⽤ ↓ 返信 ① ② ③ ④ ⑤ ⑥

Slide 17

Slide 17 text

技術的な話 ⑥返信 ⻑崎弁に乗せて答えを発信。

Slide 18

Slide 18 text

サーバーの話 常時動かすためにやっていること ★無料レンタルサーバー「XREA(エクスリア)」 pythonが使える!、、、、でも、cronが使えない! ★cron-job 定期的に指定URLにリクエストを送るサービス

Slide 19

Slide 19 text

これの何が画期的か ・学習していないデータも判別可能! 例えば、、、 Microsoft Azure Computer Vision APIとか 学習済みの有名⼈なら名前が出るけど、、、 底辺YouTuberの名前とか絶対出ない。

Slide 20

Slide 20 text

他の技術との融合 画像認識 Web スクレイピング ⾃然⾔語処理

Slide 21

Slide 21 text

ぜひフォロー、拡散、利⽤を。 何の画像か当てちゃるbot @namaoshi_bot

Slide 22

Slide 22 text

ご静聴ありがとうございました。 気が向いたらQiitaにまとめようと思います。