Slide 1

Slide 1 text

HFOTJNךאְַַ׋ )PXUPVTFHFOTJN ٽփٽׯƕ ӥڧӥ !DBGFEPNBODFS

Slide 2

Slide 2 text

HFOTJNָדֹ׷ֿהכ
 UPQJDNPEFMMJOH
 XPSEWFD
 זוזו˘

Slide 3

Slide 3 text

HFOTJNָדֹ׷ֿהכ
 UPQJDNPEFMMJOH
 XPSEWFD
 זוזו˘ $ pip install gensim

Slide 4

Slide 4 text

UPQJDNPEFMMJOH 8JLJQFEJBך鎸✲כ
 ו׿זزؾحؙחאְג
 剅ַ׸גְ׷ד׃׳ֲַ

Slide 5

Slide 5 text

番組 ム 監督 作曲 ゲ 収録 ドラマ 制作 選手 アニメ 小学校 isbn tbs 優勝 ラジオ 明治 鉄道 フジテレビ 高等 劇場 nhk 攻撃 試合 グ 市立 リ 選挙 チ km cm バス 神社 シ px 野球 国道 ret 江戸 fc 丁目 jr 京都 ダム 大正 廃止 設置 設定 ホ cd リリ ス 企業 文学 必要 対応 店舗 ガン 採用 状態 自分 法人 th love 事件 楽曲 医療 施設 製造 バンド 機関 改称 メンバ 空港 文化 専攻 学部 テ マ 工場 業務 管理 現代 書房 dvd live 小説 問題 共著 のち 講談社 公開 人口 作詞 政府 路線 記録 道路 議員 販売 教会 会社 獲得 搭載 戦闘 方面 装備 専門 病院 ライブ 追加 経済 大会 ドイツ 出場 製作 企画 中学校 原作 アルバム 漫画 教育 海軍 フランス イギリス 主義 選手権 戦争 株式会社 政治 世紀 編曲 都市 ズン 部隊 シングル 教授 営業 ロシア 事業 大統領 運行 プロ 委員 列車 サッカ 回戦 車両 クラブ 出版 合併 文庫 科学 指定 大阪 女子 成績 センタ 決勝 エンジン 区間 学科 システム モデル 元年 キャラクタ 交通 運転 公園 機能 県立 社会 能力 地区 交差点 郵便 地方 編入 設立 航空 課程

Slide 6

Slide 6 text

׋ֻׁ׿ך俑剅ָ֮׷הֹח
 ׉ך⚥חו׿זزؾحָؙろת׸גְ׷ַ׾
 ؝ٝؾُ٦ةח鋅אֽג׮׵ֲךָ
 زؾحٌؙرؚٔٝדׅ

Slide 7

Slide 7 text

Ɏ ɔ ɔ ɔ ? زؾحؙ 俑剅 俑剅醡鸡堣

Slide 8

Slide 8 text

Ɏ ɔ ɔ ɔ 俑剅 زؾحؙ 俑剅醡鸡堣

Slide 9

Slide 9 text

鳤剅׾אֻ׷ ؝٦ػأ׾אֻ׷ ٌرٕ׾אֻ׷ زؾحؙ׾⳿⸂ׅ׷

Slide 10

Slide 10 text

鳤剅׾אֻ׷ from gensim import corpora, models

Slide 11

Slide 11 text

鳤剅׾אֻ׷ from gensim import corpora, models
 
 documents = ['ޗഐ͸ೣͰ͋Δɻ',
 '໊લ͸·ͩແ͍ɻ',
 'Ͳ͜ͰੜΕ͔ͨͱΜͱݟ౰͕͔ͭ͵ɻ']

Slide 12

Slide 12 text

鳤剅׾אֻ׷ from gensim import corpora, models
 
 documents = ['ޗഐ͸ೣͰ͋Δɻ',
 '໊લ͸·ͩແ͍ɻ',
 'Ͳ͜ͰੜΕ͔ͨͱΜͱݟ౰͕͔ͭ͵ɻ']
 
 texts = [['ޗഐ', '͸', 'ೣ', 'Ͱ', '͋Δ', 'ɻ'],
 ['໊લ', '͸', '·ͩ', 'ແ͍', 'ɻ'],
 ['Ͳ͜', 'Ͱ', 'ੜΕ', 'ͨ', '͔', 'ͱΜͱ', 'ݟ౰', '͕', '͔ͭ', '͵', 'ɻ']]

Slide 13

Slide 13 text

鳤剅׾אֻ׷ from gensim import corpora, models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 texts = [['ޗഐ', '͸', 'ೣ', 'Ͱ', '͋Δ', 'ɻ'],
 ['໊લ', '͸', '·ͩ', 'ແ͍', 'ɻ'],
 ['Ͳ͜', 'Ͱ', 'ੜΕ', 'ͨ', '͔', 'ͱΜͱ', 'ݟ౰', '͕', '͔ͭ', '͵', 'ɻ']]
 
 texts = [['ޗഐ', 'ೣ'],
 ['໊લ'],
 ['Ͳ͜', 'ݟ౰']]

Slide 14

Slide 14 text

鳤剅׾אֻ׷ from gensim import corpora, models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 texts = [['ޗഐ', ‘ೣ’], ...]
 
 dictionary = corpora.Dictionary(texts)


Slide 15

Slide 15 text

؝٦ػأ׾אֻ׷ from gensim import corpora, models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 texts = [['ޗഐ', ‘ೣ’], ...]
 
 dictionary = corpora.Dictionary(texts)
 
 corpus = [dictionary.doc2bow(t) for t in texts]

Slide 16

Slide 16 text

ٌرٕ׾אֻ׷ from gensim import corpora, models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 texts = [['ޗഐ', ‘ೣ’], ...]
 
 dictionary = corpora.Dictionary(texts)
 
 corpus = [dictionary.doc2bow(t) for t in texts]
 
 model = models.HdpModel(corpus, dictionary)

Slide 17

Slide 17 text

زؾحؙ׾⳿⸂ׅ׷ from gensim import corpora, models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 texts = [['ޗഐ', ‘ೣ’], ...]
 
 dictionary = corpora.Dictionary(texts)
 
 corpus = [dictionary.doc2bow(t) for t in texts]
 
 model = models.HdpModel(corpus, dictionary)
 
 print(model.show_topics())

Slide 18

Slide 18 text

EFNP

Slide 19

Slide 19 text

XPSEWFD ⽃铂וֲ׃ך䠐㄂׾
 鎘皾ד罋ִ׷ֿהָדֹ׋׵
 ו׿ז䠬ׄחז׷ד׃׳ֲ

Slide 20

Slide 20 text

ؿٓٝأה⡂גְ׷⽃铂כ

Slide 21

Slide 21 text

ؿٓٝأ

Slide 22

Slide 22 text

ؿٓٝأ س؎خ كؘٕ٦ ؎ؘٔأ ؎ةٔ، أل؎ٝ

Slide 23

Slide 23 text

ؿٓٝأ ؝ٗٝؽ، ؒآفز ؚٕؐ،؎ كزشي ًٕؕ٦ٝ س؎خ كؘٕ٦ ؎ؘٔأ ؎ةٔ، أل؎ٝ

Slide 24

Slide 24 text

傈劤הٗٝسٝ׾駈׃ג
 ׉ַֿ׵؎ؘٔأ׾䒷ֻה

Slide 25

Slide 25 text

ٗٝسٝ ؎ؘٔأ 傈劤

Slide 26

Slide 26 text

ٗٝسٝ ؎ؘٔأ 傈劤

Slide 27

Slide 27 text

ٗٝسٝ ؎ؘٔأ 傈劤

Slide 28

Slide 28 text

ٗٝسٝ ؎ؘٔأ 傈劤 匌❨

Slide 29

Slide 29 text

ٗٝسٝ ؎ؘٔأ 傈劤 匌❨ 껷鿪

Slide 30

Slide 30 text

⽃铂וֲ׃ך䠐㄂ח㛇בְג
 ⽃铂׾侧⦼ד邌植ׅ׷倯岀׾
 ؝ٝؾُ٦ةח罋ִג׮׵ֲךָ
 XPSEWFDדׅ

Slide 31

Slide 31 text

؝٦ػأ׾אֻ׷ ٌرٕ׾אֻ׷ ⡂גְ׷⽃铂׾⳿⸂ׅ׷

Slide 32

Slide 32 text

؝٦ػأ׾אֻ׷ from gensim import models

Slide 33

Slide 33 text

؝٦ػأ׾אֻ׷ from gensim import models
 
 sentences = ['ޗഐ͸ೣͰ͋Δɻ',
 '໊લ͸·ͩແ͍ɻ',
 'Ͳ͜ͰੜΕ͔ͨͱΜͱݟ౰͕͔ͭ͵ɻ']

Slide 34

Slide 34 text

؝٦ػأ׾אֻ׷ from gensim import models
 
 sentences = ['ޗഐ͸ೣͰ͋Δɻ',
 '໊લ͸·ͩແ͍ɻ',
 'Ͳ͜ͰੜΕ͔ͨͱΜͱݟ౰͕͔ͭ͵ɻ']
 
 sentences = [[‘ޗഐ ͸ ೣ Ͱ ͋Δ ɻ'],
 [‘໊લ ͸ ·ͩ ແ͍ ɻ'],
 [‘Ͳ͜ Ͱ ੜΕ ͨ ͔ ͱΜͱ ݟ౰ ͕ ͔ͭ ͵ ɻ']]

Slide 35

Slide 35 text

ٌرٕ׾אֻ׷ from gensim import models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 sentences = [[‘ޗഐ ͸ ೣ Ͱ ͋Δ ɻ’], ...]
 
 model = models.Word2Vec(sentences)

Slide 36

Slide 36 text

⡂גְ׷⽃铂׾⳿⸂ׅ׷ from gensim import models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 sentences = [[‘ޗഐ ͸ ೣ Ͱ ͋Δ ɻ’], ...]
 
 model = models.Word2Vec(sentences)
 
 print(model.most_similar(positive=[’ೣ’]))

Slide 37

Slide 37 text

⡂גְ׷⽃铂׾⳿⸂ׅ׷ from gensim import models
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 sentences = [[‘ޗഐ ͸ ೣ Ͱ ͋Δ ɻ’], ...]
 
 model = models.Word2Vec(sentences)
 
 print(model.most_similar(positive=[’ೣ’]))
 
 print(model.most_similar(positive=[’ޗഐ’, ’ೣ’], negative=[’໊લ’]))

Slide 38

Slide 38 text

EFNP

Slide 39

Slide 39 text

⿫罋俑柃
 HFOTJN5PQJDNPEFMMJOHGPSIVNBOT 
 IUUQTSBEJNSFIVSFLDPNHFOTJN 03FJMMZ+BQBOⰅꟌ荈搫鎉铂Ⳣ椚
 IUUQXXXPSFJMMZDPKQCPPLT 03FJMMZ+BQBO㹋騧堣唒㷕统ءأذي
 IUUQXXXPSFJMMZDPKQCPPLT 03FJMMZ+BQBOXPSEWFDח״׷荈搫鎉铂Ⳣ椚
 IUUQXXXPSFJMMZDPKQCPPLT