Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3 コアタイム 第2回目 ( 2014年11月25日(火) )
Search
yoshii25
November 25, 2014
Education
0
74
B3 コアタイム 第2回目 ( 2014年11月25日(火) )
yoshii25
November 25, 2014
Tweet
Share
More Decks by yoshii25
See All by yoshii25
文献紹介 (05/13/2016)
yoshii25
0
120
文献紹介 ( 02/18/2016 )
yoshii25
0
190
文献紹介 ( 2015年7月8日(水) )
yoshii25
0
180
文献紹介 ( 2015年6月10日(水) )
yoshii25
0
190
文献紹介 ( 2015年5月12日(火) )
yoshii25
0
190
文献紹介 ( 2015年4月1日(水) )
yoshii25
0
220
B3 勉強会 第12回目 ( 2015年3月26日(木) )
yoshii25
0
180
B3 勉強会 第10回目 ( 2015年3月13日(金) )
yoshii25
0
180
B3 勉強会 第8回目 ( 2015年2月20日(金) )
yoshii25
0
210
Other Decks in Education
See All in Education
The knowledge panel is your new homepage
bradwetherall
0
220
HCI Research Methods - Lecture 7 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.2k
QR-koodit opetuksessa
matleenalaakso
0
1.7k
Introduction - Lecture 1 - Web Technologies (1019888BNR)
signer
PRO
0
5.8k
生成AIとの付き合い方 / Generative AI and us
kaityo256
PRO
11
6.6k
20251119 如果是勇者欣美爾的話, 他會怎麼做? 東海資工
pichuang
0
140
AIは若者の成長機会を奪うのか?
frievea
0
130
1125
cbtlibrary
0
140
Портфолио - Шынар Ауелбекова
shynar
0
140
東大1年生にJulia教えてみた
matsui_528
5
10k
3Dプリンタでロボット作るよ#5_ロボット向け3Dプリンタ材料
shiba_8ro
0
130
相互コミュニケーションの難しさ
masakiokuda
0
320
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
Writing Fast Ruby
sferik
630
62k
Scaling GitHub
holman
464
140k
Music & Morning Musume
bryan
46
7k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
How to train your dragon (web standard)
notwaldorf
97
6.4k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Being A Developer After 40
akosma
91
590k
The Pragmatic Product Professional
lauravandoore
37
7.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Typedesign – Prime Four
hannesfritz
42
2.9k
Transcript
B3ίΞλΠϜ (201411݄25(Ր)) ʰೖ ࣗવݴޠॲཧʱ ɹɹ1ষ ݴޠॲཧͱPython Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ B3 ழມ
ܚथ
ςʔϚ
ςʔϚ ❖ PythonͷπʔϧͱςΫχοΫ ❖ NLTKͷ༻ํ๏ ❖ ؆୯ͳ౷ܭॲཧ
Python
Python ❖ Pythonͷར ❖ ߏจҙຯͷཧղ͕ฏқ ❖ จࣈྻΛऔΓѻ͏͕ؔ๛ ❖ Pythonͷಛ ❖
มͷܕͷએݴ͕ෆཁ ❖ ߏจʹΠϯσϯτΛ༻͢Δ https://www.python.org/community/logos/
NLTK
NLTK ❖ ࢺͷλά͚, ߏจղੳ, ςΩε τͷྨͱ͍ͬͨॲཧΛߦ͏Πϯ λʔϑΣΠε ❖ ෳࡶͳΛղͨ͘ΊʹΈ߹Θ ͤΔ͜ͱ͕Ͱ͖Δ࣮
Natural Language Toolkit
༻͢Δલʹ ❖ NLTKͷΠϯϙʔτ ❖ >>> import nltk ❖ ςΩετͷΠϯϙʔτ ❖
>>> from nltk.book import *
NLTKͷػೳ ❖ ςΩετͷݕࡧ ❖ >>> text.concordance(“hoge1”) ❖ >>> text.concordance([“hoge1”, “hoge2”])
❖ ୯ޠΛ͑Δ ❖ >>> text.count(“hoge”)
NLTKͷػೳ ❖ ޠኮΛ͑Δ ❖ >>> len(text) ❖ ޠኮͷऔಘ ❖ >>>
set(text) ❖ ޠኮͷιʔτ ❖ >>> sorted(set(text))
NLTKͷػೳ ❖ ؔͷఆٛ ❖ ྫ) ςΩετͷޠኮͷ๛͞ ❖ >>> def function(text)
: ❖ . . . return len(text) / len(set(text))
Python ͖ͭͮ
Pythonͷػೳ ❖ Ϧετ ❖ ςΩετͳͲΛऩೲ͢ΔྻͷΑ͏ͳͷ. ❖ >>> sent[“hoge1”, “hoge2”, “hoge3”,
“hoge4”]
Ϧετ ❖ Ϧετͷ࿈݁ ❖ >>> sent1[“hoge1”, “hoge2”] + sent2[“hoge3”, “hoge4”]
❖ ϦετͷՃ ❖ >>> sent.append(“hoge”) ❖ εϥΠγϯά ❖ >>> sent[5 : 8]
Pythonͷػೳ ❖ จࣈྻ ❖ Ճࢉ, ࢉͳͲՄೳ. ࿈݁, ׂͷػೳΛ࣋ͭ. ❖ name
= ‘Hoge’
จࣈྻ ❖ จࣈྻͷ࿈݁ ❖ >>> ‘ ‘ .join([‘Hoge1’, ‘Hoge2’]) ❖
จࣈྻͷׂ ❖ >>> ‘Hoge1 Hoge2’.split()
Pythonͷػೳ ❖ ݅ࣜ ❖ ༻๏Cݴޠͱ΄΅ಉ༷. ൣғΛΠϯσϯτͰஅ. ❖ >>> if len(word)
< 5 ❖ . . . print ‘word length is less then 5’
݅ࣜ ❖ ୯ޠൺֱʹ͑Δԋࢉࢠ ❖ s.startswitch(t) s ͕ t Ͱ࢝·Δ͔Ͳ͏͔ ❖
s.endswitch(t) s ͕ t ͰऴΘΔ͔Ͳ͏͔ ❖ t in sɹɹɹɹɹ s ͷதʹ t ؚ͕·ΕΔ͔Ͳ͏͔ ❖ s.islower() s ͷதʹେจࣈؚ͕·Ε͍ͯͳ͍ ❖ s.isupper() s ͷதʹࢠจࣈؚ͕·Ε͍ͯͳ͍ ❖ s.isalpha() s ͷதͷจࣈ͕શͯΞϧϑΝϕοτ͔Ͳ͏͔ ❖ s.isalnum() s ͷதͷจࣈ͕શͯΞϧϑΝϕοτ͘͠ࣈ͔Ͳ͏͔
݅ࣜ ❖ ୯ޠൺֱʹ͑Δԋࢉࢠ ͖ͭͮ ❖ s.isdigit() s ͷதͷจࣈ͕શͯࣈ͔Ͳ͏͔ ❖ s.istitle()
s ͕λΠτϧέʔε͔Ͳ͏͔
Pythonͷػೳ ❖ ݅ذ ❖ ༻๏Cݴޠͱ΄΅ಉ༷. ಉ͘͡ൣғΛΠϯσϯτͰஅ. ❖ >>> for i
in range(10) ❖ . . . print i
؆୯ͳ౷ܭॲཧ
؆୯ͳ౷ܭॲཧ ❖ සग़͢Δ୯ޠΛऔΓग़͢ ❖ >>> fdist1 = FreqDist(text) ❖ ςΩετதͷҟͳΓޠΛऔΓग़͢
❖ >>> vocaburaly1 = fdist1.keys()
؆୯ͳ౷ܭॲཧ ❖ ςΩετͷ༰Λද͢୯ޠΛऔΓग़͍ͨ͠. ❖ → औΓग़ͨ͠୯ޠ͔ΒςΩετͷ༰͕ཧղͰ͖Δʂ
؆୯ͳ౷ܭॲཧ ❖ ‘,’ ‘the’, ‘.’, ‘and’ͳͲจࣈ͕͍୯ޠ͕සग़͢ΔͳΒ, 1ճ͠ ͔ొ͠ͳ͍୯ޠΛ୳ͤΑ͍ͷͰʁ ❖
15จࣈҎ্ͷ୯ޠΛऔΓग़͢ ❖ >>> V = set(text1) ❖ . . . long_words = [w for w in V if len(w) > 15]
؆୯ͳ౷ܭॲཧ ❖ 1ճ͔͠ొ͠ͳ͍୯ޠ,จ຺͔Βཧղ͠ͳ͚ΕͳΒͳ͍୯ޠ͕ ଟ͘, ςΩετͷ༰ཧղͰ͖ͳ͍. ❖ 7จࣈҎ্, 7ճҎ্ొͨ͠୯ޠΛऔΓग़͢ ❖ >>>
fdist5 = FreqDist(text5) ❖ >>> sorted([w for w in set(text5) if len > 7 and fdist5[w] > 7])