Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3 コアタイム 第2回目 ( 2014年11月25日(火) )
Search
yoshii25
November 25, 2014
Education
0
74
B3 コアタイム 第2回目 ( 2014年11月25日(火) )
yoshii25
November 25, 2014
Tweet
Share
More Decks by yoshii25
See All by yoshii25
文献紹介 (05/13/2016)
yoshii25
0
120
文献紹介 ( 02/18/2016 )
yoshii25
0
190
文献紹介 ( 2015年7月8日(水) )
yoshii25
0
180
文献紹介 ( 2015年6月10日(水) )
yoshii25
0
190
文献紹介 ( 2015年5月12日(火) )
yoshii25
0
190
文献紹介 ( 2015年4月1日(水) )
yoshii25
0
220
B3 勉強会 第12回目 ( 2015年3月26日(木) )
yoshii25
0
180
B3 勉強会 第10回目 ( 2015年3月13日(金) )
yoshii25
0
180
B3 勉強会 第8回目 ( 2015年2月20日(金) )
yoshii25
0
210
Other Decks in Education
See All in Education
Padlet opetuksessa
matleenalaakso
9
15k
Web Architectures - Lecture 2 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
The knowledge panel is your new homepage
bradwetherall
0
230
ThingLink
matleenalaakso
28
4.3k
the difficulty into words
ukky86
0
340
自己紹介 / who-am-i
yasulab
3
6.2k
IKIGAI World Fes:program
tsutsumi
1
2.6k
3Dプリンタでロボット作るよ#5_ロボット向け3Dプリンタ材料
shiba_8ro
0
140
Requirements Analysis and Prototyping - Lecture 3 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.4k
XML and Related Technologies - Lecture 7 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
10分で学ぶ すてきなモナド
soukouki
1
130
渡辺研Slackの使い方 / Slack Local Rule
kaityo256
PRO
10
10k
Featured
See All Featured
Marketing to machines
jonoalderson
1
4.5k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
140
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
RailsConf 2023
tenderlove
30
1.3k
The browser strikes back
jonoalderson
0
300
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
140
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
47
Deep Space Network (abreviated)
tonyrice
0
33
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Transcript
B3ίΞλΠϜ (201411݄25(Ր)) ʰೖ ࣗવݴޠॲཧʱ ɹɹ1ষ ݴޠॲཧͱPython Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ B3 ழມ
ܚथ
ςʔϚ
ςʔϚ ❖ PythonͷπʔϧͱςΫχοΫ ❖ NLTKͷ༻ํ๏ ❖ ؆୯ͳ౷ܭॲཧ
Python
Python ❖ Pythonͷར ❖ ߏจҙຯͷཧղ͕ฏқ ❖ จࣈྻΛऔΓѻ͏͕ؔ๛ ❖ Pythonͷಛ ❖
มͷܕͷએݴ͕ෆཁ ❖ ߏจʹΠϯσϯτΛ༻͢Δ https://www.python.org/community/logos/
NLTK
NLTK ❖ ࢺͷλά͚, ߏจղੳ, ςΩε τͷྨͱ͍ͬͨॲཧΛߦ͏Πϯ λʔϑΣΠε ❖ ෳࡶͳΛղͨ͘ΊʹΈ߹Θ ͤΔ͜ͱ͕Ͱ͖Δ࣮
Natural Language Toolkit
༻͢Δલʹ ❖ NLTKͷΠϯϙʔτ ❖ >>> import nltk ❖ ςΩετͷΠϯϙʔτ ❖
>>> from nltk.book import *
NLTKͷػೳ ❖ ςΩετͷݕࡧ ❖ >>> text.concordance(“hoge1”) ❖ >>> text.concordance([“hoge1”, “hoge2”])
❖ ୯ޠΛ͑Δ ❖ >>> text.count(“hoge”)
NLTKͷػೳ ❖ ޠኮΛ͑Δ ❖ >>> len(text) ❖ ޠኮͷऔಘ ❖ >>>
set(text) ❖ ޠኮͷιʔτ ❖ >>> sorted(set(text))
NLTKͷػೳ ❖ ؔͷఆٛ ❖ ྫ) ςΩετͷޠኮͷ๛͞ ❖ >>> def function(text)
: ❖ . . . return len(text) / len(set(text))
Python ͖ͭͮ
Pythonͷػೳ ❖ Ϧετ ❖ ςΩετͳͲΛऩೲ͢ΔྻͷΑ͏ͳͷ. ❖ >>> sent[“hoge1”, “hoge2”, “hoge3”,
“hoge4”]
Ϧετ ❖ Ϧετͷ࿈݁ ❖ >>> sent1[“hoge1”, “hoge2”] + sent2[“hoge3”, “hoge4”]
❖ ϦετͷՃ ❖ >>> sent.append(“hoge”) ❖ εϥΠγϯά ❖ >>> sent[5 : 8]
Pythonͷػೳ ❖ จࣈྻ ❖ Ճࢉ, ࢉͳͲՄೳ. ࿈݁, ׂͷػೳΛ࣋ͭ. ❖ name
= ‘Hoge’
จࣈྻ ❖ จࣈྻͷ࿈݁ ❖ >>> ‘ ‘ .join([‘Hoge1’, ‘Hoge2’]) ❖
จࣈྻͷׂ ❖ >>> ‘Hoge1 Hoge2’.split()
Pythonͷػೳ ❖ ݅ࣜ ❖ ༻๏Cݴޠͱ΄΅ಉ༷. ൣғΛΠϯσϯτͰஅ. ❖ >>> if len(word)
< 5 ❖ . . . print ‘word length is less then 5’
݅ࣜ ❖ ୯ޠൺֱʹ͑Δԋࢉࢠ ❖ s.startswitch(t) s ͕ t Ͱ࢝·Δ͔Ͳ͏͔ ❖
s.endswitch(t) s ͕ t ͰऴΘΔ͔Ͳ͏͔ ❖ t in sɹɹɹɹɹ s ͷதʹ t ؚ͕·ΕΔ͔Ͳ͏͔ ❖ s.islower() s ͷதʹେจࣈؚ͕·Ε͍ͯͳ͍ ❖ s.isupper() s ͷதʹࢠจࣈؚ͕·Ε͍ͯͳ͍ ❖ s.isalpha() s ͷதͷจࣈ͕શͯΞϧϑΝϕοτ͔Ͳ͏͔ ❖ s.isalnum() s ͷதͷจࣈ͕શͯΞϧϑΝϕοτ͘͠ࣈ͔Ͳ͏͔
݅ࣜ ❖ ୯ޠൺֱʹ͑Δԋࢉࢠ ͖ͭͮ ❖ s.isdigit() s ͷதͷจࣈ͕શͯࣈ͔Ͳ͏͔ ❖ s.istitle()
s ͕λΠτϧέʔε͔Ͳ͏͔
Pythonͷػೳ ❖ ݅ذ ❖ ༻๏Cݴޠͱ΄΅ಉ༷. ಉ͘͡ൣғΛΠϯσϯτͰஅ. ❖ >>> for i
in range(10) ❖ . . . print i
؆୯ͳ౷ܭॲཧ
؆୯ͳ౷ܭॲཧ ❖ සग़͢Δ୯ޠΛऔΓग़͢ ❖ >>> fdist1 = FreqDist(text) ❖ ςΩετதͷҟͳΓޠΛऔΓग़͢
❖ >>> vocaburaly1 = fdist1.keys()
؆୯ͳ౷ܭॲཧ ❖ ςΩετͷ༰Λද͢୯ޠΛऔΓग़͍ͨ͠. ❖ → औΓग़ͨ͠୯ޠ͔ΒςΩετͷ༰͕ཧղͰ͖Δʂ
؆୯ͳ౷ܭॲཧ ❖ ‘,’ ‘the’, ‘.’, ‘and’ͳͲจࣈ͕͍୯ޠ͕සग़͢ΔͳΒ, 1ճ͠ ͔ొ͠ͳ͍୯ޠΛ୳ͤΑ͍ͷͰʁ ❖
15จࣈҎ্ͷ୯ޠΛऔΓग़͢ ❖ >>> V = set(text1) ❖ . . . long_words = [w for w in V if len(w) > 15]
؆୯ͳ౷ܭॲཧ ❖ 1ճ͔͠ొ͠ͳ͍୯ޠ,จ຺͔Βཧղ͠ͳ͚ΕͳΒͳ͍୯ޠ͕ ଟ͘, ςΩετͷ༰ཧղͰ͖ͳ͍. ❖ 7จࣈҎ্, 7ճҎ্ొͨ͠୯ޠΛऔΓग़͢ ❖ >>>
fdist5 = FreqDist(text5) ❖ >>> sorted([w for w in set(text5) if len > 7 and fdist5[w] > 7])