Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3_Seminar_05
Search
kakubari
February 24, 2017
Technology
0
89
B3_Seminar_05
ビックデータ解析入門3
kakubari
February 24, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
170
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
86
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
100
Labeling the Semantic Roles of Commas
kakubari
0
82
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
120
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
91
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
130
述語項構造と照応関係のアノテーション
kakubari
0
240
Other Decks in Technology
See All in Technology
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
9.8k
Google Stitch 大型アップデートが実現するアイデアとコードの完全なる融合
nekoailab
0
100
原理から解き明かす AIと人間の成長 - Progate BAR
teba_eleven
2
270
re:Invent2025とAWS Builder Cards Resilience Expansionのご紹介
tsuwa61
1
130
Digitization部 紹介資料
sansan33
PRO
1
6.1k
履歴テーブル、今回はこう作りました 〜 Delegated Types編 〜 / How We Built Our History Table This Time — With Delegated Types
moznion
14
8.8k
type-challenges を全問解いたのでエッセンスと推し問題を紹介してみる
kworkdev
PRO
0
160
進化の早すぎる生成 AI と向き合う
satohjohn
0
470
都市スケールAR制作で気をつけること
segur
0
220
Android Studio Otter の最新 Gemini 機能 / Latest Gemini features in Android Studio Otter
yanzm
0
540
useEffectってなんで非推奨みたいなこと言われてるの?
maguroalternative
9
6k
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
21k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Designing for Performance
lara
610
69k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
70
Code Review Best Practice
trishagee
73
19k
How GitHub (no longer) Works
holman
316
140k
Site-Speed That Sticks
csswizardry
13
980
The Cult of Friendly URLs
andyhume
79
6.7k
GitHub's CSS Performance
jonrohan
1032
470k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ϏοΫσʔλղੳೖᶅ
目次 ˔ͱϞʔϝϯτ ˔͖ͱϞʔϝϯτ ˔͍ҙຯͰͷ͖ ˔ཁ౷ܭྔ ˔౷ܭྔͷਪఆ
分布と統計量 ˔ूஂͷதͷͲͷཁૉબΕΔ֬Λಉ͡ʹ͢Δ ɹແ࡞ҝநग़๏ɺϥϯμϜαϯϓϦϯά ˔ಘΒΕͨඪຊ ɹແ࡞ҝඪຊɺϥϯμϜαϯϓϧ நग़ͨ͠ඪຊͷ࣮ଌʹج͍ͮͯɺ ूஂɺฏۉɺࢄΛਪఆ͢Δɻ
શମ͔ΒภΓͳ͘औΓग़ͨ͠Ұ෦͔ΒશମͷಛੑΛΔ
分布とモーメント ˔Ϟʔϝϯτͱ ɹฏۉࢄͷΑ͏ʹΛಛ͚Δྔ ྫ͑ʜ ਖ਼نฏۉͱࢄ͕༩͑ΒΕΕɺ࠶ݱ͕Մೳ ฏۉࢄͦΕͧΕ̍࣍ɺ̎࣍ͷϞʔϝϯτ ɹฏۉɿ ɹࢄɿ
µ = E[x]= x ⋅ f (x)dx ∫ σ 2 = E[(x −µ)2 ]= (x −µ)2 ⋅ f (x)dx ∫
分布とモーメント ˔Ұൠతͳʹରͯ͠ ɹฏۉࢄΑΓߴ࣍ͷϞʔϝϯτ·Ͱߟ͑Δ͜ͱͰ Λಛ͚Δ ˔֬ʹ͓͍ͯ ɹЋΛத৺ͱͨ͠ҰൠԽ͞ΕͨϞʔϝϯτͷఆٛ
E[(x −α)n ]= (x −α)n ⋅ f (x)dx ∫
べき分布とモーメント ˔ϞʔϝϯτʹΑΔͷಛ͚ͮ ཧ্औΓѻ͍͍͢ ࣮ࡍʹଟ͘ͷ౷ܭख๏ͰҊʹԾఆ͞Ε͍ͯΔ ଟ͘ͷ߹ɺਖ਼نࢦͰ͋Δɻ
Ὃ ݱ࣮ͰɺҟͳΔʹै͏֬ม͕͋Δɻ ͦͷΑ͏ͳ֬มʹै͍ͬͯΔσʔλͰɺ ؍ଌ͞Εͨʹରͯ͠౷ܭख๏͕దͰ͋Δ͔ҙ ͖తͳΛ࣋ͭ
べき分布とモーメント ˔͖ͱʜ ɹɾҝସՁ֨ࠩͷ ɹɾॴಘ͕େ͖͍ྖҬͰͷݸਓॴಘͷ ɹɾจষதͷ୯ޠͷස ࣾձݱɺࣗવݱ
べき分布とモーメント P(≥ x) = Ax−α Լهͷྦྷੵؔʹै͏Λ͖ͱ͍͏ɻ
"ن֨Խఆ ͖͕ͦ͢ް͍͜ͱΛಛͱ͢Δ ʢۃʹେ͖ͳΛ࣋ͭݱ͕ਖ਼نΑΓى͜Γ͍͢ʣ (x ≥ A 1 α ) (1)
べき分布とモーメント ˔͖ͷੑ࣭ ଟ͘ͷখ͞ͳͱগͳ͍ܻҧ͍ʹେ͖ͳΛͱΔ ͷΛؚΉ ਖ਼نΑΓߴ͍֬Ͱܻҧ͍ʹେ͖ͳΛͱΔ ྦྷੵؔΛ྆ରͰϓϩοτ͢ΔͱઢʹͳΔɻ ઢͷ͖͖ࢦЋͰ͋Δɻ
Ћ㱡̎ͰࢄɺЋ㱡̍Ͱฏۉ͕ଘࡏ͠ͳ͍ɻʢЋ࣍ Ҏ্ͷϞʔϝϯτ͕ଘࡏ͠ͳ͍ʣ Ћ̍Ͱɺ࠷େͷγΣΞ͕αϯϓϧ/ˠ㱣Ͱ̌ ʹͳΒͳ͍ɻ ɹ S max = max(x 1 , x 2 ,!, x N ) x i k=1 N ∑
べき分布とモーメント ಛʹࡾͭͷੑ࣭ɺσʔλͷ͕͖ʹै͍ͬͯΔ ͔͔֬ΊΔͨΊʹσʔλղੳʹ͏ɻ σʔλͷྦྷੵΛॻ͘ɻ ྆ରϓϩοτ͠ɺઢͰ͋Δ͜ͱΛ͔֬ΊΔɻ ۙࣅઢΛٻΊɺࢦЋΛٻΊΔɻ
広い意味でのべき分布 ͕ࣜݫີʹΓཱͭ͜ͱݱ࣮ʹͳ͍ɻ Ὃ ͷઈର͕େ͖͍ྖҬͰɺ ͖ؔͰۙࣅͰ͖ΔΑ͏ͳ
͖ͷΛ࣋ͭͱ͍͍ɺ૯͖ͯ͡ͱݺͿɻ ྫʣɾٯΨϯϚ ɹɹɾθʔλ ɹɹଞʹଟ͋Δɻ
要約統計量 ˔ཁ౷ܭྔͱ ɹඪຊͷ࣋ͭੑ࣭Λఆྔతʹಛ͚Δྔ ɾҐஔʹؔ͢Δཁ౷ܭྔ ඪຊฏۉɺதԝ ɾईʹؔ͢Δཁ౷ܭྔ ࢄɺඪ४ภࠩ
統計量の推定 ˔ϏοΫσʔλͷॲཧ ؍ଌ͞Εͨσʔλ͔Βཁ౷ܭྔΛ༻͍ͯɺ ɾͦͷ֬ີؔͷύϥϝʔλΛٻΊΔ ɾσʔλ͕ै͏ํఔࣜͷύϥϝʔλΛٻΊΔ ੳʹΑΓɺूஂ͕࣋ͭະͷύϥϝʔλΛಘΔ ඪຊ͔Βਪఆ͢Δ ਪఆํ๏ʹɺ࠷ਪఆ࠷খೋਪఆ͕͋Δɻ
参考文献 ˔ߴ҆ඒࠤࢠฤஶɺాଜޫଠɾࡾӜߤஶɺ ɹʮֶੜɾٕज़ऀͷͨΊͷϏοΫσʔλղੳೖʯ ʢୈ̏ষʣɺ ɹגࣜձࣾຊධࣾɺ݄