Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3_Seminar_05
Search
kakubari
February 24, 2017
Technology
0
86
B3_Seminar_05
ビックデータ解析入門3
kakubari
February 24, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
75
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
67
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
87
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
述語項構造と照応関係のアノテーション
kakubari
0
220
Other Decks in Technology
See All in Technology
生成AIで小説を書くためにプロンプトの制約や原則について学ぶ / prompt-engineering-for-ai-fiction
nwiizo
6
4.1k
品質と速度の両立:生成AI時代の品質保証アプローチ
odasho
1
220
なぜ私はいま、ここにいるのか? #もがく中堅デザイナー #プロダクトデザイナー
bengo4com
0
1.3k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
20
6.8k
第4回Snowflake 金融ユーザー会 Snowflake summit recap
tamaoki
1
240
United Airlines Customer Service– Call 1-833-341-3142 Now!
airhelp
0
160
生成AI時代 文字コードを学ぶ意義を見出せるか?
hrsued
1
810
MobileActOsaka_250704.pdf
akaitadaaki
0
110
無意味な開発生産性の議論から抜け出すための予兆検知とお金とAI
i35_267
3
12k
Tech-Verse 2025 Keynote
lycorptech_jp
PRO
0
1.8k
開発生産性を測る前にやるべきこと - 組織改善の実践 / Before Measuring Dev Productivity
kaonavi
6
1.4k
OPENLOGI Company Profile
hr01
0
67k
Featured
See All Featured
Building Applications with DynamoDB
mza
95
6.5k
Statistics for Hackers
jakevdp
799
220k
How to train your dragon (web standard)
notwaldorf
94
6.1k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
960
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
Writing Fast Ruby
sferik
628
62k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Side Projects
sachag
455
42k
Facilitating Awesome Meetings
lara
54
6.4k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
126
52k
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ϏοΫσʔλղੳೖᶅ
目次 ˔ͱϞʔϝϯτ ˔͖ͱϞʔϝϯτ ˔͍ҙຯͰͷ͖ ˔ཁ౷ܭྔ ˔౷ܭྔͷਪఆ
分布と統計量 ˔ूஂͷதͷͲͷཁૉબΕΔ֬Λಉ͡ʹ͢Δ ɹແ࡞ҝநग़๏ɺϥϯμϜαϯϓϦϯά ˔ಘΒΕͨඪຊ ɹແ࡞ҝඪຊɺϥϯμϜαϯϓϧ நग़ͨ͠ඪຊͷ࣮ଌʹج͍ͮͯɺ ूஂɺฏۉɺࢄΛਪఆ͢Δɻ
શମ͔ΒภΓͳ͘औΓग़ͨ͠Ұ෦͔ΒશମͷಛੑΛΔ
分布とモーメント ˔Ϟʔϝϯτͱ ɹฏۉࢄͷΑ͏ʹΛಛ͚Δྔ ྫ͑ʜ ਖ਼نฏۉͱࢄ͕༩͑ΒΕΕɺ࠶ݱ͕Մೳ ฏۉࢄͦΕͧΕ̍࣍ɺ̎࣍ͷϞʔϝϯτ ɹฏۉɿ ɹࢄɿ
µ = E[x]= x ⋅ f (x)dx ∫ σ 2 = E[(x −µ)2 ]= (x −µ)2 ⋅ f (x)dx ∫
分布とモーメント ˔Ұൠతͳʹରͯ͠ ɹฏۉࢄΑΓߴ࣍ͷϞʔϝϯτ·Ͱߟ͑Δ͜ͱͰ Λಛ͚Δ ˔֬ʹ͓͍ͯ ɹЋΛத৺ͱͨ͠ҰൠԽ͞ΕͨϞʔϝϯτͷఆٛ
E[(x −α)n ]= (x −α)n ⋅ f (x)dx ∫
べき分布とモーメント ˔ϞʔϝϯτʹΑΔͷಛ͚ͮ ཧ্औΓѻ͍͍͢ ࣮ࡍʹଟ͘ͷ౷ܭख๏ͰҊʹԾఆ͞Ε͍ͯΔ ଟ͘ͷ߹ɺਖ਼نࢦͰ͋Δɻ
Ὃ ݱ࣮ͰɺҟͳΔʹै͏֬ม͕͋Δɻ ͦͷΑ͏ͳ֬มʹै͍ͬͯΔσʔλͰɺ ؍ଌ͞Εͨʹରͯ͠౷ܭख๏͕దͰ͋Δ͔ҙ ͖తͳΛ࣋ͭ
べき分布とモーメント ˔͖ͱʜ ɹɾҝସՁ֨ࠩͷ ɹɾॴಘ͕େ͖͍ྖҬͰͷݸਓॴಘͷ ɹɾจষதͷ୯ޠͷස ࣾձݱɺࣗવݱ
べき分布とモーメント P(≥ x) = Ax−α Լهͷྦྷੵؔʹै͏Λ͖ͱ͍͏ɻ
"ن֨Խఆ ͖͕ͦ͢ް͍͜ͱΛಛͱ͢Δ ʢۃʹେ͖ͳΛ࣋ͭݱ͕ਖ਼نΑΓى͜Γ͍͢ʣ (x ≥ A 1 α ) (1)
べき分布とモーメント ˔͖ͷੑ࣭ ଟ͘ͷখ͞ͳͱগͳ͍ܻҧ͍ʹେ͖ͳΛͱΔ ͷΛؚΉ ਖ਼نΑΓߴ͍֬Ͱܻҧ͍ʹେ͖ͳΛͱΔ ྦྷੵؔΛ྆ରͰϓϩοτ͢ΔͱઢʹͳΔɻ ઢͷ͖͖ࢦЋͰ͋Δɻ
Ћ㱡̎ͰࢄɺЋ㱡̍Ͱฏۉ͕ଘࡏ͠ͳ͍ɻʢЋ࣍ Ҏ্ͷϞʔϝϯτ͕ଘࡏ͠ͳ͍ʣ Ћ̍Ͱɺ࠷େͷγΣΞ͕αϯϓϧ/ˠ㱣Ͱ̌ ʹͳΒͳ͍ɻ ɹ S max = max(x 1 , x 2 ,!, x N ) x i k=1 N ∑
べき分布とモーメント ಛʹࡾͭͷੑ࣭ɺσʔλͷ͕͖ʹै͍ͬͯΔ ͔͔֬ΊΔͨΊʹσʔλղੳʹ͏ɻ σʔλͷྦྷੵΛॻ͘ɻ ྆ରϓϩοτ͠ɺઢͰ͋Δ͜ͱΛ͔֬ΊΔɻ ۙࣅઢΛٻΊɺࢦЋΛٻΊΔɻ
広い意味でのべき分布 ͕ࣜݫີʹΓཱͭ͜ͱݱ࣮ʹͳ͍ɻ Ὃ ͷઈର͕େ͖͍ྖҬͰɺ ͖ؔͰۙࣅͰ͖ΔΑ͏ͳ
͖ͷΛ࣋ͭͱ͍͍ɺ૯͖ͯ͡ͱݺͿɻ ྫʣɾٯΨϯϚ ɹɹɾθʔλ ɹɹଞʹଟ͋Δɻ
要約統計量 ˔ཁ౷ܭྔͱ ɹඪຊͷ࣋ͭੑ࣭Λఆྔతʹಛ͚Δྔ ɾҐஔʹؔ͢Δཁ౷ܭྔ ඪຊฏۉɺதԝ ɾईʹؔ͢Δཁ౷ܭྔ ࢄɺඪ४ภࠩ
統計量の推定 ˔ϏοΫσʔλͷॲཧ ؍ଌ͞Εͨσʔλ͔Βཁ౷ܭྔΛ༻͍ͯɺ ɾͦͷ֬ີؔͷύϥϝʔλΛٻΊΔ ɾσʔλ͕ै͏ํఔࣜͷύϥϝʔλΛٻΊΔ ੳʹΑΓɺूஂ͕࣋ͭະͷύϥϝʔλΛಘΔ ඪຊ͔Βਪఆ͢Δ ਪఆํ๏ʹɺ࠷ਪఆ࠷খೋਪఆ͕͋Δɻ
参考文献 ˔ߴ҆ඒࠤࢠฤஶɺాଜޫଠɾࡾӜߤஶɺ ɹʮֶੜɾٕज़ऀͷͨΊͷϏοΫσʔλղੳೖʯ ʢୈ̏ষʣɺ ɹגࣜձࣾຊධࣾɺ݄