Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3_Seminar_05
Search
kakubari
February 24, 2017
Technology
0
86
B3_Seminar_05
ビックデータ解析入門3
kakubari
February 24, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
78
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
71
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
87
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
述語項構造と照応関係のアノテーション
kakubari
0
220
Other Decks in Technology
See All in Technology
Google Cloud で学ぶデータエンジニアリング入門 2025年版 #GoogleCloudNext / 20250805
kazaneya
PRO
20
4.7k
Amazon S3 Vectorsは大規模ベクトル検索を低コスト化するサーバーレスなベクトルデータベースだ #jawsugsaga / S3 Vectors As A Serverless Vector Database
quiver
1
200
ホリスティックテスティングの右側も大切にする 〜2つの[はか]る〜 / Holistic Testing: Right Side Matters
nihonbuson
PRO
0
670
【CEDEC2025】大規模言語モデルを活用したゲーム内会話パートのスクリプト作成支援への取り組み
cygames
PRO
2
830
風が吹けばWHOISが使えなくなる~なぜWHOIS・RDAPはサーバー証明書のメール認証に使えなくなったのか~
orangemorishita
15
5.7k
マルチプロダクト×マルチテナントを支えるモジュラモノリスを中心としたアソビューのアーキテクチャ
disc99
1
420
Amazon Qで2Dゲームを作成してみた
siromi
0
130
【新卒研修資料】数理最適化 / Mathematical Optimization
brainpadpr
26
13k
Amazon GuardDuty での脅威検出:脅威検出の実例から学ぶ
kintotechdev
0
100
S3 Glacier のデータを Athena からクエリしようとしたらどうなるのか/try-to-query-s3-glacier-from-athena
emiki
0
210
Claude Codeから我々が学ぶべきこと
oikon48
10
2.8k
Google Agentspaceを実際に導入した効果と今後の展望
mixi_engineers
PRO
3
400
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
431
65k
Documentation Writing (for coders)
carmenintech
73
5k
Automating Front-end Workflow
addyosmani
1370
200k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
110
19k
How to Think Like a Performance Engineer
csswizardry
25
1.8k
Optimizing for Happiness
mojombo
379
70k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Building Applications with DynamoDB
mza
96
6.5k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
Site-Speed That Sticks
csswizardry
10
760
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Building an army of robots
kneath
306
45k
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ϏοΫσʔλղੳೖᶅ
目次 ˔ͱϞʔϝϯτ ˔͖ͱϞʔϝϯτ ˔͍ҙຯͰͷ͖ ˔ཁ౷ܭྔ ˔౷ܭྔͷਪఆ
分布と統計量 ˔ूஂͷதͷͲͷཁૉબΕΔ֬Λಉ͡ʹ͢Δ ɹແ࡞ҝநग़๏ɺϥϯμϜαϯϓϦϯά ˔ಘΒΕͨඪຊ ɹແ࡞ҝඪຊɺϥϯμϜαϯϓϧ நग़ͨ͠ඪຊͷ࣮ଌʹج͍ͮͯɺ ूஂɺฏۉɺࢄΛਪఆ͢Δɻ
શମ͔ΒภΓͳ͘औΓग़ͨ͠Ұ෦͔ΒશମͷಛੑΛΔ
分布とモーメント ˔Ϟʔϝϯτͱ ɹฏۉࢄͷΑ͏ʹΛಛ͚Δྔ ྫ͑ʜ ਖ਼نฏۉͱࢄ͕༩͑ΒΕΕɺ࠶ݱ͕Մೳ ฏۉࢄͦΕͧΕ̍࣍ɺ̎࣍ͷϞʔϝϯτ ɹฏۉɿ ɹࢄɿ
µ = E[x]= x ⋅ f (x)dx ∫ σ 2 = E[(x −µ)2 ]= (x −µ)2 ⋅ f (x)dx ∫
分布とモーメント ˔Ұൠతͳʹରͯ͠ ɹฏۉࢄΑΓߴ࣍ͷϞʔϝϯτ·Ͱߟ͑Δ͜ͱͰ Λಛ͚Δ ˔֬ʹ͓͍ͯ ɹЋΛத৺ͱͨ͠ҰൠԽ͞ΕͨϞʔϝϯτͷఆٛ
E[(x −α)n ]= (x −α)n ⋅ f (x)dx ∫
べき分布とモーメント ˔ϞʔϝϯτʹΑΔͷಛ͚ͮ ཧ্औΓѻ͍͍͢ ࣮ࡍʹଟ͘ͷ౷ܭख๏ͰҊʹԾఆ͞Ε͍ͯΔ ଟ͘ͷ߹ɺਖ਼نࢦͰ͋Δɻ
Ὃ ݱ࣮ͰɺҟͳΔʹै͏֬ม͕͋Δɻ ͦͷΑ͏ͳ֬มʹै͍ͬͯΔσʔλͰɺ ؍ଌ͞Εͨʹରͯ͠౷ܭख๏͕దͰ͋Δ͔ҙ ͖తͳΛ࣋ͭ
べき分布とモーメント ˔͖ͱʜ ɹɾҝସՁ֨ࠩͷ ɹɾॴಘ͕େ͖͍ྖҬͰͷݸਓॴಘͷ ɹɾจষதͷ୯ޠͷස ࣾձݱɺࣗવݱ
べき分布とモーメント P(≥ x) = Ax−α Լهͷྦྷੵؔʹै͏Λ͖ͱ͍͏ɻ
"ن֨Խఆ ͖͕ͦ͢ް͍͜ͱΛಛͱ͢Δ ʢۃʹେ͖ͳΛ࣋ͭݱ͕ਖ਼نΑΓى͜Γ͍͢ʣ (x ≥ A 1 α ) (1)
べき分布とモーメント ˔͖ͷੑ࣭ ଟ͘ͷখ͞ͳͱগͳ͍ܻҧ͍ʹେ͖ͳΛͱΔ ͷΛؚΉ ਖ਼نΑΓߴ͍֬Ͱܻҧ͍ʹେ͖ͳΛͱΔ ྦྷੵؔΛ྆ରͰϓϩοτ͢ΔͱઢʹͳΔɻ ઢͷ͖͖ࢦЋͰ͋Δɻ
Ћ㱡̎ͰࢄɺЋ㱡̍Ͱฏۉ͕ଘࡏ͠ͳ͍ɻʢЋ࣍ Ҏ্ͷϞʔϝϯτ͕ଘࡏ͠ͳ͍ʣ Ћ̍Ͱɺ࠷େͷγΣΞ͕αϯϓϧ/ˠ㱣Ͱ̌ ʹͳΒͳ͍ɻ ɹ S max = max(x 1 , x 2 ,!, x N ) x i k=1 N ∑
べき分布とモーメント ಛʹࡾͭͷੑ࣭ɺσʔλͷ͕͖ʹै͍ͬͯΔ ͔͔֬ΊΔͨΊʹσʔλղੳʹ͏ɻ σʔλͷྦྷੵΛॻ͘ɻ ྆ରϓϩοτ͠ɺઢͰ͋Δ͜ͱΛ͔֬ΊΔɻ ۙࣅઢΛٻΊɺࢦЋΛٻΊΔɻ
広い意味でのべき分布 ͕ࣜݫີʹΓཱͭ͜ͱݱ࣮ʹͳ͍ɻ Ὃ ͷઈର͕େ͖͍ྖҬͰɺ ͖ؔͰۙࣅͰ͖ΔΑ͏ͳ
͖ͷΛ࣋ͭͱ͍͍ɺ૯͖ͯ͡ͱݺͿɻ ྫʣɾٯΨϯϚ ɹɹɾθʔλ ɹɹଞʹଟ͋Δɻ
要約統計量 ˔ཁ౷ܭྔͱ ɹඪຊͷ࣋ͭੑ࣭Λఆྔతʹಛ͚Δྔ ɾҐஔʹؔ͢Δཁ౷ܭྔ ඪຊฏۉɺதԝ ɾईʹؔ͢Δཁ౷ܭྔ ࢄɺඪ४ภࠩ
統計量の推定 ˔ϏοΫσʔλͷॲཧ ؍ଌ͞Εͨσʔλ͔Βཁ౷ܭྔΛ༻͍ͯɺ ɾͦͷ֬ີؔͷύϥϝʔλΛٻΊΔ ɾσʔλ͕ै͏ํఔࣜͷύϥϝʔλΛٻΊΔ ੳʹΑΓɺूஂ͕࣋ͭະͷύϥϝʔλΛಘΔ ඪຊ͔Βਪఆ͢Δ ਪఆํ๏ʹɺ࠷ਪఆ࠷খೋਪఆ͕͋Δɻ
参考文献 ˔ߴ҆ඒࠤࢠฤஶɺాଜޫଠɾࡾӜߤஶɺ ɹʮֶੜɾٕज़ऀͷͨΊͷϏοΫσʔλղੳೖʯ ʢୈ̏ষʣɺ ɹגࣜձࣾຊධࣾɺ݄