Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2017_B3_Seminar_3
Search
kakubari
February 10, 2017
Technology
0
64
2017_B3_Seminar_3
長岡技術科学大学
自然言語処理研究室
角張竜晴
kakubari
February 10, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
88
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
110
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
64
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
90
Labeling the Semantic Roles of Commas
kakubari
0
56
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
93
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
74
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
88
述語項構造と照応関係のアノテーション
kakubari
0
180
Other Decks in Technology
See All in Technology
長期間TiDBを使ってきた話 @ 私たちはなぜNewSQLを使うのかTiDB選定5社が語る選定理由と活用LT / Experiences with TiDB Over Time
chibiegg
2
900
JSON攻略法.pdf
miyakemito
8
5.1k
アクセス制御にまつわる改善 / Improving access control
itkq
0
550
DevOpsメトリクスとアウトカムの接続にトライ!開発プロセスを通して計測できるメトリクスの活用方法
ham0215
2
240
Google Cloud の AI を支える裏側のインフラを垣間見る!
maroon1st
0
360
開発生産性大幅アップ!Postman VS Code拡張機能
nagix
2
380
EMとして2023年度に頑張ったこと / What we did well in FY2023 as a EM
pauli
1
170
[新卒向け研修資料] テスト文字列に「うんこ」と入れるな(2024年版)
infiniteloop_inc
4
16k
本当のAWS基礎
toru_kubota
0
530
チームでロジカルシンキングに改めて向き合っている話 〜学習環境と実践⽅法〜
sansantech
PRO
3
2.7k
生成AIの変革の時代に、直近1年で直面した課題とその解決策
ktc_wada
0
320
TechFeed Experts Night#27 〜 フロントエンドフレームワーク最前線 (Svelte)
baseballyama
1
540
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
50
9.2k
How to train your dragon (web standard)
notwaldorf
73
5.2k
Bootstrapping a Software Product
garrettdimon
PRO
302
110k
Rails Girls Zürich Keynote
gr2m
91
13k
The Invisible Customer
myddelton
114
12k
Art, The Web, and Tiny UX
lynnandtonic
289
19k
Infographics Made Easy
chrislema
238
18k
Unsuck your backbone
ammeep
663
57k
5 minutes of I Can Smell Your CMS
philhawksworth
199
19k
In The Pink: A Labor of Love
frogandcode
138
21k
The Power of CSS Pseudo Elements
geoffreycrofte
60
5k
What the flash - Photography Introduction
edds
64
11k
Transcript
Ԭٕज़Պֶେֶ ిؾిࢠใֶ՝ఔ ֶ෦ɹ֯ுཽ ࣗવݴޠݚڀࣨ ɹ#̏θϛ ʙୈճʙ ϏοΫσʔλղੳೖ
目次 ˔ϏοΫσʔλͱ ˔ϏοΫσʔλͷཧ 6/*9 ˔౷ܭॲཧͷܭࢉޡࠩ
ビックデータとは ˔ϏοΫσʔλͱ ɹʮ̏7ʯଈͪɺ7PMVNF ༰ྔ 7BSJFUZ
छྨ 7FMPDJUZ ੵස Ὃ σʔλͷ༰ྔ͕େ͖͘ɺσʔλͷछྨ͕ଟ༷Ͱɺ σʔλͷੵස͕ଟ͍ɻ
ビックデータの管理(UNIX) ˔ϏοΫσʔλͷ༰Λ֬ೝ͢Δ σʔλͷ༰ΛΔ͜ͱͰɺߦ͏͖ղੳํ๏͕ܾ ·Δ ɹ⾣DBUɿϑΝΠϧͷதΛશͯදࣔ ɹ⾣MFTTɿදࣔϞʔυͱͳΓɺϑΝΠϧͷதΛදࣔ ɹɹRΛԡ͢͜ͱͰऴྃ͢Δ
DBUpMFDTW MFTTpMFDTW
ビックデータの管理(UNIX) ɹ⾣IFBEOɿϑΝΠϧͷઌ಄͔ΒOߦ͚ͩදࣔ ɹ⾣dcIFBEɿʮʛʢύΠϓʣʯΑΓલͷ࣮ߦ݁Ռ ɹɹɹɹɹɹɹΛ࠷ॳͷߦ͚ͩදࣔ ɹ⾣UBJMrOɿϑΝΠϧͷ࠷ޙ͔ΒOߦ͚ͩදࣔ
IFBErOpMFDTW TBNQMFQZpMFDTWcIFBE UBJMrOpMFDTW
ビックデータの管理(UNIX) ˔ϏοΫσʔλΛཧ͢Δ ղੳ͕͍͢͠Α͏ʹɺσʔλͷஔநग़Λߦ͏ ɹ⾣TFEɿσʔλͷஔ ɹɹTͷ࣍ͷͷؒͷจࣈ͕ɺ ɹɹɹHͷલͷͷؒͷจࣈʹஔ͞ΕΔ TFElT HzpMFDTW
ビックデータの管理(UNIX) ɹ⾣zT @zɿҰߦͷΧϯϚΛ@ʹஔ ɹ⾣TFElddzɿηϛίϩϯͰ۠Δ͜ͱͰɺ ɹɹɹɹɹɹɹɹͭͳ͛ͯॲཧΛهड़Ͱ͖Δ ɹ⾣ ϦμΠϨΫτ ɿग़ྗ݁ՌΛϑΝΠϧʹॻࠐΈ
TFElT @T HzpMFDTWPVUQVUUYU
ビックデータの管理(UNIX) ɹ⾣BXLɿඞཁͳ߲ͷநग़ ɹɹɹɹҰߦͣͭ۠Γ͋ΔจࣈྻΛॲཧ͢Δ ɹɹ'
ɿΧϯϚ۠ΓͰॲཧ͢Δ͜ͱΛ໌ࣔ ɹɹɹɹʢσϑΥϧτͰεϖʔε۠Γʣ BXLr' b\QSJOU^`pMFDTWPVUQVUUYU pMFDTW BQQMF PSBOHF CBOBOB PVUQVUUYU
ビックデータの管理(UNIX) ɹ⾣BXLϓϩάϥϛϯάݴޠ ɹɹQSJOUG GPSจ JGจͳͲ͕͑Δ BXLr'b\QSJOUG lTEݸaOz ^`pMFDTWPVUQVUUYU
pMFDTW BQQMF PSBOHF CBOBOB PVUQVUUYU BQQMFݸ PSBOHFݸ CBOBOBݸ
ビックデータの管理(UNIX) ɹ⾣HSFQldzɿσʔλͷத͔ΒdΛؚΉߦΛݕࡧ ɹ ɹ⾣HSFQrWldzɿσʔλͷத͔ΒdΛؚ·ͳ͍ߦΛݕࡧ HSFQlFzpMFDTWPVUQVUUYU pMFDTW
BQQMF PSBOHF CBOBOB PVUQVUUYU BQQMF PSBOHF HSFQrWlFzpMFDTWPVUQVUUYU PVUQVUUYU CBOBOB
ビックデータの管理(UNIX) ɹ⾣TPSUɿσʔλͷฒͼସ͑ ɹɹྦྷੵؔσʔλͷ࠷খɾ࠷େ ɹɹɹΛ֬ೝ͢Δ߹ʹ༻͍Δ ɹLҰྻʹண͠ɺHࣈͰฒͼସ͑Δɻ
ɹU ΧϯϚ۠ΓͷϑΝΠϧͰ͋Δ͜ͱΛද͢ɻ TPSUrLHrU pMFDTW pMFDTW BQQMF PSBOHF CBOBOB PVUQVUUYU CBOBOB BQQMF PSBOHF
ビックデータの管理(UNIX) ɹ⾣VOJRɿಉ͡σʔλΛ·ͱΊΔ ɹ⾣VOJRrDɿಉ͡σʔλΛ·ͱΊɺΧϯτ͢Δ
ɹ TPSUrLHpMFDTWcVOJR pMFDTW PVUQVUUYU TPSUrLHVpMFDTW TPSUrLHpMFDTWcVOJRD PVUQVUUYU
統計処理の計算誤差 ˔ޡࠩ ɹϏοΫσʔλղੳΛ͢Δ্Ͱɺʮظ͞ΕΔͱɺ ଌఆܭࢉͳͲͰಘΒΕͨͱͷࠩʯ ˔ޡࠩͷྨ ɹ⾣ϞσϧԽޡࠩ ɹ⾣ۙࣅޡࠩ ɹ⾣ܥ౷ޡࠩɺۮવޡࠩ ɹ⾣ܭࢉޡࠩ
統計処理の計算誤差 ⾣ϞσϧԽޡࠩ ɹϞσϧԽͷࡍʹෳࡶԽΛආ͚ΔͨΊʹແࢹ͞Εͨཁ ૉ͕ͨΒ͢ޡࠩ ɹྫʣৼΓࢠͷӡಈํఔࣜ ɹɹɹɾۭؾ߅Λແࢹ ɹɹɹɾมҟ͕ඍখͳͷ
統計処理の計算誤差 ⾣ۙࣅޡࠩ ɹܭࢉͷ؆ૉԽͷͨΊʹۙࣅࣜΛ༻͍Δ͜ͱʹΑΔޡࠩ ɹྫʣTJO Λܭࢉ ɹɹɹTJO Y dYͰۙࣅ͢Δͱɺ
TJO d ɹɹɹ࣮ࡍʹɺ TJO ɹɹɹΑͬͯɺ͕ۙࣅޡࠩ
統計処理の計算誤差 ⾣ܥ౷ޡࠩ ɹଌఆͷํ๏ʹΑͬͯݱΕͯ͠·͏ޡࠩ ɹҰͭͷଌఆํ๏Ͱଌఆ͢ΔݶΓɺࢼߦճΛॏͶ ͯऔΓআ͔Εͣɺ౷ܭతʹͣΕ͕؍ଌ͞ΕΔ ⾣ۮવޡࠩ ɹଌఆ͝ͱʹଌఆʹΒ͖͕ͭੜ·ΕΔ͜ͱʹΑΔޡࠩ
統計処理の計算誤差 ⾣ܭࢉޡࠩ ɹ1$ͰܭࢉΛߦ͏ࡍʹɺແݶΛѻ͑ͳ͍͜ͱʹΑΔޡࠩ ɹʙܭࢉޡࠩͷछྨʙ ɹɹ˗ؙΊޡࠩ ɹɹ˗ଧͪΓޡࠩ ɹɹ˗ใམͪ
統計処理の計算誤差 ˗ؙΊޡࠩ ɹ༗ޮࣈൣғ֎ͷ෦͕ࣺͯΒΕΔ͜ͱʹΑΔޡࠩ ɹྫʣʜ ɹɹɹ༗ޮࣈ͕ܻ̏ͷ߹ɺ ɹɹɹ͜ͷͱ͖ɺʜ
統計処理の計算誤差 ˔ଧͪΓޡࠩ ɹֶͰ༻͍ΔࣜͰɺཧతͳͱͯ͠ແݶݸͷΛ ߟ͑Δɻेʹۃݶڃʹ͍ۙͱஅܻͨ͠ Ͱଧͪͬͨͱ͖ͷޡࠩɹ ɹྫʣ
ʜ ɹ
統計処理の計算誤差 ˔ใམͪɹ ɹઈରʹେ͖ͳ͕ࠩ͋ΔೋͭͷͷՃݮΛߦͬͨ ߹ʹɺܭࢉ͕·ͱʹߦΘΕͳ͍͜ͱʹΑΔޡࠩ ɹྫʣ༗ޮࣈܻ̑ͷ Y Zº Y Z
ɹɹɹ༗ޮࣈܻ̑ͰΓམͱ͢ͱ
参考文献 ˔ߴ҆ඒࠤࢠฤஶɺాଜޫଠɾࡾӜߤஶɺ ɹʮֶੜɾٕज़ऀͷͨΊͷϏοΫσʔλղੳೖʯ ʢୈ̍ষʙୈ̏ষʣɺ ɹגࣜձࣾຊධࣾɺ݄