Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
KHCoder
Search
Utree
June 12, 2019
Education
0
74
KHCoder
Utree
June 12, 2019
Tweet
Share
More Decks by Utree
See All by Utree
command_line_3
utree
0
37
command_line_1
utree
0
30
command_line_2
utree
0
36
ml_1
utree
0
31
ml_2
utree
0
46
math_41
utree
0
33
math_45
utree
0
30
hannari_python_lt
utree
1
250
math_36
utree
0
27
Other Decks in Education
See All in Education
The browser strikes back
jonoalderson
0
360
ThingLink
matleenalaakso
28
4.3k
沖ハック~のみぞうさんとハッキングチャレンジ☆~
nomizone
1
570
俺と地方勉強会 - KomeKaigi・地方勉強会への期待 -
pharaohkj
1
1.6k
1008
cbtlibrary
0
130
AWS re_Invent に全力で参加したくて筋トレを頑張っている話
amarelo_n24
2
120
The World That Saved Me: A Story of Community and Gratitude
_hashimo2
3
510
GOVERNOR ADDRESS:2025年9月29日合同公式訪問例会:2720 Japan O.K. ロータリーEクラブ、2025年10月6日卓話:藤田 千克由 氏(国際ロータリー第2720地区 2025-2026年度 ガバナー・大分中央ロータリークラブ・大分トキハタクシー(株)顧問)
2720japanoke
0
750
Requirements Analysis and Prototyping - Lecture 3 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.4k
0121
cbtlibrary
0
120
1202
cbtlibrary
0
200
【ベテランCTOからのメッセージ】AIとか組織とかキャリアとか気になることはあるけどさ、個人の技術力から目を背けないでやっていきましょうよ
netmarkjp
2
1.8k
Featured
See All Featured
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
49
エンジニアに許された特別な時間の終わり
watany
106
230k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
Making Projects Easy
brettharned
120
6.6k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
0
3.4k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
140
Transcript
KHCoder
τϐοΫ 1. KHCoderͱԿ͔ʁ 2. ΠϯετʔϧͷϙΠϯτ 3. KHCoderͷ͍ํ
1. KHCoderͱԿ͔ʁ
KHCoder ςΩετσʔλΛ౷ܭֶతʹੳΛ͢Δπʔϧ
ςΩετ KHCoder දܗࣜʹՃ (Excel, CSV)
2. ΠϯετʔϧͷϙΠϯτ
ΠϯετʔϧͷϙΠϯτ • KHCoderνϡʔτϦΞϧΛࢀর(https://khcoder.net/ tutorial.html) • Windowsɹਪ (MS Visual C++ x86ͷϥϯλΠϜ͕ผ్ඞཁ)
• Mac, LinuxϢʔβʔWindowsͷVM্Ͱಈ͔͠·͠ΐ͏
3. KHCoderͷ͍ํ
KHCoderͷ͍ํ ஈ֊1 : σʔλશମΛੳ (Correlational) ஈ֊2 : ੳऀͷߟ͑Λ ͱʹσʔλΛੳ (Dictionary-Based)
ਵ࣌ : ݩͷςΩετΛݟͯੳ݁ՌΛղऍ
KHCoder ςΩετσʔλΛ౷ܭֶతʹੳΛ͢Δπʔϧ → σʔλͷू·ΓͷಛΛΔ͜ͱ ूஂ ඪຊநग़ ඪຊ ඪຊಛੑ ूஂಛੑ ਪఆ
ཁ
σʔλऩू ୯มྔղੳ ೋมྔղੳ ଟมྔղੳ ͍/͍͍͑ ɹˣ ɹ1/0 ༧ଌ ཁ σʔλͷಛΛΔखॱ
σʔλΛूΊΔ Ճ͢Δ 1छྨͷσʔλͷ ಛΛݟΔ 2छྨͷσʔλͷ ಛΛݟΔ c.f.) جຊ౷ܭྔ: ࠷େ, ฏۉ, ࢄetc
ଟมྔղੳͷྨ ཁ
KHCoder ςΩετσʔλΛ౷ܭֶతʹੳΛ͢Δπʔϧ • Correlational Ξϓϩʔνɹɹ : ౷ܭֶతͳج४ͰɺςΩετΛྨޙɺ ੳ͢Δߟ͑ํ • Dictionary-based
Ξϓϩʔν : ੳऀͷج४ͰɺςΩετΛɹྨޙɺ ੳ͢Δߟ͑ํ • KHCoderɹɹɹɹɹɹɹɹɹ : ͲͬͪͰ͖Δ
σʔλऩू ୯มྔղੳ ೋมྔղੳ ଟมྔղੳ ม ม ม ม ίʔυ
ม ม ม ม Correlational Dictionary-Based
Ͳͬͪ͑ɺ ੳऀͷཧҙࣝΛௐΔ্Ͱɺ৴པੑ٬؍ੑΛ্Ͱ͖Δ
KHCoderͷ͍ํ ஈ֊1 : σʔλશମΛੳ (Correlational) ɹ1-1 Α͘ग़Δ୯ޠΛݟΔ ɹ1-2 ୯ޠಉ࢜ͷؔΛݟΔ ɹ1-3
୯ޠΛͱʹจষಉ࢜ͷؔΛݟΔ ɹ1-4 ༰͕ࣅͨจষΛάϧʔϓ͚͢Δ ɹ1-5 (σʔλΛऔΓग़͢) ஈ֊2 : ੳऀͷߟ͑ΛͱʹσʔλΛੳ (Dictionary-Based) ɹ2-1Α͘ग़ΔίʔυΛݟΔ ɹ2-2 ίʔυಉ࢜ͷؔΛݟΔ ɹ2-3 ίʔυΛͱʹจষಉ࢜ͷؔΛݟΔ ɹ2-4 (σʔλΛऔΓग़͢) ਵ࣌ : ݩͷςΩετΛݟͯੳ݁ՌΛղऍ ɹ୯ޠͷΘΕํΛݟΔ ɹίʔυޠͷΈ߹ΘͤΛௐΔ
ม ม ม ม ίʔ υ
ม ม ม ม Correlational Dictionary-Based ਵ࣌ : ݩͷςΩετΛݟͯੳ݁ՌΛղऍ ɹ୯ޠͷΘΕํΛݟΔ ɹίʔυޠͷΈ߹ΘͤΛௐΔ KHCoderͷ͍ํ
ஈ֊1 σʔλશମΛੳ (Correlational) ɹ1-1 Α͘ग़Δ୯ޠΛݟΔ ɹ1-2 ୯ޠಉ࢜ͷؔΛݟΔ ɹ1-3 ୯ޠΛͱʹจষಉ࢜ͷؔΛݟΔ ɹ1-4
༰͕ࣅͨจষΛάϧʔϓ͚͢Δ ɹ1-5 (σʔλΛऔΓग़͢) ஈ֊2 ੳऀͷߟ͑ΛͱʹσʔλΛੳ (Dictionary-Based) ɹ2-1Α͘ग़ΔίʔυΛݟΔ ɹ2-2 ίʔυಉ࢜ͷؔΛݟΔ ɹ2-3 ίʔυΛͱʹจষಉ࢜ͷؔΛݟΔ ɹ2-4 (σʔλΛऔΓग़͢) ਵ࣌ ݩͷςΩετΛݟͯੳ݁ՌΛղऍ ɹa-1 ୯ޠͷΘΕํΛݟΔ ɹa-2 ίʔυޠͷΈ߹ΘͤΛௐΔ ࢿྉ̖ɹ̠̝ɹ̴̘̳̾́ϦϑΝϨϯεɾϚχϡΞϧ ࢿྉ̗ɹ̠̝ɹ̴̘̳̾́ͷ༻݅ͱͦͷߟ͑ํ
1-1Α͘ग़Δ୯ޠΛݟΔ
நग़ޠϦετ • Ͳͷޠ͕Կճग़ݱ͍ͯ͠Δ͔ʁ
1-2 ୯ޠಉ࢜ͷؔΛݟΔ
ڞىωοτϫʔΫ • ୯ޠؒͷڞىؔΛදࣔ
1-3 ୯ޠΛͱʹจষಉ࢜ͷؔΛݟΔ
ରԠੳ
1-4 ༰͕ࣅͨจষΛάϧʔϓ͚͢Δ
Ϋϥελʔੳ • จΛմ͝ͱʹྨ͢Δ
2-1Α͘ग़ΔίʔυΛݟΔ
୯७ूܭ
2-2 ίʔυಉ࢜ͷؔΛݟΔ
֊తΫϥελʔੳ
2-3 ίʔυΛͱʹจষಉ࢜ͷؔΛݟΔ
Ϋϩεूܭ
a-1 ୯ޠͷΘΕํΛݟΔ
KWICίϯίʔμϯε • લޙͷจ຺Λදࣔ
a-2 ίʔυޠͷΈ߹ΘͤΛௐΔ
จষݕࡧ
·ͱΊ
·ͱΊ • KHCoderςΩετੳΛ͢Δπʔϧ • WindowsͰ͓͏ • ͏ͱ͖ຊΛಡ͏
Bag of Words
֊తΫϥελϦϯά • BoW͔Βࣅ͍ͯΔ୯ޠಉ࢜Λ Ϋϥελ(մ)ͱͯͭ͠ͳ͍͛ͯΔਤ
MDS(ଟ࣍ݩईߏ๏) • BoWΛ1ʙ3࣍ݩʹѹॖͨ͠ਤ
ࣗݾ৫ԽϚοϓ • BoWΛ2࣍ݩѹॖ͠ɺࣅͨ • ୯ޠಉ࢜ͰΫϥελϦϯά
֎෦มͱݟग़͠
ίʔσΟϯάϧʔϧʹΑΔݕࡧ
ίʔυͷΫϩεूܭ
ίʔυͷΫϩεूܭ(όϒϧ)
ίʔυͷΫϩεूܭ(ંΕઢ)
౷ܭֶ = σʔλͷू·ΓͷಛΛΔ͜ͱ Δ → σʔλऩू = ूΊΔɺՃ͢Δ ಛ =
جຊ౷ܭྔΛݟΔ ୯มྔղੳ = 1छྨͷσʔλͷಛΛݟΔɺՃ͢ Δ 2มྔղੳ = 2छྨͷσʔλͷಛΛݟΔɺՃ͢Δ ଟมྔղੳ = ༧ଌ͢Δɺཁ͢Δ
KHCoder͕ѻ͏σʔλͷܗࣜ = ςΩετܕσʔλ Dictionary-based Ξϓϩʔν = ੳऀͷج४ͰɺςΩετΛྨ ޙɺੳ͢Δߟ͑ํ Correlational Ξϓϩʔν
= ౷ܭֶతͳج४ͰɺςΩετΛྨ ޙɺੳ͢Δߟ͑ํ KHCoder = Corre & Dic͕Ͱ͖Δ Corre → Dic = શσʔλΛଟมྔղੳ → σʔλશମΛཁ →ɹ ίʔσΟϯάϧʔϧʹج͍ͮͯଟมྔղੳ → ੳऀ͕࣋ͭཧͷࠜ ڌΛऔΓग़͢ Corre → DicʹΑͬͯɺੳऀͷཧҙࣝΛௐΔ্Ͱɺ৴ པੑ٬؍ੑΛ্Ͱ͖Δ