KH Coderチュートリアル(スライド版)
by
HIGUCHI Koichi
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
,)$PEFSνϡʔτϦΞϧ ᕸੴʰ͜͜ΖʱΛࡐʹ ʲεϥΠυ൛ʳ 1
Slide 2
Slide 2 text
ຊνϡʔτϦΞϧͷ༰ 2 1. KH Coderの準備 2. プロジェクト作成と前処理 3. 頻出語と共起 4. それぞれの部(上・中・下)に特徴的な語 5. コーディングによるコンセプトの抽出
Slide 3
Slide 3 text
3 1. KH Coderの準備
Slide 4
Slide 4 text
4 ը໘ͷҊʹͦͬͯɺ ʮ࣍ʯʮΠϯετʔϧʯ ͳͲͷϘλϯΛΫϦοΫ Πϯετʔϧ
Slide 5
Slide 5 text
5 ,)$PEFSͷىಈํ๏ ᶃ σεΫτοϓʹ࡞͞Εͨ ΞΠίϯΛμϒϧΫϦοΫ ᶄ ղౚઌϑΥϧμ͕։͘ͷͰɺ ʮkh_coder.exeʯΛμϒϧΫϦοΫ ˞1$ͷઃఆʹΑͬͯɺ ňkh_coderʼn ͷΑ͏ʹɺϑΝΠϧ໊ͷ ʮʯϐϦΦυҎ߱Λলུͨ͠ঢ়ଶͰදࣔ͞Ε·͢ɻ
Slide 6
Slide 6 text
6 2. プロジェクト作成と 前処理
Slide 7
Slide 7 text
ʲղઆʳੳͷͶΒ͍ͱਐΊํ 7 ຊϖʔδͷΑ͏ʹλΠτϧ͕ʲղઆʳͰ࢝·Δϖʔδ Ͱૢ࡞ෆཁͰ͢ɻ͓ಡΈ͍͚ͨͩͩ͘Ͱ݁ߏͰ͢ɻ 漱石『こころ』の探索的分析 物語最後の「先生」の自殺が突然で不自然とい う批判はもっともか? 『こころ』の人間観、人間の罪とは? 分析の手順は大きく分けて2段階 語を自動的に取り出して集計し、予断を交えず にデータの全体像を探る コーディングを行うことで、分析者の観点を 活かしてコンセプトを取り出し、分析を深める
Slide 8
Slide 8 text
ʲղઆʳσʔλͷ४උ 8 ʰ͜͜Ζʱ্ɾதɾԼͷ ෦ߏɻ෦ͷத͕͞ΒʹҰ ɾೋɾࡾͳͲͷষʹ͔ΕΔ &YDFMͰͭͷྻʹςΩετΛ ೖྗ͠ɺ΄͔ͷྻʹςΩετ Ҏ֎ͷใʢࠓճ෦ষͷ ൪߸ʣΛೖྗɻςΩετҎ֎ ͷใͷ͜ͱΛʮ֎෦มʯ ͱݺͿɻ ߦʹྻͷ໊લΛೖྗ ߦ͔ΒσʔλΛೖྗ ͭͷγʔτʹೖྗ ˞σʔλྔ͕ଟͯ͘,) $PEFSͰ ΤϥʔʹͳΔ߹ɺ$47ܗࣜͰ อଘ͔ͯ͠Β,) $PEFS
Slide 9
Slide 9 text
ϓϩδΣΫτ࡞ʢੳ͢ΔϑΝΠϧΛࢦఆʣ 9 ᶃ ϝχϡʔ͔ΒňϓϩδΣΫτʼn ʮ৽نʯΛΫϦοΫ ᶄ ňࢀরʼn ΛΫϦοΫͯ͠ ňtutorial_jpʼnϑ Υ ϧ μ ͷ ňkokoro.xlsʼnʢ&YDFMΞΠί ϯʣΛ։͘ ᶆ ΫϦοΫ ࣍ճ,)$PEFSΛىಈͨ࣌͠ʮ৽نʯͰͳ͘ɺʮϓϩδ ΣΫτʼnʮ։͘ʯΛબͯ͠ɺطଘͷϓϩδΣΫτΛ։͘ ͜ͷ෦ΛʮϝχϡʔʯͱݺͿ ᶅʮςΩετʼn ྻͱňຊޠʼn ͕બ͞Ε͍ͯΔ͜ͱΛ֬ೝ
Slide 10
Slide 10 text
ڧ੍நग़͢Δޠͷࢦఆ 10 ᶃ ϝχϡʔ͔ΒʮલॲཧʯʮޠͷऔࣺબʯΛબ ᶄ ʮҰਓʯʮೋਓʯͱೖྗ ᶅ ΫϦοΫ ॏཁͳݴ༿ͳͷʹɺ ޠͱͯ͠நग़͞Εͳ ͍࣌ʮڧ੍நग़ʯ ňҰʼnͱňਓʼnʹ ͔ Ε ͯ͠·͏Α͏ͳŊׂ ͕ࡉ͔͗͢Δ߹ʹ ༗ޮ ࡉ͔͗͢ΔׂΛચ ͍ ग़ ͢ ʹ ňલ ॲ ཧʼn ňෳ ߹ ޠ ͷ ݕ ग़ʼnίϚ ϯυ͕ศར
Slide 11
Slide 11 text
લॲཧͷ࣮ߦ 11 ňલॲཧʼn ͱςΩετ த͔ΒࣗಈతʹޠΛऔ Γग़ͯ͠ੳͷ४උΛ ͢Δॲཧ ͜ͷॲཧΛ࣮ߦ͓ͯ͠ ͔ͳ͍ͱੳߦͳ͑ ͳ͍ ᶃ ϝχϡʔ͔Βʮલॲཧʯʮલॲཧͷ࣮ߦʯΛબ ᶄ ΫϦοΫ
Slide 12
Slide 12 text
12 3. 頻出語と共起ネットワーク
Slide 13
Slide 13 text
நग़ޠϦετ 13 ᶃ ϝχϡʔ͔Βʮπʔϧʯ ʮநग़ޠʯʮநग़ޠϦετʯ খઆͳͷͰओཁਓ্͕Ґʹ ňࢮ͵ʼn͕ճͱଟ͘ग़ݱ ňҰਓʼnΑΓňೋਓʼnͷํ͕ଟ͍ʂ εΫϩʔϧͯ֬͠ೝͯ͠Լ͍͞ ׆༻ͷ͋Δޠجຊܗʹͯ͠ நग़ˍΧϯτ FYʮΒͳ͍ʯˠʮΔʯ ᶄ ൪߸ΛΫϦοΫͰ׆༻ܗΛදࣔ ᶅ நग़ޠΛΫϦο Ϋ͢Δͱň,8*$ί ϯίʔμϯεʼn
Slide 14
Slide 14 text
ʮ,8*$ίϯίʔμϯεʯ 14 ੳ݁ՌதͷޠΛΫ ϦοΫ͢Ε͜ͷը ໘͕։͘ ͚ͩͰͳ͘ޠͷ લޙͷจ຺ DPOUFYU ΛݟΔͷ ͕େ ,8*$,FZ8PSE *O$POUFYU ᶃ μϒϧΫϦοΫͰ͞Βʹ ͍ൣғͷจ຺ΛදࣔՄೳ ᶄ ňूܭʼnΛΫϦοΫ͢Δ ͱňίϩέʔγϣϯ౷ܭʼn
Slide 15
Slide 15 text
ʮ,8*$ίϯίʔμϯεʯ 15 ᶃ લϖʔδͷखॱͰňίϩέʔγϣϯ౷ܭʼn͕։͘ ᶄ ΫϦοΫ͢Εಛఆ ͷࢺͷޠ͚ͩΛදࣔՄ ʮࠨʯͱɺࠨଆͷͭɺ͢ͳ Θͪલʹग़ݱ͍ͯͨ͠ճͷ͜ͱ ʮʯʮࢮ͵ʯͷޠલʹճग़ݱͨ͠ લޙʹଟ͘ग़ݱ͍ͯͨ͠ޠΛ ௨ͯ͡ɺݕࡧରޠ͕ͱͷ ςΩετதͰͲ͏ΘΕ͍ͯ ͔ͨͱ͍͏จ຺Λ͏͔͕͑Δ
Slide 16
Slide 16 text
ڞىωοτϫʔΫ 16 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮநग़ޠʯʮڞىωοτϫʔΫʯˠʮ0,ʯ ೖྗ&YDFMϑΝΠϧͷಉ͡ηϧʹΑ ͘Ұॹʹग़ݱ͢Δޠʢڞى͢Δޠ)Λɺ ઢͰ݁ΜͩωοτϫʔΫɻڧ݁͘ͼ ͍ͭͨ෦͝ͱʹࣗಈతʹάϧʔϓ ͚ˍ৭͚ɻ ňௐʼnΛΫϦοΫ͢Ε֤छΦϓγϣϯΛมߋՄɻ &Y ઢʢFEHFʣͷຊΛň্Ґ ʼn͔Βňʼnɻ ᶄ நग़ޠΛΫϦοΫ͢Δͱ ň,8*$ίϯίʔμϯεʼn ʮอଘʯΛΫϦοΫ ͢Εը૾ϑΝΠϧ ͱͯ͠อଘՄɻ
Slide 17
Slide 17 text
ʲղઆʳޠͷڞىΛ୳ࡧ͢Δํ๏ 17 ෳͷํ๏ͷத͔ΒબՄ ڞى͢Δޠͷάϧʔϓ͔Βɺσʔλதͷςʔ Ϛͳ͍͠τϐοΫΛ୳ࡧͰ͖Δ ͜ΕΒͷੳʹ෦Ͱň3ʼnͱ͍͏౷ܭιϑτ ΣΞΛ༻ ڞىωοτϫʔΫ ࣗݾ৫ԽϚοϓ .%4 Ϋϥελʔੳ ※自己組織化マップは長時間を要するので注意
Slide 18
Slide 18 text
18 4. それぞれの部(上・中・下)に 特徴的な語 ――特徴語 & 対応分析――
Slide 19
Slide 19 text
ͦΕͧΕͷ෦ͷಛޠϦετ 19 ᶄ ʮ෦ʯΛΫϦοΫ ᶅ ୯ҐɿʮจʯΛબ ᶆ ʮಛޠʯʮҰཡʢ&YDFMܗࣜʣʯΛબ ᶃ ϝχϡʔ͔Βʮπʔϧʯʮ֎෦มͱݟग़͠ʯ ͭͷ෦ʢ্ɾதɾԼʣͷ ಛޠ্͕ҐޠͣͭϦ ετΞοϓ͞ΕΔɻ
Slide 20
Slide 20 text
ʲղઆʳಛޠ͔ΒΈΔޠͷྲྀΕ 20 ্Ͱओਓެͱʮઌੜʯ ͕ަྲྀΛਂΊ͍ͯ͘ɻ͔͠ ͠ʮઌੜʯͷΑ͘ʮղ Βʯͳ͍͜ͱଟ͍ɻ &Y ʮઌੜͷͷ͏ͪͰͨͩҰͭఈ·Ͱฉ͖͔ͨͬͨͷɼਓ͕͍ؒ͟ͱ ͍͏ؒࡍʹɺ୭ͰѱਓʹͳΔͱ͍͏ݴ༿ͷҙຯͰ͋ͬͨɻ୯ͳΔݴ༿ͱ ͯ͠ɺ͜Ε͚ͩͰࢲʹղΒͳ͍ࣄͳ͔ͬͨɻ͔͠͠ʜʯ ্ೋ தͰओਓެ͕࣮Ոʹ Γʮʯʮʯͱͷձ ͕ଟ͘ͳΔɻʮઌੜʯͱ ʮखࢴʯΛΓͱΓɻ Լʮઌੜʯ͕ओਓެ ʹૹ͍ͬͨҨॻɻ ༑ʮ,ʯͱʮ͓͞Μʯ ͱͷࡾ֯ؔͳͲΛ௨ ͯ͡ɺ্Ͱओਓެʹ ಡऀʹʮղΒʯͳ ͔ͬͨࣄฑ͕໌Β͔ʹɻ
Slide 21
Slide 21 text
ňରԠੳʼnʹΑΔࢹ֮తͳ୳ࡧ 21 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮநग़ޠʯʮରԠੳʯ ᶄʮ෦ʯ͕બ͞Ε ͍ͯΔ͜ͱΛ֬ೝ ᶅ ΫϦοΫ ෦ʢ্ɾதɾԼʣͷ ಛΛάϥϑΟΧϧ ʹ୳ࡧͰ͖Δ
Slide 22
Slide 22 text
ʲղઆʳňରԠੳʼnͷݟํ 22 ݪ ᶃ ݪ ۙʹ ͜Εͱ͍ͬͯಛ ͷͳ͍ޠ͕ू·Δ ᶄ ݪ ͔Βݟͯɺ ʮ্@ઌੜͱࢲʯͷํ ʹ͋Δޠɺͦͯ͠ݪ ͔ΒΕ͍ͯΔޠ΄Ͳɺ ্ʹಛతʂ ˞ಛޠͷҰཡ͔ΒಡΈ औΕ্ͨɾதɾԼͷಛ ͱɺ΄΅ಉ͡ಛΛରԠ ੳ͔ΒಡΈऔΕΔɻ ᶅ ಉ༷ʹɺݪ ͔Βݟͯʮத@྆ͱ ࢲʯͷํʹΕ͍ͯΔ ޠ΄Ͳɺதʹಛతʂ Լಉ͡ɻ
Slide 23
Slide 23 text
23 5. コーディングによる コンセプトの抽出
Slide 24
Slide 24 text
24 ˎਓͷࢮ ࢮ͵ PS ࡴ͢ PS ͘ͳΔ 語ではなくコンセプトを数えたい場合もある 例えば「人の死」というコンセプトは、「死ぬ」だけ でなく「殺す」という語でも表現される コンセプトを数えるためのコーディングルール ʲղઆʳ ίʔσΟϯάͱ ίʔυʢίϯηϓτʣͷ໊લ ίʔυΛ༩͢Δ݅ɻʮࢮ͵ʯ ʮࡴ͢ʯʮ͘ͳΔʯͷͲΕ͔͕ग़ ݱ͍ͯ͠Δจॻɺʮˎਓͷࢮʯʹ ݴٴ͍ͯͨ͠ͱݟͳ͞ΕΔɻ νϡʔτϦΞϧͰ༻ ͢ΔʮUIFNFUYUʯ
Slide 25
Slide 25 text
ίʔσΟϯάϧʔϧʹΑΔݕࡧ 25 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮจॻʯʮจॻݕࡧʯ ᶄ ʮࢀরʯΛΫϦοΫͯ͠ʢtutorial_jp ϑΥϧμͷʣʮtheme.txtʯΛ։͘ ᶆ μϒϧΫϦοΫ ᶇ μϒϧΫϦοΫͰηϧશମΛදࣔ ίʔσΟϯάϧʔϧ࡞࣌ʹɺͲͷΑ͏ͳจॻʹίʔυ ͕༩͞Ε͍ͯΔ͔Λݕࡧɾ֬ೝ͢Δ͜ͱ͕େ ᶅ )Λબ &YDFMͷͭͭͷη ϧ Λ ,) $PEFS ň)ʼn ͱೝࣝɻ)Λ બ͢Δͱηϧ୯Ґ ͷݕࡧʹɻ
Slide 26
Slide 26 text
ίʔυͷΫϩεूܭʢ෦͝ͱʣ 26 ᶃ ϝχϡʔ͔ΒʮπʔϧʯʮίʔσΟϯάʯʮΫϩεूܭʯ ᶄʮࢀরʯΛΫϦοΫͯ͠ʮtheme.txtʯΛ։͘ ˞ňtheme.txtʼn ͱ͢Ͱʹදࣔ͞Ε͍ͯΔ߹ૢ࡞ෆཁ ᶇʮόϒϧʯΛΫϦοΫ ͯ͠ϓϩοτΛ࡞ ᶆʮूܭʯΛΫϦοΫ ֤ίʔυ͕ɺͲͷ෦Ͱ ଟ͘ग़ݱ͍͔ͯͨ͠Λ ࣔ͢ϓϩοτ ᶅ )Λબ ňԼʼn Ͱηϧͷ ͏ͪηϧ ͕ ˎ༑ʹݴٴ
Slide 27
Slide 27 text
ʲղઆʳ෦͝ͱͷूܭ͔ΒݟΔޠͷྲྀΕ 27 ᶃ ԼͰ֯ؔͷ ͍͖͔ͭ͞Β༑͕ ࣗࡴɻͦͷͨΊʮ࿀ Ѫ ʯ ʮ ༑ ʯ ʮ ৴ ༻ɾෆ৴ʯ͕ଟ͍ɻ ᶄ தͰපؾͰࢮʹṫ͢Δ ʮʯͷ༷ࢠ͕ඳ͔ΕΔɻ ᶅ தɾԼͷΑ ͏ͳਓͷࢮ ඳ͔Ε͍ͯͳ͍ ͷ ʹ ɺ ্ Ͱ ʮਓͷࢮʯ͕Ұ ఆग़ݱɻ ͳͥʁ ࣍ͷੳͰ֬ೝʂ
Slide 28
Slide 28 text
ίʔυͷΫϩεूܭʢষ͝ͱʣ 28 ᶃ ʹଓ͚ͯҎԼͷૢ࡞Λߦ͏ ᶄʮจʯΛબ ᶇʮબʯʮਓͷࢮʯΛ ΫϦοΫͯ͠άϥϑΛ࡞ ᶆʮूܭʯΛΫϦοΫ ᶅʮষʯΛબ ʮਓͷࢮʯίʔυ͕ ͲͷষͰଟ͘ग़ݱ͠ ͍͔ͯͨΛݟΔંΕ ઢάϥϑ
Slide 29
Slide 29 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 29 ᶃ ࣗࡴͷલ͚ͩΛݟ Δͱɺʮઌੜʯ͔ͳ ΓٸܹʹܾҙΛݻΊͯ ͍ΔΑ͏ʹݟ͑Δɻ ᶄ ͔͠͠ޠશମʹࢹ Λ͛Δͱɺʮઌੜʯ ͕ࢮ͵͜ͱʹࣥண͍ͯ͠ Δ༷ࢠ͕ɺ্Ͱৄࡉʹ ඳ͔Ε͍ͯΔɻ &Y ʮʜઌੜͷɼ༰ қʹࣗͷࢮͱ͍͏ԕ͍ ΛΕͳ͔ͬͨɻͦ ͏ͯͦ͠ͷࢮඞͣԞ͞ ΜͷલʹىΔͷͱԾఆ ʜ ʯ ্ࡾޒ ্ࡾޒ ্ೋ࢛
Slide 30
Slide 30 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 30 ্ࡾޒ ্ೋ࢛ ᶅ ࣗࡴͷཧ༝ͷҰ෦ʹɺ͓ ۚ࿀ʹӋ٧·Ε୭Ͱѱ ਓʹͳΔɺਓؒҰൠͷࣦ &Y ʮʜࣗ͋ͷ॑ͱಉ͡ਓؒͩͱҙࣝ ͨ࣌͠ʜɻଞʹѪΛਚ͔ͨ͠ࢲɺࣗʹ ѪΛਚ͔ͯ͠ಈ͚ͳ͘ͳͬͨͷͰ͢ʯ Լޒೋ
Slide 31
Slide 31 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 31 ্ࡾޒ ্ೋ࢛ ᶆ ࣗࡴ͕ಥવͰ ෆࣗવͱ͍͏൷ ͪΐͬͱᕸੴʹ ରͯ͠ࠅͰʁ ܭྔςΩετੳ ͷརͱͯ͠ɿ σʔλશମΛݟ ͢ࢹ͕ಘΒ ΕΔ ͰಡΉ͖ಛ తͳ෦Ͳ ͔͜୳ࡧͰ͖Δ
Slide 32
Slide 32 text
ʲղઆʳߦͳ͖ͬͯͨੳͷ·ͱΊ 32 抽出語の分析(段階1) 多く出現していた語: [抽出語リスト]p. 13 共起する語からトピックを探る:[共起ネットワーク]p. 16 部分ごとの特徴を探る: [特徴語リスト]p. 19 [対応分析]p. 21 語の実際の使われ方を見る: [KWIC]p. 14 コーディング(段階2) ルール作成と検索: [文書検索]p. 24 部分ごとの集計: [クロス集計]p. 26
Slide 33
Slide 33 text
͓ΘΓʹ 33 各操作の意味や結果の読み取り方についてより詳し くは、「KH Coderの本」第3章をご参照ください。 『社会調査のための計量テキスト分析 第2版』 謝辞 本チュートリアルの作成と改善にあたっては、立命 館大学産業社会学部ならびに大学院社会学研究科の 皆さまにご協力いただきました。 ୈ൛ͰɺΑΓΑ͍ੳɾ׆༻ͷ ͨΊʹݚڀࣄྫͷϨϏϡʔΛ૿ิ͠ɺ ,) $PEFS ʹରԠ͠·ͨ͠ɻ
Slide 34
Slide 34 text
ެࣜೖॻ͕ग़·ͨ͠ʂ 34 「これだけ押さえておけ ば大丈夫」という機能を、 厳選してご紹介。 初めての方は、こちらか らお読みいただくとス ムーズでしょう。