KH Coderチュートリアル(スライド版)
by
HIGUCHI Koichi
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
,)$PEFSνϡʔτϦΞϧ ᕸੴʰ͜͜ΖʱΛࡐʹ ʲεϥΠυ൛ʳ 1
Slide 2
Slide 2 text
ຊνϡʔτϦΞϧͷ༰ 2 1. KH Coderの準備 2. プロジェクト作成と前処理 3. 頻出語と共起 4. それぞれの部(上・中・下)に特徴的な語 5. コーディングによるコンセプトの抽出
Slide 3
Slide 3 text
3 1. KH Coderの準備
Slide 4
Slide 4 text
4 ը໘ͷҊʹͦͬͯɺ ʮ࣍ʯʮΠϯετʔϧʯ ͳͲͷϘλϯΛΫϦοΫ Πϯετʔϧ
Slide 5
Slide 5 text
5 ,)$PEFSͷىಈํ๏ ᶃ σεΫτοϓʹ࡞͞Εͨ ΞΠίϯΛμϒϧΫϦοΫ ᶄ ղౚઌϑΥϧμ͕։͘ͷͰɺ ʮkh_coder.exeʯΛμϒϧΫϦοΫ ˞1$ͷઃఆʹΑͬͯɺ ňkh_coderʼn ͷΑ͏ʹɺϑΝΠϧ໊ͷ ʮʯϐϦΦυҎ߱Λলུͨ͠ঢ়ଶͰදࣔ͞Ε·͢ɻ
Slide 6
Slide 6 text
6 2. プロジェクト作成と 前処理
Slide 7
Slide 7 text
ʲղઆʳੳͷͶΒ͍ͱਐΊํ 7 ຊϖʔδͷΑ͏ʹλΠτϧ͕ʲղઆʳͰ࢝·Δϖʔδ Ͱૢ࡞ෆཁͰ͢ɻ͓ಡΈ͍͚ͨͩͩ͘Ͱ݁ߏͰ͢ɻ 漱石『こころ』の探索的分析 物語最後の「先生」の自殺が突然で不自然とい う批判はもっともか? 『こころ』の人間観、人間の罪とは? 分析の手順は大きく分けて2段階 語を自動的に取り出して集計し、予断を交えず にデータの全体像を探る コーディングを行うことで、分析者の観点を 活かしてコンセプトを取り出し、分析を深める
Slide 8
Slide 8 text
ʲղઆʳσʔλͷ४උ 8 ʰ͜͜Ζʱ্ɾதɾԼͷ ෦ߏɻ෦ͷத͕͞ΒʹҰ ɾೋɾࡾͳͲͷষʹ͔ΕΔ &YDFMͰͭͷྻʹςΩετΛ ೖྗ͠ɺ΄͔ͷྻʹςΩετ Ҏ֎ͷใʢࠓճ෦ষͷ ൪߸ʣΛೖྗɻςΩετҎ֎ ͷใͷ͜ͱΛʮ֎෦มʯ ͱݺͿɻ ߦʹྻͷ໊લΛೖྗ ߦ͔ΒσʔλΛೖྗ ͭͷγʔτʹೖྗ ˞σʔλྔ͕ଟͯ͘,) $PEFSͰ ΤϥʔʹͳΔ߹ɺ$47ܗࣜͰ อଘ͔ͯ͠Β,) $PEFS
Slide 9
Slide 9 text
ϓϩδΣΫτ࡞ʢੳ͢ΔϑΝΠϧΛࢦఆʣ 9 ᶃ ϝχϡʔ͔ΒňϓϩδΣΫτʼn ʮ৽نʯΛΫϦοΫ ᶄ ňࢀরʼn ΛΫϦοΫͯ͠ ňtutorial_jpʼnϑ Υ ϧ μ ͷ ňkokoro.xlsʼnʢ&YDFMΞΠί ϯʣΛ։͘ ᶆ ΫϦοΫ ࣍ճ,)$PEFSΛىಈͨ࣌͠ʮ৽نʯͰͳ͘ɺʮϓϩδ ΣΫτʼnʮ։͘ʯΛબͯ͠ɺطଘͷϓϩδΣΫτΛ։͘ ͜ͷ෦ΛʮϝχϡʔʯͱݺͿ ᶅʮςΩετʼn ྻͱňຊޠʼn ͕બ͞Ε͍ͯΔ͜ͱΛ֬ೝ
Slide 10
Slide 10 text
ڧ੍நग़͢Δޠͷࢦఆ 10 ᶃ ϝχϡʔ͔ΒʮલॲཧʯʮޠͷऔࣺબʯΛબ ᶄ ʮҰਓʯʮೋਓʯͱೖྗ ᶅ ΫϦοΫ ॏཁͳݴ༿ͳͷʹɺ ޠͱͯ͠நग़͞Εͳ ͍࣌ʮڧ੍நग़ʯ ňҰʼnͱňਓʼnʹ ͔ Ε ͯ͠·͏Α͏ͳŊׂ ͕ࡉ͔͗͢Δ߹ʹ ༗ޮ ࡉ͔͗͢ΔׂΛચ ͍ ग़ ͢ ʹ ňલ ॲ ཧʼn ňෳ ߹ ޠ ͷ ݕ ग़ʼnίϚ ϯυ͕ศར
Slide 11
Slide 11 text
લॲཧͷ࣮ߦ 11 ňલॲཧʼn ͱςΩετ த͔ΒࣗಈతʹޠΛऔ Γग़ͯ͠ੳͷ४උΛ ͢Δॲཧ ͜ͷॲཧΛ࣮ߦ͓ͯ͠ ͔ͳ͍ͱੳߦͳ͑ ͳ͍ ᶃ ϝχϡʔ͔Βʮલॲཧʯʮલॲཧͷ࣮ߦʯΛબ ᶄ ΫϦοΫ
Slide 12
Slide 12 text
12 3. 頻出語と共起ネットワーク
Slide 13
Slide 13 text
நग़ޠϦετ 13 ᶃ ϝχϡʔ͔Βʮπʔϧʯ ʮநग़ޠʯʮநग़ޠϦετʯ খઆͳͷͰओཁਓ্͕Ґʹ ňࢮ͵ʼn͕ճͱଟ͘ग़ݱ ňҰਓʼnΑΓňೋਓʼnͷํ͕ଟ͍ʂ εΫϩʔϧͯ֬͠ೝͯ͠Լ͍͞ ׆༻ͷ͋Δޠجຊܗʹͯ͠ நग़ˍΧϯτ FYʮΒͳ͍ʯˠʮΔʯ ᶄ ൪߸ΛΫϦοΫͰ׆༻ܗΛදࣔ ᶅ நग़ޠΛΫϦο Ϋ͢Δͱň,8*$ί ϯίʔμϯεʼn
Slide 14
Slide 14 text
ʮ,8*$ίϯίʔμϯεʯ 14 ੳ݁ՌதͷޠΛΫ ϦοΫ͢Ε͜ͷը ໘͕։͘ ͚ͩͰͳ͘ޠͷ લޙͷจ຺ DPOUFYU ΛݟΔͷ ͕େ ,8*$,FZ8PSE *O$POUFYU ᶃ μϒϧΫϦοΫͰ͞Βʹ ͍ൣғͷจ຺ΛදࣔՄೳ ᶄ ňूܭʼnΛΫϦοΫ͢Δ ͱňίϩέʔγϣϯ౷ܭʼn
Slide 15
Slide 15 text
ʮ,8*$ίϯίʔμϯεʯ 15 ᶃ લϖʔδͷखॱͰňίϩέʔγϣϯ౷ܭʼn͕։͘ ᶄ ΫϦοΫ͢Εಛఆ ͷࢺͷޠ͚ͩΛදࣔՄ ʮࠨʯͱɺࠨଆͷͭɺ͢ͳ Θͪલʹग़ݱ͍ͯͨ͠ճͷ͜ͱ ʮʯʮࢮ͵ʯͷޠલʹճग़ݱͨ͠ લޙʹଟ͘ग़ݱ͍ͯͨ͠ޠΛ ௨ͯ͡ɺݕࡧରޠ͕ͱͷ ςΩετதͰͲ͏ΘΕ͍ͯ ͔ͨͱ͍͏จ຺Λ͏͔͕͑Δ
Slide 16
Slide 16 text
ڞىωοτϫʔΫ 16 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮநग़ޠʯʮڞىωοτϫʔΫʯˠʮ0,ʯ ೖྗ&YDFMϑΝΠϧͷಉ͡ηϧʹΑ ͘Ұॹʹग़ݱ͢Δޠʢڞى͢Δޠ)Λɺ ઢͰ݁ΜͩωοτϫʔΫɻڧ݁͘ͼ ͍ͭͨ෦͝ͱʹࣗಈతʹάϧʔϓ ͚ˍ৭͚ɻ ňௐʼnΛΫϦοΫ͢Ε֤छΦϓγϣϯΛมߋՄɻ &Y ઢʢFEHFʣͷຊΛň্Ґ ʼn͔Βňʼnɻ ᶄ நग़ޠΛΫϦοΫ͢Δͱ ň,8*$ίϯίʔμϯεʼn ʮอଘʯΛΫϦοΫ ͢Εը૾ϑΝΠϧ ͱͯ͠อଘՄɻ
Slide 17
Slide 17 text
ʲղઆʳޠͷڞىΛ୳ࡧ͢Δํ๏ 17 ෳͷํ๏ͷத͔ΒબՄ ڞى͢Δޠͷάϧʔϓ͔Βɺσʔλதͷςʔ Ϛͳ͍͠τϐοΫΛ୳ࡧͰ͖Δ ͜ΕΒͷੳʹ෦Ͱň3ʼnͱ͍͏౷ܭιϑτ ΣΞΛ༻ ڞىωοτϫʔΫ ࣗݾ৫ԽϚοϓ .%4 Ϋϥελʔੳ ※自己組織化マップは長時間を要するので注意
Slide 18
Slide 18 text
18 4. それぞれの部(上・中・下)に 特徴的な語 ――特徴語 & 対応分析――
Slide 19
Slide 19 text
ͦΕͧΕͷ෦ͷಛޠϦετ 19 ᶄ ʮ෦ʯΛΫϦοΫ ᶅ ୯ҐɿʮจʯΛબ ᶆ ʮಛޠʯʮҰཡʢ&YDFMܗࣜʣʯΛબ ᶃ ϝχϡʔ͔Βʮπʔϧʯʮ֎෦มͱݟग़͠ʯ ͭͷ෦ʢ্ɾதɾԼʣͷ ಛޠ্͕ҐޠͣͭϦ ετΞοϓ͞ΕΔɻ
Slide 20
Slide 20 text
ʲղઆʳಛޠ͔ΒΈΔޠͷྲྀΕ 20 ্Ͱओਓެͱʮઌੜʯ ͕ަྲྀΛਂΊ͍ͯ͘ɻ͔͠ ͠ʮઌੜʯͷΑ͘ʮղ Βʯͳ͍͜ͱଟ͍ɻ &Y ʮઌੜͷͷ͏ͪͰͨͩҰͭఈ·Ͱฉ͖͔ͨͬͨͷɼਓ͕͍ؒ͟ͱ ͍͏ؒࡍʹɺ୭ͰѱਓʹͳΔͱ͍͏ݴ༿ͷҙຯͰ͋ͬͨɻ୯ͳΔݴ༿ͱ ͯ͠ɺ͜Ε͚ͩͰࢲʹղΒͳ͍ࣄͳ͔ͬͨɻ͔͠͠ʜʯ ্ೋ தͰओਓެ͕࣮Ոʹ Γʮʯʮʯͱͷձ ͕ଟ͘ͳΔɻʮઌੜʯͱ ʮखࢴʯΛΓͱΓɻ Լʮઌੜʯ͕ओਓެ ʹૹ͍ͬͨҨॻɻ ༑ʮ,ʯͱʮ͓͞Μʯ ͱͷࡾ֯ؔͳͲΛ௨ ͯ͡ɺ্Ͱओਓެʹ ಡऀʹʮղΒʯͳ ͔ͬͨࣄฑ͕໌Β͔ʹɻ
Slide 21
Slide 21 text
ňରԠੳʼnʹΑΔࢹ֮తͳ୳ࡧ 21 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮநग़ޠʯʮରԠੳʯ ᶄʮ෦ʯ͕બ͞Ε ͍ͯΔ͜ͱΛ֬ೝ ᶅ ΫϦοΫ ෦ʢ্ɾதɾԼʣͷ ಛΛάϥϑΟΧϧ ʹ୳ࡧͰ͖Δ
Slide 22
Slide 22 text
ʲղઆʳňରԠੳʼnͷݟํ 22 ݪ ᶃ ݪ ۙʹ ͜Εͱ͍ͬͯಛ ͷͳ͍ޠ͕ू·Δ ᶄ ݪ ͔Βݟͯɺ ʮ্@ઌੜͱࢲʯͷํ ʹ͋Δޠɺͦͯ͠ݪ ͔ΒΕ͍ͯΔޠ΄Ͳɺ ্ʹಛతʂ ˞ಛޠͷҰཡ͔ΒಡΈ औΕ্ͨɾதɾԼͷಛ ͱɺ΄΅ಉ͡ಛΛରԠ ੳ͔ΒಡΈऔΕΔɻ ᶅ ಉ༷ʹɺݪ ͔Βݟͯʮத@྆ͱ ࢲʯͷํʹΕ͍ͯΔ ޠ΄Ͳɺதʹಛతʂ Լಉ͡ɻ
Slide 23
Slide 23 text
23 5. コーディングによる コンセプトの抽出
Slide 24
Slide 24 text
24 ˎਓͷࢮ ࢮ͵ PS ࡴ͢ PS ͘ͳΔ 語ではなくコンセプトを数えたい場合もある 例えば「人の死」というコンセプトは、「死ぬ」だけ でなく「殺す」という語でも表現される コンセプトを数えるためのコーディングルール ʲղઆʳ ίʔσΟϯάͱ ίʔυʢίϯηϓτʣͷ໊લ ίʔυΛ༩͢Δ݅ɻʮࢮ͵ʯ ʮࡴ͢ʯʮ͘ͳΔʯͷͲΕ͔͕ग़ ݱ͍ͯ͠Δจॻɺʮˎਓͷࢮʯʹ ݴٴ͍ͯͨ͠ͱݟͳ͞ΕΔɻ νϡʔτϦΞϧͰ༻ ͢ΔʮUIFNFUYUʯ
Slide 25
Slide 25 text
ίʔσΟϯάϧʔϧʹΑΔݕࡧ 25 ᶃ ϝχϡʔ͔Βʮπʔϧʯʮจॻʯʮจॻݕࡧʯ ᶄ ʮࢀরʯΛΫϦοΫͯ͠ʢtutorial_jp ϑΥϧμͷʣʮtheme.txtʯΛ։͘ ᶆ μϒϧΫϦοΫ ᶇ μϒϧΫϦοΫͰηϧશମΛදࣔ ίʔσΟϯάϧʔϧ࡞࣌ʹɺͲͷΑ͏ͳจॻʹίʔυ ͕༩͞Ε͍ͯΔ͔Λݕࡧɾ֬ೝ͢Δ͜ͱ͕େ ᶅ )Λબ &YDFMͷͭͭͷη ϧ Λ ,) $PEFS ň)ʼn ͱೝࣝɻ)Λ બ͢Δͱηϧ୯Ґ ͷݕࡧʹɻ
Slide 26
Slide 26 text
ίʔυͷΫϩεूܭʢ෦͝ͱʣ 26 ᶃ ϝχϡʔ͔ΒʮπʔϧʯʮίʔσΟϯάʯʮΫϩεूܭʯ ᶄʮࢀরʯΛΫϦοΫͯ͠ʮtheme.txtʯΛ։͘ ˞ňtheme.txtʼn ͱ͢Ͱʹදࣔ͞Ε͍ͯΔ߹ૢ࡞ෆཁ ᶇʮόϒϧʯΛΫϦοΫ ͯ͠ϓϩοτΛ࡞ ᶆʮूܭʯΛΫϦοΫ ֤ίʔυ͕ɺͲͷ෦Ͱ ଟ͘ग़ݱ͍͔ͯͨ͠Λ ࣔ͢ϓϩοτ ᶅ )Λબ ňԼʼn Ͱηϧͷ ͏ͪηϧ ͕ ˎ༑ʹݴٴ
Slide 27
Slide 27 text
ʲղઆʳ෦͝ͱͷूܭ͔ΒݟΔޠͷྲྀΕ 27 ᶃ ԼͰ֯ؔͷ ͍͖͔ͭ͞Β༑͕ ࣗࡴɻͦͷͨΊʮ࿀ Ѫ ʯ ʮ ༑ ʯ ʮ ৴ ༻ɾෆ৴ʯ͕ଟ͍ɻ ᶄ தͰපؾͰࢮʹṫ͢Δ ʮʯͷ༷ࢠ͕ඳ͔ΕΔɻ ᶅ தɾԼͷΑ ͏ͳਓͷࢮ ඳ͔Ε͍ͯͳ͍ ͷ ʹ ɺ ্ Ͱ ʮਓͷࢮʯ͕Ұ ఆग़ݱɻ ͳͥʁ ࣍ͷੳͰ֬ೝʂ
Slide 28
Slide 28 text
ίʔυͷΫϩεूܭʢষ͝ͱʣ 28 ᶃ ʹଓ͚ͯҎԼͷૢ࡞Λߦ͏ ᶄʮจʯΛબ ᶇʮબʯʮਓͷࢮʯΛ ΫϦοΫͯ͠άϥϑΛ࡞ ᶆʮूܭʯΛΫϦοΫ ᶅʮষʯΛબ ʮਓͷࢮʯίʔυ͕ ͲͷষͰଟ͘ग़ݱ͠ ͍͔ͯͨΛݟΔંΕ ઢάϥϑ
Slide 29
Slide 29 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 29 ᶃ ࣗࡴͷલ͚ͩΛݟ Δͱɺʮઌੜʯ͔ͳ ΓٸܹʹܾҙΛݻΊͯ ͍ΔΑ͏ʹݟ͑Δɻ ᶄ ͔͠͠ޠશମʹࢹ Λ͛Δͱɺʮઌੜʯ ͕ࢮ͵͜ͱʹࣥண͍ͯ͠ Δ༷ࢠ͕ɺ্Ͱৄࡉʹ ඳ͔Ε͍ͯΔɻ &Y ʮʜઌੜͷɼ༰ қʹࣗͷࢮͱ͍͏ԕ͍ ΛΕͳ͔ͬͨɻͦ ͏ͯͦ͠ͷࢮඞͣԞ͞ ΜͷલʹىΔͷͱԾఆ ʜ ʯ ্ࡾޒ ্ࡾޒ ্ೋ࢛
Slide 30
Slide 30 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 30 ্ࡾޒ ্ೋ࢛ ᶅ ࣗࡴͷཧ༝ͷҰ෦ʹɺ͓ ۚ࿀ʹӋ٧·Ε୭Ͱѱ ਓʹͳΔɺਓؒҰൠͷࣦ &Y ʮʜࣗ͋ͷ॑ͱಉ͡ਓؒͩͱҙࣝ ͨ࣌͠ʜɻଞʹѪΛਚ͔ͨ͠ࢲɺࣗʹ ѪΛਚ͔ͯ͠ಈ͚ͳ͘ͳͬͨͷͰ͢ʯ Լޒೋ
Slide 31
Slide 31 text
ʲղઆʳʮਓͷࢮʯͷਪҠ͔Β 31 ্ࡾޒ ্ೋ࢛ ᶆ ࣗࡴ͕ಥવͰ ෆࣗવͱ͍͏൷ ͪΐͬͱᕸੴʹ ରͯ͠ࠅͰʁ ܭྔςΩετੳ ͷརͱͯ͠ɿ σʔλશମΛݟ ͢ࢹ͕ಘΒ ΕΔ ͰಡΉ͖ಛ తͳ෦Ͳ ͔͜୳ࡧͰ͖Δ
Slide 32
Slide 32 text
ʲղઆʳߦͳ͖ͬͯͨੳͷ·ͱΊ 32 抽出語の分析(段階1) 多く出現していた語: [抽出語リスト]p. 13 共起する語からトピックを探る:[共起ネットワーク]p. 16 部分ごとの特徴を探る: [特徴語リスト]p. 19 [対応分析]p. 21 語の実際の使われ方を見る: [KWIC]p. 14 コーディング(段階2) ルール作成と検索: [文書検索]p. 24 部分ごとの集計: [クロス集計]p. 26
Slide 33
Slide 33 text
͓ΘΓʹ 33 各操作の意味や結果の読み取り方についてより詳し くは、「KH Coderの本」第3章をご参照ください。 『社会調査のための計量テキスト分析 第2版』 謝辞 本チュートリアルの作成と改善にあたっては、立命 館大学産業社会学部ならびに大学院社会学研究科の 皆さまにご協力いただきました。 ୈ൛ͰɺΑΓΑ͍ੳɾ׆༻ͷ ͨΊʹݚڀࣄྫͷϨϏϡʔΛ૿ิ͠ɺ ,) $PEFS ʹରԠ͠·ͨ͠ɻ
Slide 34
Slide 34 text
ެࣜೖॻ͕ग़·ͨ͠ʂ 34 「これだけ押さえておけ ば大丈夫」という機能を、 厳選してご紹介。 初めての方は、こちらか らお読みいただくとス ムーズでしょう。