Upgrade to Pro — share decks privately, control downloads, hide ads and more …

経営学分野でのテキスト分析/Text_analysis_on_management

haaaayhay
January 25, 2019

 経営学分野でのテキスト分析/Text_analysis_on_management

テキスト分析について4年間学んだことをまとめました。
内容としては以下です。
・テキスト分析とは
・経営学分野でテキスト分析をする意義
・応用例
・学びや失敗

haaaayhay

January 25, 2019
Tweet

More Decks by haaaayhay

Other Decks in Education

Transcript

  1. 内容分析(Content Analysis) • ςΩετ෼ੳͷݹయతख๏ͷ̍ͭɻ • ໌ࣔ͞Εͨίϛϡχέʔγϣϯͷ಺༰Λ٬؍తɺମܥతʹ͔͠΋ఆ ྔతʹهड़͢Δௐٕࠪज़ʢ#FSFMTPO ʣɻ • ςΩετʹ͓͚Δಛఆͷಛ௃Λ٬؍తɺମܥతʹಉఆ͢Δ͜ͱʹΑ

    Γɺਪ࿦Λߦ͏ௐٕࠪज़ʢ,SJQQFOEPSGG ʣɻ • ௐࠪͰಘΒΕͨʢهड़తʣσʔλΛ΋ͱʹه࿥୯ҐͰ෼ੳ͠ɺ෼ ྨɾ໋໊͢Δ͜ͱʹΑͬͯ͋Δࣄ৅Λ٬؍తʹ໌Β͔ʹ͢Δ͜ͱ ʢ্໺ ʣɻ 27
  2. 内容分析の例③ 辞書の例(オズボーンのチェックリスト一部) B3時に小倉が作成したもの 31 ྫ స༻ Ԡ༻ɺந৅Խɺ໾ཱͯΔ Ԡ༻ ʙͰ͸ɺ͋΍͔Δɺ͍Θ͹ɺஔ͖׵͑Δɺಉ͡ɺมΘΒͳ͍ɺͨͱ͑Δʢྫ͑Δᄻ͑ ΔʣɺͰݴͬͨΒɺͰ΋ɺͱҰॹɺಉ༷ɺ͓͚ΔɺʹݶΒͣɺʹ͍ۙɺʹ΋ݴ͑ΔɺࣅΔɺ

    ͷ໾໨ɺ෩ɺ·͘͞͠ɺ·͞ʹɺ·ΔͰɺΈ͍ͨɺ໾ʹཱͭɺΑ͏ͳɺΑ͏ͳɺݴͬͯΈ Ε͹ɺൺᄻతʹɺͳΒɺʙ΋มΘΒͳ͍ɺԠ༻ɺٵऩ͢Δɺࢀߟɺͦͷ··ɺ͚ͩͰͳ͘ɺ ͩͬͯͦ͏ɺ௨༻͢ΔɺͰݴ͑͹ɺͰ͸ɺͱߟ͑Δɺश͏ɺ݁ͼ͚ͭΔɺ΋ɺ΋ͦ͏ɺج ͍ͮͯɺ΋·ͨ มߋ ͍Ζ͍Ζͳɺସ͑Δɺม͑Δɺٯͷɺͦ͏Ͱͳ͍ɺͩͬͨΒɺҧ͏ɺผͷɺ΍ΊΔ ֦େ ௕͍໨ɺ޿͘ɺશମͷੈքதͷɺԆ௕ɺ֦େɺڧௐɺ૿Ճɺ޿͛ΔɺͳΜͰ΋ɺͨ͘͞Μɺ ૿΍͢ ॖখ ʙʹ΁Β͠ɺ΋ͬͱૣ͘ɺҾ͖Լ͛ͯɺҰݴͰݴ͑͹ɺߜΓࠐΉɺߜΓ·ͨ͠ ஔ׵ ʙͩͬͨΒ ΍ͬͨΒ ୅༻ ୅ΘΓʹɺʙ͕͍͍ͷͳΒ͹
  3. 2つのアプローチ(樋口 2014)  %JDUJPOBSZCBTFEBQQSPBDI • ίʔσΟϯάϧʔϧΛ͋Β͔͡Ί࡞੒্ͨ͠ͰςΩετͷ෼ੳΛߦ͏ɻ • ෼ੳલʹʮࣗಈंɺඈߦػɺόΠΫΛz৐Γ෺zͱ͍͏֓೦ͱݟͳ͢ʯ ͷΑ͏ͳίʔσΟϯάϧʔϧʢEJDUJPOBSZʣΛ࡞੒͢Δɻ •

    ཧ࿦΍໰୊ҙࣝΛૢ࡞Խ͢Δ͜ͱ͕ՄೳʹͳΔʢ0THPPEFUBM ʣ  $PSSFMBUJPOBM BQQSPBDI • จॻ಺ʹසൟʹग़ݱ͢Δ୯ޠɺηϯςϯεɺύϥάϥϑΛଟมྔղੳ ʹΑͬͯάϧʔϐϯά͢ΔΑ͏ͳ෼ੳ • ςΩετΛܗଶૉղੳͷॲཧʹ͔͚ɺͦͷ݁ՌΛ༻͍ͯଟมྔղੳΛ ߦ͏ • ཧ࿦΍໰୊ҙࣝͱ͍ͬͨઌೖ؍ͱͳΓ͏Δ΋ͷʹΑͬͯσʔλ͕Ԛછ ʢDPOUBNJOBUFʣ͞ΕΔ͜ͱ͕ճආͰ͖Δɻ 35
  4. TF-IDF(Term Frequency Inverse Document Frequency)表現 • จॻ಺Ͱස౓ͷଟ͍୯ޠͷॏཁ౓ΛߴΊɺಉ࣌ʹɺෳ਺ͷจॻ ʹԣஅతʹଟ਺ग़ݱ͢Δ୯ޠʹରͯ͠ॏཁ౓Λ௿͘͢ΔΞϧΰ ϦζϜʢ4BMUPOBOE#VDLMFZʣɻ •

    ͦͷจॻΛ୅ද͢Δ୯ޠʹॏΈ෇͚Λ͢Δɻ • Ұํɺʮࢲʯʮ͢Δʯʮ·͢ʯͷΑ͏ͳ୯ޠʹٯॏΈ෇͚Λࢪ ͢ɻ • ্هͷॏΈ෇͚Λ͞ΕͨϕΫτϧදݱʹͳΔɻ 44
  5. 分散表現(Distributed Representation) 46 • ෼ࢄදݱΛ֫ಘ͢Δʹ͸ɺ8PSE7FDɾ%PD7FDɾGBTU5FYU ͳͲΛ༻͍Δඞཁ͕͋Δɻ • ಉ࣌ग़ݱ͢Δ୯ޠͱ·ͱΊֶͯश͢ΔͷͰɺจ຺Λߟྀͨ͠ද ݱʹͳ͍ͬͯΔɻ •

    ʮंʯͱʮࣗಈंʯ͕ಉٛޠ΋ͷͱֶशͰ͖Δ 詳しく知りたい⼈は例えば以下を参照。 持橋⼤地. (2016). ⾔葉の特性を捉えるトピックモデル. 岩波データサイエンス, Vol.2, 18-29.
  6. ςΩετऩू໨తͱ෼ੳ໨త͕Ұக͠ͳ͍΋ͷ 51 • ༗Ձূ݊ใࠂॻʢتా നాɾࡔ্ ʣ • ೥࣍ใࠂॻʢ#BMBLSJTINBO FUBMʣ •

    $43Ϩϙʔτʢ,MFJONBO FUBMʣ • ʮՁ֨DPNʯ΍ʮָఱࢢ৔ʯͷϨϏϡʔʢ஛ԬΒ ࡾ઒ Β ʣ
  7. 5VTTZBEJBI BOE1BSL  53 • "JSCOC͕ࣾఏڙ͍ͯ͠Δ *OTJEF"JSCOCDPN Λ෼ੳɻ • 5XJUUFSࣾɺ(PPHMFࣾͳͲ΋෼ੳ༻ͷσʔλΛఏڙ͍ͯ͠Δɻ

    • ໿ສ݅ͷϗετͷςΩετΛ෼ੳ͠ɺͲͷΑ͏ͳࣗݾ঺հ͕ ଟ͍͔ɺͲͷΑ͏ͳࣗݾ঺հʹͲͷΑ͏ͳཱྀߦऀ͕൓Ԡ͢Δ͔ɺ ͳͲΛ໌Β͔ʹͨ͠ɻ • ϗετ͕঺հจʹ੝ΓࠐΉ΂͖จݴͷࢀߟʹɻ
  8. ൓ল఺ • ࠷৽ٕज़ͷΩϟονΞοϓ͕஗͔ͬͨɻ࠷৽Λૣ͘஌Δ΂͠ɻ • ݹ͍ख๏ͷݶք఺͸ɺ͍͍ͩͨ୭͔͕ࠀ෰͍ͯ͠Δɻ • ৽͍͠ख๏͸ɺ৽͍͠Ձ஋ΛੜΈग़͢Մೳੑ͕ߴ͍ɻ • ੵۃతʹࣗ෼ͷݚڀΛਓʹ࿩͢΂͖ͩͬͨɻͲΜͲΜ࿩͢΂͠ɻ •

    ৄ͍͠ਓ͕ҙݟΛ͘ΕΔɻ • ࣮຿ܦݧ͋Δਓ͸ɺࣗ෼ͷ࿮֎ͷߟ͑Λ͢Δɻ • զຫ͕গ͠଍Γͳ͔ͬͨɻ • ଞͷ΍ΓํΛ໛ࡧͤͣʹɺݚڀΛఘΊͦ͏ʹͳͬͨʢ.ॳظʣ • ؆୯ʹ݁Ռ͸ग़Δ͸ͣͳ͍ɻ 61 ςΩετ෼ੳҎ֎ʹ΋ݴ͑Δʂ
  9. 参考文献 • ⽯川修・星野敏(2004). テキストマイニングを⽤いた都市農村交流ニー ズの把握−岡⼭県吉 永町ふるさと村の⼋塔寺⼭荘の落書き帳を対象とし て−. 農村計画学会誌. 第 23巻-suppl

    号,pp.181-186. • 磯島昭代.(2006). テキストマイニングを⽤いた⽶に関する消費者アン ケートの解析. 農業情 報研究. 第 15巻 第1号 pp.49-60. • 上野栄⼀. (2008). 内容分析とは何か: 内容分析の歴史と⽅法について. 福 井⼤学医学部研究雑誌, Vol.9, No.1・2, 1-18. • 喜⽥昌樹. (2008). テキストマイニング⼊⾨. ⽩桃書房. • 齋藤朗宏.(2011). ⽇本におけるテキストマイニングの応⽤. 北九州⼤学 ワーキング ペーパーシリーズ. • 佐藤郁哉. (2008). 実践質的データ分析⼊⾨ : QDA ソフトを活⽤する. 新曜 社. • ⽩⽥佳⼦・坂上学.(2008).⼈⼯知能アプローチによる「継続企業の前 提」の解析−テキスト マイニングによる⾮会計情報の分析−. 事業継続能 ⼒監査と倒産予測モデ ル. 同⽂館出版 64
  10. 参考文献 • ⽵岡志朗・⾼⽊修⼀・井上祐輔.(2014). テキストマイニングを⽤いたイ ノベーションの普及 分析. ⽇本情報経営学会誌. 第35巻 第1号 pp.72-86.

    • ⽵岡志朗. .(2018). 機械学習を活⽤したテキストマイニング゙―クチコミを ⽤いた商品・サービスカテゴリーの横断分析―. 桃⼭学院⼤学経済経営論 集, 第59巻, 第4号, 101-122. • 那須川哲哉(2001). コールセンターにおけるテキストマイニング. ⼈⼯ 知能学会誌. 第 16巻 第2号 pp.219-225. • 樋⼝耕⼀. (2004). テキスト型データの計量的分析 ――2つのアプローチの 峻別と統合――. 理論と⽅法, 19, 101‒115. • 樋⼝耕⼀. (2014). 社会調査のための計量テキスト分析―内容分析の継承と 発展を⽬指して. ナカニシヤ出版. 65
  11. 参考文献 • Balakrishnan, R., X. Y. Qui, P. Srinivasan (2010)

    “On the predictive ability of narrative disclosures in annual reports,”European Journal of Operational Research, Vol.202, Issue 3, pp.789-801. • Berelson, B. (1952). Content analysis in communication research, New York: Free Press. • Evans, J. A., and Aceves, P.J. (2016). Machine Translation: Mining Text for Social Theory. Annual Review of Sociology, 42, 21-50. • Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political analysis, 21(3), 267-297. • Holsti, O.R. (1969). Content Analysis for the Social Sciences and Humanities. Addison-Wesley. • Kleinman, G., C. H. Kuei, P. Lee (2017) “Using Formal Concept Analysis to Examine Water Disclosure in Corporate Social Responsibility Reports,”Corporate Social Responsibility and Environmental Management, Vol.24, Issue 4, pp.341-356. 66
  12. 参考文献 • Krippendorff, K. (1980). Content Analysis: An Introduction to

    Its Methodology (Commtext Series). • Osgood, C. E. (1959). The representational model and relevant research materials. In Trends in content analysis (pp. 33-88). University of Illinois Press. • Salton, G., & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information processing & management, 24(5), 513-523. • Snehvrat, S., A. Kumar, R. Kumar, S. Dutta (2017) "The state of ambidexterity research: a data mining approach," International Journal of Organizational Analysis, Vol. 26 Issue: 2, pp.343-367. • Tussyadiah, L. P., S. Park(2018) “When guests trust hosts for their words: Host description and trust in sharing economy,”Tourism Management, Vol.67, pp.261-272. 67