Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Stack Overflow研究の諸側面とワークの研究によるアプローチ

Stack Overflow研究の諸側面とワークの研究によるアプローチ

Stack Overflow(SO) exists as a successful online knowledge collaboration. It is a Q&A site about programming topics, and a lot of professional knowledge resources are stored and accessible via the Web. To understand a nature of knowledge of SO, we need to understand person's participation as its source. In this presentation, we tried to seek a way to understand activities in the SO. We reviewed articles about SO from many disciplines, and found three research types: (1)relationships between individual users and SO, (2)SO as information resource, and (3)SO as a community. However, current researches focus on established SO, and how SO is continuously made via participants' activities is not examined. To understand it, we propose a program to treat the problem of order of a community as participants' point of view. The research program of studies of work has been struggling to this problem. It is proposed by H.Garfinkel as a Ethnomethodology's program, tried to describe the production of local order to achieve something. We showed some researches under the studies of work, which fields are similar to the SO, and we discussed the possibility of applying the program of studies of work to the SO.

Tajima Itsuro

October 13, 2018
Tweet

More Decks by Tajima Itsuro

Other Decks in Research

Transcript

  1. Webを介した知識共有とStack Overflow • インターネットの登場で,知識へのアクセスのみなら ず,知識の提供や質の改善への参加が可能になった • Stack Overflow(SO)1)はその1つで「プログラミング に関する良い知識の総和を増やす」⽬的で設⽴された 質問回答サイトである

    • ソフトウェア開発に関するマニュアルなどと同様に問 題解決に利⽤される情報源としてみなされている • 2008年9⽉に開設され,10年で930万ユーザー,質問 数1600万,123億回閲覧 “Stack Overflow is 10!” https://stackoverflow.blog/2018/09/27/stack-overflow-is-10/ 3
  2. Webを介した知識共有とStack Overflow • SOのような場所での知 識の集積は⼈々の参加に よって成り⽴つが • SOでは複雑な仕組みが デザインされており,参 加者は様々なことをして

    いる • その上で,SOという場 はどう成り⽴っているの か? 回答の受け⼊れ 投票 編集履歴 タグ 質問者の評判 5 外部情報源へのリンク
  3. 先⾏研究の背景 • SOに焦点を当てた研究は2011年頃に始まったが, 2005年頃から研究が蓄積されてきた「質問回答サイト 研究」とは別の流れで⾏われてきた • 質問回答サイト研究では主にYahoo! Answersなどが注⽬さ れ,SOは「専⾨的な」質問回答サイトとしてまとめられる4) •

    SOのデータセットは,全て公開され,ソフトウェア開 発者に関する重要な研究データとなっている • システムのほぼ全データが匿名化された形で公開されている • ソフトウェア⼯学,HCIなどの分野で研究 8
  4. 先⾏研究(1)個々の利⽤者とSOの関わり • 利⽤者個⼈とSOとの関わりに関する研究 • →専⾨的なソフトウェア開発者の特徴を理解する • 個々⼈の特徴の理解 • 感情の表出の仕⽅が映画のレビューなどと異なる5) •

    質問回答⾏動の種類や傾向 • ある技術領域でどういった種類の質問(やり⽅,意図 しない挙動への対処など)をするか9) • →個々⼈の振る舞いに焦点が当てられており,ほかの 参加者との関わりの中で⾒ていく視点が⽋けている 10
  5. 先⾏研究(2)情報源としての質問回答 • SOの質問回答を,アクセス可能な情報源として捉える • ソフトウェアに関する⽂書としての特徴 • 公式のマニュアルとの違いや使い分けの傾向の分析,技術的 な⽤語と実際の問題の提⽰との⾔葉遣いの違いの分析6) • 情報源としての品質

    • 質問者による評価や,投票を通じた主観的な評価の要因を, 回答の内容のテキストマイニングによって分析7) • 編集など,品質を上げる⼿段の利⽤傾向 • →テキストの内容の分析にとどまっており,参加者同 ⼠がテキストを読むことを通じてやりとりをするとい う視点が⽋けている 11
  6. 先⾏研究(3)コミュニティと そのデザイン • SOを1つの⼤きなコミュニティとして扱うアプローチ • ログの解析により • 質問者と質問数はべき分布に従い,少ない⼈が多 く回答していることが明らかになっている11) •

    近年回答数が伸び悩んでいることが明らかになっ た。利⽤者の質問の傾向の変化から,質問者の質 の低下が原因だと⽰唆されている • SOとそれ以外のサイトと特徴の違い • →コミュニティを個⼈の⾏動の集計として捉えており, 参加者にとって意識されるという視点が⽋けている 12
  7. 先⾏研究に不⾜している研究課題 • 先⾏研究に⽋けている視点: • ほかの参加者との関わりの中で⾒ていく • 参加者同⼠がテキストを読むことを通じてやりとり をする • コミュニティは参加者にとって意識される

    • 先⾏研究では,既に成り⽴っているSOを研究しており, 参加者が関わりの中でSOをどう成り⽴たせているかを 研究していない • ⽅法論の問題:個別の機能に焦点を当てた研究がほとん どである→⼈と⼈の関わりが⾒えてこない 13
  8. ワークの研究(1) Webにおける相互⾏為と理解の組織 • そもそも,Webにおいてコミュニケーションはどう成 り⽴っているか • Tolmieらによる,Twitterにおける「会話」の組織と, 対⾯会話の順番交代を⽐較し,流⾔を分析した研究13) • ツイートは多数の相⼿に向けられており,受け⼿は対

    ⾯会話と違い返信してもしなくてもよい • ⾮同期的コミュニケーションのため,すぐに返信しな くてもよく,さらに⾔えば返信に応じる必要もない • だから,流⾔では応答した⼈の声が⼤きく⾒える上, 流⾔をした側も広めた側も⾔いっぱなしができる 18
  9. ワークの研究(2) 知識体系の実践的管理 • 情報源の集まりはどう体系的に扱われるか • Ikeyaらによる,図書館員による分類法の実践の研究14) • 分類法を,特定の状況によらない安定して利⽤可能な ものとして維持,利⽤しながら •

    つまり,過去に分類されたものも含めどの資料にも適⽤でき るように • なおかつ利⽤者の要求に応じて柔軟に変えてきた • 詳細化,異なるDDC間の変換などを通じてアクセスのしや すさを維持 • 分類法は⽂書によって安定したものになっている 19
  10. SOにおけるワークの研究の可能性 • SOにおいて成り⽴っている秩序を,ワークの研究で理 解できる可能性がある • SOで「質問回答」と呼ばれるものはどのように組織されて いるのか? • SOはどう,ある程度体系⽴った情報源になっているのか? •

    これらを参加者による問題として捉える • 参加者がこれらの問題を取り上げて問題とする「明⽩ な場⾯」から多くのことが得られるだろう • 秩序の成り⽴ちを理解するうえで,参加者の活動の記 録であるSOのデータセットは有⽤である 20
  11. SOにおけるワークの研究の可能性 • One preliminary result • プログラミング⾔語理論的にほぼ同じ問題に関する質 問回答に対し • 「どうすれば動く?」という質問には端的に回答

    • 「私の考え⽅のどこが悪い?」という質問には論理展開を詳 細に述べていた • 受け⼿に合わせた回答のデザインがされている • 質問者の様々な要求を情報源にしているのだろうか • どちらが「良い質問」なのだろうか • →これもまた参加者の問題 21