Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自分の価値観と似ている/異なる意見のレコメンデーションシステムの構築 ~あなたはこの科学技術について、どう思う?

自分の価値観と似ている/異なる意見のレコメンデーションシステムの構築 ~あなたはこの科学技術について、どう思う?

lecielrouge110

January 21, 2021
Tweet

More Decks by lecielrouge110

Other Decks in Science

Transcript

  1. 発表の概要 発 表 の 概 要 1. 背景 2. 課題・⽬的

    3. ⼿法・仮説 4. 分析結果 5. 考察 6. まとめ 7. 今後の展望 8. 振り返り
  2. 質問︓これから30年後の未来、科学技術でどんなこと が実現できると思いますか︖ 1 . 背 景 ゲノム医療が発展すれば、今 まで直せなかった病気が治せ るんじゃないの︖ ⽕星有⼈探査、実現できたら

    楽しいだろうなぁ︕ 温暖化が進んだ結果、今のよ うな暮らしはできなくなるか も…何か対処⽅法はないの︖ AI、便利そうだけど 職を奪われたらどう しよう…
  3. 「科学コミュニケーション」の重要性 n ⽇本科学未来館(URL︓https://www.miraikan.jst.go.jp) 設⽴理念 「科学技術を⽂化として捉え、社会に対する役割と未来 の可能性について考え、語り合うための、すべての⼈々 にひらかれた場」 ミッション ①科学を伝える〜先端科学技術と社会を結ぶ場の創造 (例︓さまざまな⼈との対話の醸成)

    ②⼈材を育てる〜科学コミュニケーターの育成(例︓専 ⾨家と⼀般の⼈々をつなぎ、共創を推進する役割の科学 コミュニケーターの育成) ③つながりをつくる〜ネットワークの形成による活動の 展開(例︓他ステークホルダーとの連携事業の推進) n 内閣府の科学技術政策 第5次科学技術基本計画(平成28年度 〜)の抜粋 科学館、博物館等の社会教育施設が果た す役割も⼤きく、そうした場において、 研究者等と社会の多様なステークホル ダーとをつなぐ役割を担う⼈材である科 学コミュニケーター等が活躍し、双⽅向 の対話・協働においても能動的な役割を 担うことが期待されることから、国は、 こうした取組について⽀援する。 ⇒「共創」が重要なキーワード 出典︓⽇本科学未来館HP (URL︓https://www.miraikan.jst.go.jp/aboutus/) 2021年1⽉13⽇閲覧 1 . 背 景
  4. 市⺠の意⾒の重要性 • To 政府︓科学技術政策⽴案の 参考(パブリックコメント) • To 研究者︓研究開発推進 • To

    市⺠︓ ① ⾃分の価値観の醸成 ② 問題解決のための議論の推進 出典︓⽇本科学未来館『みんなでつくるAIマップ』 (URL︓ https://www.miraikan.jst.go.jp/resources/miraikanfocus/202006121367.html) 2021年1⽉13⽇閲覧 【問題意識①】⾃分や他者の意⾒の 論点を⾃動で抽出し俯瞰したい 市⺠の多様な意⾒を知ることは…. 1 . 背 景
  5. 情報源は︖ © 2018. For information, contact Deloitte Tohmatsu Consulting LLC.

    1 Q. ニュース情報を得る手段として、最も頻繁に使用するものは? Z世代ではソーシャルメディアでのニュース取得が主流になりつつあり、テレビ(ニュー ス番組)に迫っている一方、30~50代を中心にテレビの割合が上昇している 高 低 N=2083 注:数字の右側の矢印は、2017年の値との比較した場合の増減を表している(太い矢印は3ポイント以上、細い矢印は1~2ポイントの増減) *1:Yahoo! ニュース、Smartnews、Gunosyなど *2:ハフィントンポスト、Buzzfeed、NewsPicksなど 14-20 21-27 28-34 35-51 52-70 71+ テレビ (ニュース番組) 51% 57% 38% 30% 62% 36% 雑誌 1% 1% 0% 1% 2% 1% ソーシャル メディア 4% 1% 8% 28% 0% 19% 新聞 (印刷版) 4% 9% 3% 4% 18% 5% オンライン ニュースサイト*2 6% 4% 4% 12% 1% 6% 新聞 (オンライン版) 2% 4% 5% 1% 4% 2% ラジオ 2% 1% 0% 0% 2% 0% 最新のニュース 情報を調べない 7% 3% 12% 6% 4% 10% テレビ(バラエティ/ トーク番組) 1% 2% 4% 8% 1% 5% 21% 19% 25% アグリゲーター*1 11% 6% 16% Z世代(14〜20歳)で はソーシャルメディア でのニュース取得が主 流になりつつあり、テ レビ(ニュース番組) に迫っている⼀⽅、30 〜50代を中⼼にテレビ の割合が上昇している。 SNS(ソーシャルメディア)は主要な情報源 1 . 背 景
  6. 課題と⽬的 2 . 課 題 ・ ⽬ 的 【問題意識①】⾃分や他者の意⾒の論点を⾃動で抽出し俯瞰したい 【問題意識②】⾃分とは異なる⽴場の⼈の意⾒を知る機会を提供する必要性

    ある科学技術に対する⾃分の意⾒を記⼊すると、⾃分の価値観 に近い意⾒、かつ⾃分の価値観とは異なる意⾒をレコメンドし てくれるシステムを作成したい。 ⇒類似する意⾒とそうでない意⾒を分類するレコメンデーショ ンシステムを構築する。
  7. 使⽤するデータの概要 • ターゲット︓2012年9⽉15⽇実施の「世界市⺠会議World Wide Views ~⽣物多様性を考える~ 」の参加者100名 • 参加者の特徴︓性別、年齢、職業、居住地域、教育レベルの5つのパラ メータに関して、⽇本社会の縮図(ミニパブリックス)をほぼ再現しう

    る⾮専⾨家集団。年齢は16歳〜69歳。 • 使⽤データ︓⾃由記述「私が思う、⽣物多様性について最も⼤事なこと とその理由」(データ⼊⼿元︓⽇本科学未来館・展⽰活動報告 vol.8︓ https://www.miraikan.jst.go.jp/aboutus/docs/exhibition_activity_r eport_08.pdf) ※年齢等属性データは⾮公開ため、本解析では使⽤していない。 ※意⾒と理由は別のカラムに分けたが、後に結合。 3 . ⼿ 法 ・ 仮 説
  8. ⼿法と初期仮説 • 今回使⽤する⼿法︓コンテンツベースフィルタリング コサイン類似度を計算。 • 仮説︓ Ø コサイン類似度が⼤きい(1に近い) ⇒ ⾃分の意⾒に近い意⾒を⾒ることが可能。⾃分の意⾒をサポート

    する論点を拾える可能性がある。 Ø コサイン類似度が⼩さい ⇒ ⾃分の意⾒には含まれない単語が多く出現する。これは⾃分とは 異なる意⾒の論点を知るきっかけになると考える。 3 . ⼿ 法 ・ 仮 説
  9. 分析⼯程の概要 ⼯程 概要 ⼿法 データの収集、ア ノテーション 必要なデータ(市⺠の意⾒)の収集、 及び論点のタグ付け ⽇本科学未来館の展⽰活動報告書 Vol.8より

    テキストの前処理 テキストの正規化、形態素解析など 形態素解析 テキストの数値表 現化 テキストのベクトル化 word2vec テキストの類似度 分析 テキストの類似度計算 単語の重要度の計算 コサイン類似度(各単語ベクトルの平 均を⽐較)、tf-idf法 結果の解釈 類似度の低い、及び⾼い意⾒の抽出 ある意⾒を抽出し、それに近い意⾒、 異なる意⾒を取り出せているか否かで モデルを評価 3 . ⼿ 法 ・ 仮 説
  10. 分析⼯程 データ収集 Opinion Reason 伝えたい相⼿:環境省初め⽇本の政策担当者へ”地球 全⼈類が運命共同体”、”地球最⼤のゴミは⼈間”戦後 の奇跡的な復興によって⽇本は豊かになりましたが、 ⼀⽅失うものも多く、地球環境にも、甚⼤な被害影 響をもたらしています。”⾥⼭”に象徴される、⾃然 との共⽣で成り⽴ってきた⽇本がリーダーシップを

    取り、世界に発信してほしい。 ⽇本が急速な発展の中で、恩恵を受けてきた事、途上国に ⼈々にツケを回してきたことを踏まえ、世界の国々と、充 分な議論をしつつ、”⻘い地球”を守る努⼒をしてほし い。”勿体ない精神”の⽇本の本領を発揮する政策に期待し ます。 ⽣物多様性の保全についてビジョンを持つこと。国 に対しては、国が率先してビジョンを打ち出し、広 く国⺠に知らせて欲しい。 ⽣物多様性の保全は⼤切なことだが、資⾦負担・利益配 分の問題が必ずついてまわりビジョンなくしては進めて いくのに困難。国はビジョンを出し国⺠⼀⼈⼀⼈は⾃分 の事として受け⽌め考え、⾏動していくためにも最初に ビジョンを出すべき。 きちんとした権限のある国際組織が必要。またGEF のような団体に対し、もっと権限を持たせるととも に、知名度をあげる努⼒が必要だと思う。また、⽇ 本国内においても、同様な組織が必要だと思う。 途上国に対し、⽣物多様性を守っていくための仕組み作 りを早急に⾏う必要があるとともに、各国ごとの利権関 係の問題を最⼩限におさえる必要があると思うので。ま た、将来を担う⼦供達に、⽣物多様性の重要性を伝えて いくためにも、このような仕組み作りを先に⾏っていく べきだと思う。 ⽣物多様性の保全活動と経済活動とのバランス伝え たい相⼿:各国政府、各企業、消費者 保全活動が重要なのは⾔うまではないと思います。しか し国や企業の利害が絡むと意⾒の⼀致はまず、できない のではないでしょうか。そこで、各政府や企業の考え⽅ をすり合わせなければならないと思います(かなり難しい でしょうが)。ある程度⼀致した意⾒を集約しまとめてい かなければならないと思います。 ⼿作業で抽出 展⽰活動報告書(pdf) Excel • csv化 • ⽂字コード・改⾏コード変換(UTF-8、LF) • NFD ⇒ NFC 変換(macOSで起こる濁点、半濁点が離れて しまう問題の解消) 3 . ⼿ 法 ・ 仮 説
  11. 分析⼯程 アノテーション Opinion Reason Perspectives 伝えたい相⼿:環境省初め⽇本の政策担当者へ”地球全⼈類が運命 共同体”、”地球最⼤のゴミは⼈間”戦後の奇跡的な復興によって ⽇本は豊かになりましたが、⼀⽅失うものも多く、地球環境に も、甚⼤な被害影響をもたらしています。”⾥⼭”に象徴される、 ⾃然との共⽣で成り⽴ってきた⽇本がリーダーシップを取り、

    世界に発信してほしい。 ⽇本が急速な発展の中で、恩恵を受けてきた事、途上国に⼈々にツケを回して きたことを踏まえ、世界の国々と、充分な議論をしつつ、”⻘い地球”を守る努⼒ をしてほしい。”勿体ない精神”の⽇本の本領を発揮する政策に期待します。 ・⽇本の強みを活かしていく ・環境を保護する ・議論の場をつくる ・先進国が責任をとっていく ⽣物多様性の保全についてビジョンを持つこと。国に対しては、 国が率先してビジョンを打ち出し、広く国⺠に知らせて欲しい。 ⽣物多様性の保全は⼤切なことだが、資⾦負担・利益配分の問題が必ずついて まわりビジョンなくしては進めていくのに困難。国はビジョンを出し国⺠⼀⼈ ⼀⼈は⾃分の事として受け⽌め考え、⾏動していくためにも最初にビジョンを 出すべき。 ・国が先導して政策を打ち出 す ・市⺠へ周知する ・⾃分ごととして捉える きちんとした権限のある国際組織が必要。またGEFのような団体 に対し、もっと権限を持たせるとともに、知名度をあげる努⼒ が必要だと思う。また、⽇本国内においても、同様な組織が必 要だと思う。 途上国に対し、⽣物多様性を守っていくための仕組み作りを早急に⾏う必要が あるとともに、各国ごとの利権関係の問題を最⼩限におさえる必要があると思 うので。また、将来を担う⼦供達に、⽣物多様性の重要性を伝えていくために も、このような仕組み作りを先に⾏っていくべきだと思う。 ・国際的な枠組みを作る ・国内の枠組みを作る ・⼦供への教育を充実させる ⽣物多様性の保全活動と経済活動とのバランス伝えたい相⼿:各 国政府、各企業、消費者 保全活動が重要なのは⾔うまではないと思います。しかし国や企業の利害が絡 むと意⾒の⼀致はまず、できないのではないでしょうか。そこで、各政府や企 業の考え⽅をすり合わせなければならないと思います(かなり難しいでしょうが)。 ある程度⼀致した意⾒を集約しまとめていかなければならないと思います。 ・環境保全と経済活動のバラ ンスを考える ・議論を推進する 各意⾒に対して⼿動でタグ付けを⾏った。 類似した意⾒、異なる意⾒の抽出ができているかの⽐較検討にて使⽤ 3 . ⼿ 法 ・ 仮 説
  12. 分析⼯程 アノテーション 抽出した論点 【政策⽴案】 • 国内の枠組みを作る • ⽇本の強みを活かしていく • 国が先導して政策を打ち出す

    • ⽣物多様性の問題について市⺠へ周知 する 【国際協⼒】 • 国際的な枠組みを作る • 先進国が責任をとっていく • 中進国からの協⼒を得る • 途上国に⾃助努⼒をさせる • 途上国に援助する • ⽬先の利益、経済優先の考えから脱却 する • 国家間の妥協点を探る • 環境保全と経済活動のバランスを考え る • 利益の負担と分配を意識する • すべての国が協⼒し合う 【議論】 • 意⾒を共有していく • 意識を共有していく • 議論の場をつくる 【普及展開】 • リテラシーを向上させる • 「⽣物多様性」の問題に興味を持つ • ⾃分ごととして捉える • 「⽣物多様性」という⾔葉を正しく理解 し使⽤する • ⼦供への教育を充実させる • 分かりやすく伝える 【意識変化】 • 当事者意識を持つ • ⽣命の尊厳を尊重する • 地球とのつながりを考える • 興味を持つ • 未来について考える 【⽣活様式の変化】 • ライフスタイルを変える • ⼟地開発をやめる • ⼈⼝増加を抑制する • 共存を⽬指す 【⾃然保護推進】 • 環境を保護する • 動物保護を推進する 3 . ⼿ 法 ・ 仮 説
  13. 分析⼯程 テキストの前処理 n カラムの結合 Ø opinion(私が思う、⽣物多様性について最も⼤事なこと)とreason(その理由)を結合 (理由の欄に意⾒が書かれている場合がある) n 正規化 Ø

    NFKC Ø 表記ゆれの統⼀(例︓「1⼈」「⼀⼈」⇒「ひとり」) n 形態素解析 Ø JanomeとMeCabの形態素解析の結果を⽐較検討 ⇒ 今回はJanomeを使⽤ 3 . ⼿ 法 ・ 仮 説
  14. 分析⼯程 テキストの前処理 n その他の前処理 Ø 名詞、動詞、形容詞、連体詞、副 詞を解析に⽤いた。 Ø ストップワードの設定。単語の頻 度や重要度(TF-IDF法)を参考に

    しながら、論点に関係のない頻出 単語や記号、及びこの会議の主要 トピックであり多くの意⾒に共通 する単語「⽣物多様性」を除いた。 Word Count TF-IDF StopWord し 174 7.050641 1 こと 152 7.056327 1 ⽣物 105 5.170030 性 102 5.436423 国 84 5.053911 多様 83 4.577379 する 68 3.985319 1 地球 68 4.300971 の 67 3.873932 1 いる 67 3.767527 1 ⼈ 64 4.278057 いく 60 4.044506 1 思い 57 3.718682 1 事 56 4.066404 1 思う 53 4.011186 1 ある 46 2.788038 1 必要 46 3.014847 ⾃然 43 3.422717 世界 40 2.903433 意識 39 3.385063 考え 39 2.770054 環境 36 2.610666 ⼈間 35 3.070553 3 . ⼿ 法 ・ 仮 説
  15. 分析⼯程 数値表現化(ベクトル化) 使⽤モデル︓word2vec 今回はskip-gramを採⽤。 from gensim.models import word2vec sentences =

    [token.split(" ") for token in dataset.title_tokenized] skipgram_size=1500 #特徴ベクトルの次元数の設定。 content_idx=3 #抽出する意⾒の番号 topN=10 #表⽰する最も近い/異なる意⾒の数 skipgram_model = word2vec.Word2Vec(sentences, sg=1, #1:skip-gram、0:CBOW size=skipgram_size, min_count=2, window=5, negative=0, seed=1234) num_features = skipgram_size def avg_document_vector(data, num_features): document_vec = np.zeros((len(data), num_features)) for i, doc_word_list in enumerate(data): feature_vec = np.zeros((num_features,), dtype="float32") for word in doc_word_list: try: feature_vec = np.add(feature_vec, skipgram_model.wv.__getitem__(word)) except: pass feature_vec = np.divide(feature_vec, len(doc_word_list)) document_vec[i] = feature_vec return document_vec news_matrix = avg_document_vector(data=sentences, num_features=num_features) 1. 形態素解析により抽出した各単語 を、作成したword2Vecによって ベクトル化。 2. 変換された各単語ベクトルの平均 をとり、その結果得られたベクト ルを意⾒のベクトルに。 上記2ステップを実⾏する関数を作 成した。 3 . ⼿ 法 ・ 仮 説
  16. 分析⼯程 分析(コサイン類似度の算出) #コサイン類似度の算出 def get_cosine_similarity(x, y): return 1- sp.distance.cosine(x, y)

    def get_similar_news(df, news_matrix, content_idx, topN, totalN): news_similarity = [] for i in range(len(news_matrix)): sim = get_cosine_similarity(news_matrix[content_idx], news_matrix[i]) news_similarity.append(sim) news_similarity = np.array(news_similarity) # 類似度の低い順にソートした結果のインデックスを⽤意して、降順に並び替え arg_sort = np.argsort(news_similarity) arg_sort = arg_sort[::-1] return df["title"][content_idx], df["title"][arg_sort], news_similarity[arg_sort],arg_sort, df["Opinion"][arg_sort], df["Reason"][arg_sort] based_news, similar_news, similarity_scores, arg_sort, opinion, reason = ¥ get_similar_news(df=dataset, news_matrix=news_matrix, content_idx=content_idx, topN=topN,totalN=totalN) 3 . ⼿ 法 ・ 仮 説
  17. 分析結果その1 類似度の⾼い意⾒ No. 意⾒ 理由 cos類似度 論点 今回提⽰した意⾒ 28 グローバルな視点に⽴って地球全体はつながっているという意識。

    先進国、途上国ともに歩みよって地球を保護していくこと、特に先 進国は率先して動いて、途上国の環境保全について管理をすべき。 アメリカ、中国、ロシア等は責任感を持って地球保全に動いてほしい。 1.000 ① すべての国が協⼒し合う ② 地球とのつながりを考える ③ 先進国が責任をとっていく 類似度の⾼い意⾒(Top4) 95 私が思う⼤事なことは、経済とどのように関連付けて関わっていく かです。⽣物多様性を保全・利⽤するにあたっては国同⼠の利益間 によって、保たれていくのではないかと思います。先進国・途上国 のすべての国が協⼒し合って⽣物多様性を保全していくべきと考え ます。 保全にあたっては、途上国での保全が多くなるので、先進国、途上国が協⼒して、保全をすすめていか なければいけないと思います。公海での問題では、協定に参加していない国の規制が難しいので、全て の国が協⼒納得していける、協定作りが必要だと思います。 0.591 ① すべての国が協⼒し合う • 国家間の妥協点を探る • 環境保全と経済活動のバランスを考える • 国際的な枠組みを作る 29 先進国と発展途上国が共通認識を持つ。 ・先進国は引き続き「⾦銭」を......・発展途上国は、⾃然を維持した上での⽂化的な発展を⽬指すが、 先進国とのバランスを取る。・共通認識を持った上での協⼒体制。・発展途上国の実態を知った上での 先進国の⽣活の⾒通し。 0.540 ①すべての国が協⼒し合う • 動物保護を推進する 79 ⾃然環境に影響を与えるのも、恩恵を受けるのも⼈間であるから、 世界中の⼈間が、⽣物多様性にもっと関⼼を持ち、保全していくこ とが⼤事であると思う。 ⽣物多様性を考え、⾃然と経済活動の共存。先進国のみではなく、新興国、発展途上国との連携、協⼒、 国際機関との協⼒が不可⽋であると思う。ひとつの国が、⾃国の利益のみを追求するのではなく、地球 規模で、地球の⽣物を守っていく意識、⾏動が⼤事だと思う。 0.469 ① すべての国が協⼒し合う ② 地球とのつながりを考える • 環境保全と経済活動のバランスを考える • 興味を持つ 90 難しいことは簡単にわかりやすく ⽇本はまだ識字率が⾼い国なのでよいが世界レベルで「⽣物多様性」について取り組むためには時期が 早すぎると思うので上から⽬線のスローガンと誤解されかねない。⾃然環境は優先順位がまだまだ低い。 先進国ですら意⾒が分かれている中において発展途上国と折り合いをつけようなんざ理想の空論だ。正 論だから正義なんて詭弁以外の何ものでもないし、⼤切なのは正確な情報を100%下に伝えるのではな く、10%くらい伝われば良いほうだと割り切った上で理解の妥協点を先に設定しておかないと宇宙船地 球号の舵を取ることはできないのだろうと思うのでまずは、とりあえず...という意味で「難しいこと」 はわかりやすく。例えば「⽣物多様性」ではなくもっとシンプルに̶̶ 0.418 • 分かりやすく伝える 特 徴 • ⾃分が提⽰した論点は概ねどれかは⼊っていた。 • ⾃分が提⽰した論点を補強する論点を⾒ることができた。 • 意⾒90に関しては、⾃分の意⾒と逆の主張をしていた。 4 . 分 析 結 果
  18. n ⾃分が提⽰した論点 ①すべての国が協⼒し合う ②地球とのつながりを考える ③先進国が責任をとっていく n 類似度の⾼い意⾒の特徴 • ⾃分が提⽰した論点は概ねどれかは⼊っていた。 •

    ⾃分が提⽰した論点を補強する論点を⾒ることができた。 Ø 例︓(意⾒95)私が思う⼤事なことは、経済とどのように関連付けて関わっていく かです。⽣物多様性を保全・利⽤するにあたっては国同⼠の利益間によって、保たれ ていくのではないかと思います。⇒「国家間の妥協点を探る」「環境保全と経済活動 のバランスを考える」「国際的な枠組みを作る」 • ただし(意⾒90)に関しては、⾃分の意⾒と逆の主張をしていた。 Ø 例︓先進国ですら意⾒が分かれている中において発展途上国と折り合いをつけような んざ理想の空論だ。(…中略…)まずは、とりあえず...という意味で「難しいこ と」はわかりやすく。 分析結果その1(詳細) 4 . 分 析 結 果
  19. 分析結果その2 類似度の低い意⾒ No. 意⾒ 理由 cos類似度 論点 今回提⽰した意⾒ 28 グローバルな視点に⽴って地球全体はつながっているという意識。

    先進国、途上国ともに歩みよって地球を保護していくこと、特に先 進国は率先して動いて、途上国の環境保全について管理をすべき。 アメリカ、中国、ロシア等は責任感を持って地球保全に動いてほしい。 1.000 ① すべての国が協⼒し合う ② 地球とのつながりを考える ③ 先進国が責任をとっていく 類似度の低い意⾒(Top6) 43 「⽣物多様性」という⾔葉を、広く世界中の⼈々が知るとい う事。伝えたい相⼿:家族か友⼈・知⼈などで、⽣物多様性を 知らない⼈達みんな 私も今⽇ここで皆さんとディスカッションをする迄、「⽣物多様性」という⾔葉⾃体知らな かったし、どれだけ重要かつむずかしい課題なのかも知りませんでした。今回グループの皆 さんの様々な意⾒や考えを聞く事でで、私⼀⼈では考えつかなかった事や、それぞれの⽅が ⼤事だと思っている事を知る事ができました。知る事から次は、⾃分には何ができるのかを 考える事ができると思います。 -0.032 • リテラシーを向上させる • 「⽣物多様性」という⾔葉を正しく理解 し使⽤する 78 共存~全ての⽣きものへ~ ⽣物多様性を維持していくには⽋かせないキーワードだと思ったので。このことを肝に命じ て対応していかなくては⼿遅れになってしまうのではないだろうか、、だが、決して「もう 遅い」ではない問題。だから⼀歩ずつ改善に向けて進めていくよう早急に取りかかる必要が ある。 -0.020 • 共存を⽬指す 93 世界で統⼀された考えを持つ事が⼤切。⼈間が⼀番じゃない、 他の⽣き物がいるからこそ⼈もいきていけるんだ。 ⼈は⽣きていく為にたくさんのぎせいをはらっている。その失われたものたちの意味を理解 しなければ⼈はほろびていく。⼈はたくさんのものにささえられて⽣きている。それは⼈が ささえた物であったり、他の⽣物がささえてくれたものである。 -0.011 • 意識を共有していく 96 限り有る資源なので、⼤事に育てながら、全世界の⼈が共有 して、平和に、分け合いたい 未来の⼈々が奪い合いのないよう安⼼して⽣活してもらいたいので -0.003 • 未来について考える 53 未来 今、考えて⾏動をしていかなければ、損失を防ぐことが出来ないと思う。今、⾏動すること によって少なくともいい⽅向へ向かって進めるのではないか。それがこの先未来へ繋がって 守っていくべきだと思う。 -0.002 • 未来について考える 17 Give and Take 恩恵を受ける者は、それを還元していく 得たものを還元していくことで、共存していく。ルール作りが必要だと思います。 0.002 • 共存を⽬指す 特 徴 • 類似度の⾼い⽂章の論点が含まれていない。 • 総じて、⽂章が短い。(⼿法の影響) 4 . 分 析 結 果
  20. まとめ 6 . ま と め n 類似度の⾼い意⾒から、⾃分と同じ考えの⼈の意⾒、同じテーマだけど反対の主張を している⼈の意⾒を抽出することが可能。 n

    類似度の低い意⾒からは、⾃分が知り得なかった論点を探すことは、⼀応は可能。た だし、中⾝のある⽂章か否か、⽂章の⻑さ(出現する単語の頻度)にも依存するため、 この⼿法を適応する際には、 Ø テキストの⻑さをある程度統⼀すること Ø 中⾝のある内容を記述していること が条件として考えられる。
  21. 今後の展望 7 . 今 後 の 展 望 n 今回の解析の続き

    • 他の意⾒を提⽰した際に、今回と同様の結論が導けるか、複数のケースで確認 • 潜在的ディリクレ配分法 (LDA法)を⽤いた意⾒のクラスタリング ⇒似た論点を集めることが可能かを検討し、今回のコンテンツベースフィルタリングとの⽐較検討を⾏う。 • アノテーションの⾃動化 n Twitter等⼤規模データの解析 賛否両論な科学技術に関する話題(ゲノム編集、AIなど)がTwitter上でバズったら、更に… • 感情分析︓科学技術に対するポジネガの感情(クラスタリングした上で)
  22. 科学館業界での応⽤ n リアルタイムでの意⾒の表⽰ ある科学技術に対して、ポジティブな感情を持つか、ネガティブな感情を持つか、意⾒ を⼊⼒した際に、リアルタイムで表⽰できるダッシュボードの作成 応⽤先 • オンラインイベントのコメントのリアルタイム表⽰、ディスカッション促進 ⇒ ミッション①「科学を伝える」、②「⼈材を育てる」への寄与

    • 未来館の意⾒収集システム「オピニオン・バンク」で収集した他の⼈の意⾒の可視化 ⇒ ミッション①「科学を伝える」への寄与 • 世論調査、及び科学コミュニケーション戦略、科学館経営戦略⽴案のための情報提供 ⇒ ミッション③「つながりをつくる」への寄与 7 . 今 後 の 展 望 ⽇本科学未来館 設⽴理念 「科学技術を⽂化として捉え、社会に対する役割と未来の可能性につい て考え、語り合うための、すべての⼈々にひらかれた場」 ミッション ①科学を伝える〜先端科学技術と社会を結ぶ場の創造 ②⼈材を育てる〜科学コミュニケーターの育成 ③つながりをつくる〜ネットワークの形成による活動の展開
  23. 感じたこと 8 . 振 り 返 り n ⽬的に適ったデータの収集が⼀番の壁 ü

    Twitter APIの利⽤申請⽂書の作成、および許可を得られるまで時間がかかる。 ü Twitter APIで取得するデータは直近1週間前までしか遡れない。(今回「AI美空ひば り」のような故⼈を再現するAIの是⾮に関する意⾒を集めたかったが、上記制約により 不可能だった。) ü 市⺠の⽣の声のデータは、インターネット上での⼊⼿は困難。あるとしても、データの 数・種類は限られる。 n プロジェクト達成のための時間配分は難しい ü 本プロジェクトを進める時間を確保すること、およびその時間配分がかなり⼤変だった。 n データ分析は⽬的でなく⼿段 ü ⼤事なのは、データ分析で何がやりたいかという⽬的のデザイン。加えて⾃分のドメイ ン知識や経験、センスを働かせることではじめて、その真価を発揮できる。
  24. 分析結果 TF-IDF法 4 . 分 析 結 果 類似度順位 No.

    先進 途上 国 国際 地球 責任 選んだ意⾒ 28 0.231 0.226 0.323 0 0.227 0.152 1 95 0.160 0.235 0.503 0 0 0 2 29 0.355 0.260 0.434 0 0 0 3 79 0.110 0.108 0.308 0.145 0.144 0 4 90 0.078 0.076 0.163 0 0.051 0 5 45 0.082 0.080 0.115 0 0.054 0 6 77 0 0.087 0.186 0 0.058 0 7 67 0.116 0.114 0.244 0 0 0 8 16 0 0.088 0.189 0 0 0 9 23 0.131 0.064 0.137 0 0.086 0 91 48 0 0 0 0 0 0 92 98 0 0 0 0 0 0 93 97 0 0 0 0 0 0 94 39 0 0 0 0 0 0 95 17 0 0 0 0 0 0 96 53 0 0 0 0 0 0 97 96 0 0 0 0 0 0 98 93 0 0 0 0 0 0 99 78 0 0 0 0 0 0 100 43 0 0 0 0 0 0 ü 類似度の⾼い意⾒では共通し て「国」、「途上」という単 語が含まれていた。「先進」、 「地球」という単語も重要そ うである。 ü 類似度の低い意⾒では、上記 の単語のどれも含まれていな かった