Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Examine the meaning of unknown terms
Search
Sho Yokoi
PRO
October 05, 2017
Research
10
4.4k
Examine the meaning of unknown terms
知らない用語の調べ方〜「Googleの外側」を活用するための3つのTips〜
2017-10-05, 東北大学乾研究室, 研究Tips
Sho Yokoi
PRO
October 05, 2017
Tweet
Share
More Decks by Sho Yokoi
See All by Sho Yokoi
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1k
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
「確率的なオウム」にできること、またそれがなぜできるのかについて
eumesy
PRO
8
3.2k
A Theory of Emergent In-Context Learning as Implicit Structure Induction
eumesy
PRO
5
1.4k
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
eumesy
PRO
25
18k
Revisiting Over-smoothing in BERT from the Perspective of Graph
eumesy
PRO
0
1.2k
構造を持った言語データと最適輸送
eumesy
PRO
5
7.3k
最適輸送と自然言語処理
eumesy
PRO
19
12k
言葉の形を教えてくれる自然言語処理
eumesy
PRO
1
1.5k
Other Decks in Research
See All in Research
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
250
snlp2024_multiheadMoE
takase
0
460
Global Evidence Summit (GES) 参加報告
daimoriwaki
0
190
marukotenant01/tenant-20240916
marketing2024
0
610
CoRL2024サーベイ
rpc
1
1.1k
打率7割を実現する、プロダクトディスカバリーの7つの極意(pmconf2024)
geshi0820
0
120
Introducing Research Units of Matsuo-Iwasawa Laboratory
matsuolab
0
1.2k
RSJ2024「基盤モデルの実ロボット応用」チュートリアルA(河原塚)
haraduka
3
690
Weekly AI Agents News! 9月号 論文のアーカイブ
masatoto
1
140
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
230
メタヒューリスティクスに基づく汎用線形整数計画ソルバーの開発
snowberryfield
3
610
湯村研究室の紹介2024 / yumulab2024
yumulab
0
350
Featured
See All Featured
Producing Creativity
orderedlist
PRO
341
39k
Become a Pro
speakerdeck
PRO
26
5k
Fireside Chat
paigeccino
34
3.1k
KATA
mclloyd
29
14k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Statistics for Hackers
jakevdp
796
220k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Practical Orchestrator
shlominoach
186
10k
Thoughts on Productivity
jonyablonski
67
4.3k
Bash Introduction
62gerente
608
210k
Transcript
知らない用語の調べかた 「Google の外側」 を活用するための3 つのTips 東北大学乾研究室「 研究Tips」, 2017‑10‑05 ( 木)
横井 祥 (D1)
知らない用語の調べかた: よくある失敗例 (“ ロジスティック回帰” がよく分からない…) ( 教えてGoogle!) 線形回帰分析が量的変数を予測するのに対して、 ロジスティッ ク回帰分析は発生確率を予測する手法です。
(???)
学術用語を調べたい場合に「 適当にググる」 のは悪手 前提: 世の中には信頼度の高い情報と信頼度の低い情報がある 検索結果の上位には信頼度の低い情報が大量に存在 “ 調べてみた” 系 blog
記事, メンテナンスされていない “ 事典” フィルタする必要がある 書籍としてのみ存在する( 電子化・ オンライン化されていない), または有料DB として存在する信頼度の高い情報はたくさんある 専門事典, 教科書 一概に「 ググるのはダメ」 というわけではない 良質なネットコンテンツも増える一方 どんな分野の話かを知るするためにググってみるのも効果的 しかし, 書籍や有料DB を活用しないと調べ物の効率が大幅に落ちる
今日触れるTips 辞書事典ポー タルとしてジャパンナレッジを使う 分野くらいは分かっている用語に対しては専門事典を使う 教科書や講義資料をストックしておいて用語集として使う
情報源の粒度 ↑ 情報の粒度が粗い, 初学者向け, 古い( 確立している), 先に調べる 1. 百科事典; レファレンス・
サー ビス 2. 専門事典 3. 教科書; OCWs, MOOCs, 講義資料 4. サー ベイ論文 5. 原著論文, 著者スライド ↓ 情報の粒度が細かい, 専門家向け, 新しい ほか, 各種インター ネットリソー ス (blog, 掲示板, etc.)
1. 百科事典 「 何も分からない… 何も…」「 どんな分野に属する用語なのかも分 からない…」 という状態でまず調べるべきもの ありとあらゆることに関して基礎的な説明を与えることを目指 した事典
ここに書いてあることは既知の事実として扱われる( と思って 良い) 分野や関連キー ワー ドのあたりをつけるのに使う ( 図書館に行って引いても良いが…) 紙の百科事典は大部で辛い → ネット資源に頼る i. ジャパンナレッジで検索できる各種百科事典 ii. Wikipedia
ジャパンナレッジ, ニッポニカ ジャパンナレッジ 百科事典をはじめとした多くの辞書事典のオンラインポー タル たとえばこのような事典が入っている: 小学館『 日本大百科全書 ( ニッポニカ)』,
約14 万項目 平凡社『 改訂新版 世界大百科事典』, 約9 万項目 調べ物の強い味方 年間2 万円程度で利用できる → ( それなりに大きな) 大学の附属図書館は団体契約してくれている ので, 大学に所属していると無料で利用できる 電子ブック ‑ 東北大学附属図書館 ジャパンナレッジ 同時利用人数: 基本コレクション:4 利用終了時は必ずログアウトしてください
… 次にどんな分野の文献を辿れば良いか分かる
小学館『 日本方言大辞典』 百科事典以外にも色々 な辞書事典が入っている
『 日本国語大辞典』( 通称“ 日国”, 50 万項目, 唯一の“ 大事典”) も利用可 語源や語史の記述に優れる
Wikipedia よくある前時代的な批判: 「 匿名なので信用できない」 紙媒体・ 記名性の百科事典と同程度の信頼性 [Giles'05, etc.] 我々 が調べるドメインの品質は別に悪くない(
とくに英語版) 著名な人が書いた信頼できない記事だっていくらでもある よくある小学生向け指導: 「 信用できないので引用してはいけない」 そもそも辞書事典は引用しない 理解の助けになりそうならどんどん使う ( 特に我々 のドメインに関しては) 英語版推奨 “References” が結構充実しているので活用する Wikiwand で少し見やすく
2. 専門事典 専門事典= 分野別の事典 その道のプロが「 一言で言うと…」「1 ペー ジでまとめると…」 をやってくれている, 日常的な調べ物の初手として非常に便利
日常的に調べたくなる用語はだいたい分野くらいは分かってい る, 百科事典まで戻らなくて良い 図書館の参考図書コー ナー には各分野の専門事典が揃っている 2017 年現在ほとんどオンライン化されていない, 紙で引くしかない 個人的おすすめ:『 言語処理学事典』, 『 人工知能学大事典』, 『MIT 認知科学大事典』; 『 言語学百科事典』, 『 英語学要語辞 典』; 『 現代数理科学事典』; 『 岩波数学入門辞典』, 『 プリン ストン数学大全』; 『 岩波哲学・ 思想事典』, Stanford Encyclopedia of Philosophy (SEP); etc. 全部研究室にあります
『MIT 認知科学大事典』 目次 哲学, 心理学, 神経科学, 計算論的知能( 所謂人工知能), 言語学, 文化・
認知・ 進化 のトピックについてそれぞれ2 ペー ジ程度の解説 我々 に馴染み深いテー マ多数. 超おすすめ
『 岩波数学入門辞典』s 数学用語のみならず, “ 数学語” も多数 掲載. 気持ちをたくさん書いてくれて いる稀有な数学辞典. 著者のひとりによる紹介
最終段階では, 700ペー ジの 辞書を最初から最後 まで通して 読む, という, かなり非人間的 な作業を, 何人もの執筆者が行 い, たとえば筆者は少なくとも 1 0回は繰り返した.
3. 教科書; OCWs/MOOCs, 講義資料 ググるよりも, 事典を引くよりも, 教科書を調べてしまうのが早い話 題はたくさんある 講義資料のPDF やOCWs/MOOCs
の動画が今は山ほど手に入る いずれも一般にその辺の blog よりもはるかに正確で分かりやすい おすすめアクション 有用な( 自分にとって分かりやすく正確な) 教科書を探す, リスト アップしておく 有用な講義資料はまとめてダウンロー ドしておく, 全文検索の対象 にする
例えば… ロジックの用語が分からない → 教科書: 『 論理と計算のしくみ』, 『 情報科学における論理』; 新井『 数学基礎論』
機械学習用語が分からない → 教科書: 『 はじめてのパター ン認識』, 中川『 機械学習』, 『 統 計的学習の基礎』, Murphy『Machine Learning: A Probabilistic Perspective』 講義資料: Bonen&Ng2017 鈴木& 野村2015 杉山2013 鹿島2010 ※ オンライン用語集朱鷺の杜Wiki も有用
まとめ 百科事典 分野すら分からない場合は百科事典を使う ジャパンナレッジを使う ( ニッポニカ, 日国, etc.) 専門事典 専門家による“
まとめ記事”, 調べ物の初手としておすすめ ほとんど電子化されていないので紙で引く 教科書; OCWc/MOOCs, 講義資料 教科書や講義資料も大事な“ 用語集” 自分にとって分かりやすい& 有用な教科書のリストを作る 有用な講義資料はロー カルに保存して全文検索の対象にする
蛇足1: 勿論ネットリソー スも極めて重要 たとえば 数学の調べ物: Stack Exchange Mathematics; MathOverflow Tech
な話: 各種公式 Docs, Stack Overflow 論文に関する議論, 速報: reddit, Twitter 分野毎に「 どこに調べに行けば良いか」 は異なる リストを更新し続けましょう
蛇足2: ポエム 「Google の外」 をも活用し, 不案内な概念の正確な定義に素早くた どり着く力は, 高等教育で身につけるべき重要な情報リテラシー 武器を買い替え, 磨き,
鍛え続けましょう 研究活動を通して「 調べ方」 そのものをチュー ニングし続けま しょう 有用な文献・ ウェブサイトのリストを常に更新し続けましょう