Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Examine the meaning of unknown terms
Search
Sho Yokoi
PRO
October 05, 2017
Research
10
4.3k
Examine the meaning of unknown terms
知らない用語の調べ方〜「Googleの外側」を活用するための3つのTips〜
2017-10-05, 東北大学乾研究室, 研究Tips
Sho Yokoi
PRO
October 05, 2017
Tweet
Share
More Decks by Sho Yokoi
See All by Sho Yokoi
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
「確率的なオウム」にできること、またそれがなぜできるのかについて
eumesy
PRO
7
3.1k
A Theory of Emergent In-Context Learning as Implicit Structure Induction
eumesy
PRO
5
1.3k
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
eumesy
PRO
24
17k
Revisiting Over-smoothing in BERT from the Perspective of Graph
eumesy
PRO
0
1.1k
構造を持った言語データと最適輸送
eumesy
PRO
5
7.2k
最適輸送と自然言語処理
eumesy
PRO
19
12k
言葉の形を教えてくれる自然言語処理
eumesy
PRO
1
1.5k
自分を知る,遊び場を作る
eumesy
PRO
9
4.4k
Other Decks in Research
See All in Research
工学としてのSRE再訪 / Revisiting SRE as Engineering
yuukit
19
11k
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
240
熊本から日本の都市交通政策を立て直す~「車1割削減、渋滞半減、公共交通2倍」の実現へ~@公共交通マーケティング研究会リスタートセミナー
trafficbrain
0
130
「並列化時代の乱数生成」
abap34
3
820
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
3
740
Generative Predictive Model for Autonomous Driving 第61回 コンピュータビジョン勉強会@関東 (後編)
kentosasaki
0
200
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction
sosk
1
940
Practical The One Person Framework
asonas
1
1.6k
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
330
SNLP2024:Planning Like Human: A Dual-process Framework for Dialogue Planning
yukizenimoto
1
320
最近のVisual Odometryと Depth Estimation
sgk
1
270
第79回 産総研人工知能セミナー 発表資料
agiats
1
150
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.8k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Building an army of robots
kneath
302
42k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
47
2.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.8k
Navigating Team Friction
lara
183
14k
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Rails Girls Zürich Keynote
gr2m
94
13k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
Statistics for Hackers
jakevdp
796
220k
Transcript
知らない用語の調べかた 「Google の外側」 を活用するための3 つのTips 東北大学乾研究室「 研究Tips」, 2017‑10‑05 ( 木)
横井 祥 (D1)
知らない用語の調べかた: よくある失敗例 (“ ロジスティック回帰” がよく分からない…) ( 教えてGoogle!) 線形回帰分析が量的変数を予測するのに対して、 ロジスティッ ク回帰分析は発生確率を予測する手法です。
(???)
学術用語を調べたい場合に「 適当にググる」 のは悪手 前提: 世の中には信頼度の高い情報と信頼度の低い情報がある 検索結果の上位には信頼度の低い情報が大量に存在 “ 調べてみた” 系 blog
記事, メンテナンスされていない “ 事典” フィルタする必要がある 書籍としてのみ存在する( 電子化・ オンライン化されていない), または有料DB として存在する信頼度の高い情報はたくさんある 専門事典, 教科書 一概に「 ググるのはダメ」 というわけではない 良質なネットコンテンツも増える一方 どんな分野の話かを知るするためにググってみるのも効果的 しかし, 書籍や有料DB を活用しないと調べ物の効率が大幅に落ちる
今日触れるTips 辞書事典ポー タルとしてジャパンナレッジを使う 分野くらいは分かっている用語に対しては専門事典を使う 教科書や講義資料をストックしておいて用語集として使う
情報源の粒度 ↑ 情報の粒度が粗い, 初学者向け, 古い( 確立している), 先に調べる 1. 百科事典; レファレンス・
サー ビス 2. 専門事典 3. 教科書; OCWs, MOOCs, 講義資料 4. サー ベイ論文 5. 原著論文, 著者スライド ↓ 情報の粒度が細かい, 専門家向け, 新しい ほか, 各種インター ネットリソー ス (blog, 掲示板, etc.)
1. 百科事典 「 何も分からない… 何も…」「 どんな分野に属する用語なのかも分 からない…」 という状態でまず調べるべきもの ありとあらゆることに関して基礎的な説明を与えることを目指 した事典
ここに書いてあることは既知の事実として扱われる( と思って 良い) 分野や関連キー ワー ドのあたりをつけるのに使う ( 図書館に行って引いても良いが…) 紙の百科事典は大部で辛い → ネット資源に頼る i. ジャパンナレッジで検索できる各種百科事典 ii. Wikipedia
ジャパンナレッジ, ニッポニカ ジャパンナレッジ 百科事典をはじめとした多くの辞書事典のオンラインポー タル たとえばこのような事典が入っている: 小学館『 日本大百科全書 ( ニッポニカ)』,
約14 万項目 平凡社『 改訂新版 世界大百科事典』, 約9 万項目 調べ物の強い味方 年間2 万円程度で利用できる → ( それなりに大きな) 大学の附属図書館は団体契約してくれている ので, 大学に所属していると無料で利用できる 電子ブック ‑ 東北大学附属図書館 ジャパンナレッジ 同時利用人数: 基本コレクション:4 利用終了時は必ずログアウトしてください
… 次にどんな分野の文献を辿れば良いか分かる
小学館『 日本方言大辞典』 百科事典以外にも色々 な辞書事典が入っている
『 日本国語大辞典』( 通称“ 日国”, 50 万項目, 唯一の“ 大事典”) も利用可 語源や語史の記述に優れる
Wikipedia よくある前時代的な批判: 「 匿名なので信用できない」 紙媒体・ 記名性の百科事典と同程度の信頼性 [Giles'05, etc.] 我々 が調べるドメインの品質は別に悪くない(
とくに英語版) 著名な人が書いた信頼できない記事だっていくらでもある よくある小学生向け指導: 「 信用できないので引用してはいけない」 そもそも辞書事典は引用しない 理解の助けになりそうならどんどん使う ( 特に我々 のドメインに関しては) 英語版推奨 “References” が結構充実しているので活用する Wikiwand で少し見やすく
2. 専門事典 専門事典= 分野別の事典 その道のプロが「 一言で言うと…」「1 ペー ジでまとめると…」 をやってくれている, 日常的な調べ物の初手として非常に便利
日常的に調べたくなる用語はだいたい分野くらいは分かってい る, 百科事典まで戻らなくて良い 図書館の参考図書コー ナー には各分野の専門事典が揃っている 2017 年現在ほとんどオンライン化されていない, 紙で引くしかない 個人的おすすめ:『 言語処理学事典』, 『 人工知能学大事典』, 『MIT 認知科学大事典』; 『 言語学百科事典』, 『 英語学要語辞 典』; 『 現代数理科学事典』; 『 岩波数学入門辞典』, 『 プリン ストン数学大全』; 『 岩波哲学・ 思想事典』, Stanford Encyclopedia of Philosophy (SEP); etc. 全部研究室にあります
『MIT 認知科学大事典』 目次 哲学, 心理学, 神経科学, 計算論的知能( 所謂人工知能), 言語学, 文化・
認知・ 進化 のトピックについてそれぞれ2 ペー ジ程度の解説 我々 に馴染み深いテー マ多数. 超おすすめ
『 岩波数学入門辞典』s 数学用語のみならず, “ 数学語” も多数 掲載. 気持ちをたくさん書いてくれて いる稀有な数学辞典. 著者のひとりによる紹介
最終段階では, 700ペー ジの 辞書を最初から最後 まで通して 読む, という, かなり非人間的 な作業を, 何人もの執筆者が行 い, たとえば筆者は少なくとも 1 0回は繰り返した.
3. 教科書; OCWs/MOOCs, 講義資料 ググるよりも, 事典を引くよりも, 教科書を調べてしまうのが早い話 題はたくさんある 講義資料のPDF やOCWs/MOOCs
の動画が今は山ほど手に入る いずれも一般にその辺の blog よりもはるかに正確で分かりやすい おすすめアクション 有用な( 自分にとって分かりやすく正確な) 教科書を探す, リスト アップしておく 有用な講義資料はまとめてダウンロー ドしておく, 全文検索の対象 にする
例えば… ロジックの用語が分からない → 教科書: 『 論理と計算のしくみ』, 『 情報科学における論理』; 新井『 数学基礎論』
機械学習用語が分からない → 教科書: 『 はじめてのパター ン認識』, 中川『 機械学習』, 『 統 計的学習の基礎』, Murphy『Machine Learning: A Probabilistic Perspective』 講義資料: Bonen&Ng2017 鈴木& 野村2015 杉山2013 鹿島2010 ※ オンライン用語集朱鷺の杜Wiki も有用
まとめ 百科事典 分野すら分からない場合は百科事典を使う ジャパンナレッジを使う ( ニッポニカ, 日国, etc.) 専門事典 専門家による“
まとめ記事”, 調べ物の初手としておすすめ ほとんど電子化されていないので紙で引く 教科書; OCWc/MOOCs, 講義資料 教科書や講義資料も大事な“ 用語集” 自分にとって分かりやすい& 有用な教科書のリストを作る 有用な講義資料はロー カルに保存して全文検索の対象にする
蛇足1: 勿論ネットリソー スも極めて重要 たとえば 数学の調べ物: Stack Exchange Mathematics; MathOverflow Tech
な話: 各種公式 Docs, Stack Overflow 論文に関する議論, 速報: reddit, Twitter 分野毎に「 どこに調べに行けば良いか」 は異なる リストを更新し続けましょう
蛇足2: ポエム 「Google の外」 をも活用し, 不案内な概念の正確な定義に素早くた どり着く力は, 高等教育で身につけるべき重要な情報リテラシー 武器を買い替え, 磨き,
鍛え続けましょう 研究活動を通して「 調べ方」 そのものをチュー ニングし続けま しょう 有用な文献・ ウェブサイトのリストを常に更新し続けましょう