Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Examine the meaning of unknown terms
Search
Sho Yokoi
PRO
October 05, 2017
Research
10
4.4k
Examine the meaning of unknown terms
知らない用語の調べ方〜「Googleの外側」を活用するための3つのTips〜
2017-10-05, 東北大学乾研究室, 研究Tips
Sho Yokoi
PRO
October 05, 2017
Tweet
Share
More Decks by Sho Yokoi
See All by Sho Yokoi
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.2k
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.3k
「確率的なオウム」にできること、またそれがなぜできるのかについて
eumesy
PRO
8
3.2k
A Theory of Emergent In-Context Learning as Implicit Structure Induction
eumesy
PRO
5
1.4k
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
eumesy
PRO
25
18k
Revisiting Over-smoothing in BERT from the Perspective of Graph
eumesy
PRO
0
1.2k
構造を持った言語データと最適輸送
eumesy
PRO
5
7.4k
最適輸送と自然言語処理
eumesy
PRO
19
12k
言葉の形を教えてくれる自然言語処理
eumesy
PRO
1
1.6k
Other Decks in Research
See All in Research
Optimal and Diffusion Transports in Machine Learning
gpeyre
0
700
ダイナミックプライシング とその実例
skmr2348
3
520
PetiteSRE_GenAIEraにおけるインフラのあり方観察
ichichi
0
230
論文読み会 KDD2024 | Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations
cocomoff
0
130
20241115都市交通決起集会 趣旨説明・熊本事例紹介
trafficbrain
0
860
書き手はどこを訪れたか? - 言語モデルで訪問行動を読み取る -
hiroki13
0
100
ECCV2024読み会: Minimalist Vision with Freeform Pixels
hsmtta
1
350
「熊本県内バス・電車無料デー」の振り返りとその後の展開@土木計画学SS:成功失敗事例に学ぶ公共交通運賃設定
trafficbrain
0
110
Practical The One Person Framework
asonas
1
1.9k
最近のVisual Odometryと Depth Estimation
sgk
1
340
KDD論文読み会2024: False Positive in A/B Tests
ryotoitoi
0
260
機械学習でヒトの行動を変える
hiromu1996
1
440
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
3
340
The World Runs on Bad Software
bkeepers
PRO
66
11k
Designing for humans not robots
tammielis
250
25k
Documentation Writing (for coders)
carmenintech
67
4.5k
Agile that works and the tools we love
rasmusluckow
328
21k
Visualization
eitanlees
146
15k
Making the Leap to Tech Lead
cromwellryan
133
9k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Designing on Purpose - Digital PM Summit 2013
jponch
116
7.1k
How to Ace a Technical Interview
jacobian
276
23k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Transcript
知らない用語の調べかた 「Google の外側」 を活用するための3 つのTips 東北大学乾研究室「 研究Tips」, 2017‑10‑05 ( 木)
横井 祥 (D1)
知らない用語の調べかた: よくある失敗例 (“ ロジスティック回帰” がよく分からない…) ( 教えてGoogle!) 線形回帰分析が量的変数を予測するのに対して、 ロジスティッ ク回帰分析は発生確率を予測する手法です。
(???)
学術用語を調べたい場合に「 適当にググる」 のは悪手 前提: 世の中には信頼度の高い情報と信頼度の低い情報がある 検索結果の上位には信頼度の低い情報が大量に存在 “ 調べてみた” 系 blog
記事, メンテナンスされていない “ 事典” フィルタする必要がある 書籍としてのみ存在する( 電子化・ オンライン化されていない), または有料DB として存在する信頼度の高い情報はたくさんある 専門事典, 教科書 一概に「 ググるのはダメ」 というわけではない 良質なネットコンテンツも増える一方 どんな分野の話かを知るするためにググってみるのも効果的 しかし, 書籍や有料DB を活用しないと調べ物の効率が大幅に落ちる
今日触れるTips 辞書事典ポー タルとしてジャパンナレッジを使う 分野くらいは分かっている用語に対しては専門事典を使う 教科書や講義資料をストックしておいて用語集として使う
情報源の粒度 ↑ 情報の粒度が粗い, 初学者向け, 古い( 確立している), 先に調べる 1. 百科事典; レファレンス・
サー ビス 2. 専門事典 3. 教科書; OCWs, MOOCs, 講義資料 4. サー ベイ論文 5. 原著論文, 著者スライド ↓ 情報の粒度が細かい, 専門家向け, 新しい ほか, 各種インター ネットリソー ス (blog, 掲示板, etc.)
1. 百科事典 「 何も分からない… 何も…」「 どんな分野に属する用語なのかも分 からない…」 という状態でまず調べるべきもの ありとあらゆることに関して基礎的な説明を与えることを目指 した事典
ここに書いてあることは既知の事実として扱われる( と思って 良い) 分野や関連キー ワー ドのあたりをつけるのに使う ( 図書館に行って引いても良いが…) 紙の百科事典は大部で辛い → ネット資源に頼る i. ジャパンナレッジで検索できる各種百科事典 ii. Wikipedia
ジャパンナレッジ, ニッポニカ ジャパンナレッジ 百科事典をはじめとした多くの辞書事典のオンラインポー タル たとえばこのような事典が入っている: 小学館『 日本大百科全書 ( ニッポニカ)』,
約14 万項目 平凡社『 改訂新版 世界大百科事典』, 約9 万項目 調べ物の強い味方 年間2 万円程度で利用できる → ( それなりに大きな) 大学の附属図書館は団体契約してくれている ので, 大学に所属していると無料で利用できる 電子ブック ‑ 東北大学附属図書館 ジャパンナレッジ 同時利用人数: 基本コレクション:4 利用終了時は必ずログアウトしてください
… 次にどんな分野の文献を辿れば良いか分かる
小学館『 日本方言大辞典』 百科事典以外にも色々 な辞書事典が入っている
『 日本国語大辞典』( 通称“ 日国”, 50 万項目, 唯一の“ 大事典”) も利用可 語源や語史の記述に優れる
Wikipedia よくある前時代的な批判: 「 匿名なので信用できない」 紙媒体・ 記名性の百科事典と同程度の信頼性 [Giles'05, etc.] 我々 が調べるドメインの品質は別に悪くない(
とくに英語版) 著名な人が書いた信頼できない記事だっていくらでもある よくある小学生向け指導: 「 信用できないので引用してはいけない」 そもそも辞書事典は引用しない 理解の助けになりそうならどんどん使う ( 特に我々 のドメインに関しては) 英語版推奨 “References” が結構充実しているので活用する Wikiwand で少し見やすく
2. 専門事典 専門事典= 分野別の事典 その道のプロが「 一言で言うと…」「1 ペー ジでまとめると…」 をやってくれている, 日常的な調べ物の初手として非常に便利
日常的に調べたくなる用語はだいたい分野くらいは分かってい る, 百科事典まで戻らなくて良い 図書館の参考図書コー ナー には各分野の専門事典が揃っている 2017 年現在ほとんどオンライン化されていない, 紙で引くしかない 個人的おすすめ:『 言語処理学事典』, 『 人工知能学大事典』, 『MIT 認知科学大事典』; 『 言語学百科事典』, 『 英語学要語辞 典』; 『 現代数理科学事典』; 『 岩波数学入門辞典』, 『 プリン ストン数学大全』; 『 岩波哲学・ 思想事典』, Stanford Encyclopedia of Philosophy (SEP); etc. 全部研究室にあります
『MIT 認知科学大事典』 目次 哲学, 心理学, 神経科学, 計算論的知能( 所謂人工知能), 言語学, 文化・
認知・ 進化 のトピックについてそれぞれ2 ペー ジ程度の解説 我々 に馴染み深いテー マ多数. 超おすすめ
『 岩波数学入門辞典』s 数学用語のみならず, “ 数学語” も多数 掲載. 気持ちをたくさん書いてくれて いる稀有な数学辞典. 著者のひとりによる紹介
最終段階では, 700ペー ジの 辞書を最初から最後 まで通して 読む, という, かなり非人間的 な作業を, 何人もの執筆者が行 い, たとえば筆者は少なくとも 1 0回は繰り返した.
3. 教科書; OCWs/MOOCs, 講義資料 ググるよりも, 事典を引くよりも, 教科書を調べてしまうのが早い話 題はたくさんある 講義資料のPDF やOCWs/MOOCs
の動画が今は山ほど手に入る いずれも一般にその辺の blog よりもはるかに正確で分かりやすい おすすめアクション 有用な( 自分にとって分かりやすく正確な) 教科書を探す, リスト アップしておく 有用な講義資料はまとめてダウンロー ドしておく, 全文検索の対象 にする
例えば… ロジックの用語が分からない → 教科書: 『 論理と計算のしくみ』, 『 情報科学における論理』; 新井『 数学基礎論』
機械学習用語が分からない → 教科書: 『 はじめてのパター ン認識』, 中川『 機械学習』, 『 統 計的学習の基礎』, Murphy『Machine Learning: A Probabilistic Perspective』 講義資料: Bonen&Ng2017 鈴木& 野村2015 杉山2013 鹿島2010 ※ オンライン用語集朱鷺の杜Wiki も有用
まとめ 百科事典 分野すら分からない場合は百科事典を使う ジャパンナレッジを使う ( ニッポニカ, 日国, etc.) 専門事典 専門家による“
まとめ記事”, 調べ物の初手としておすすめ ほとんど電子化されていないので紙で引く 教科書; OCWc/MOOCs, 講義資料 教科書や講義資料も大事な“ 用語集” 自分にとって分かりやすい& 有用な教科書のリストを作る 有用な講義資料はロー カルに保存して全文検索の対象にする
蛇足1: 勿論ネットリソー スも極めて重要 たとえば 数学の調べ物: Stack Exchange Mathematics; MathOverflow Tech
な話: 各種公式 Docs, Stack Overflow 論文に関する議論, 速報: reddit, Twitter 分野毎に「 どこに調べに行けば良いか」 は異なる リストを更新し続けましょう
蛇足2: ポエム 「Google の外」 をも活用し, 不案内な概念の正確な定義に素早くた どり着く力は, 高等教育で身につけるべき重要な情報リテラシー 武器を買い替え, 磨き,
鍛え続けましょう 研究活動を通して「 調べ方」 そのものをチュー ニングし続けま しょう 有用な文献・ ウェブサイトのリストを常に更新し続けましょう