Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Examine the meaning of unknown terms
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Sho Yokoi
PRO
October 05, 2017
Research
10
4.6k
Examine the meaning of unknown terms
知らない用語の調べ方〜「Googleの外側」を活用するための3つのTips〜
2017-10-05, 東北大学乾研究室, 研究Tips
Sho Yokoi
PRO
October 05, 2017
Tweet
Share
More Decks by Sho Yokoi
See All by Sho Yokoi
言語モデルから言語について語る際に押さえておきたいこと
eumesy
PRO
5
1.9k
Language Models Are Implicitly Continuous
eumesy
PRO
0
430
言語モデルの内部機序:解析と解釈
eumesy
PRO
81
27k
コーパスを丸呑みしたモデルから言語の何がわかるか
eumesy
PRO
12
4.8k
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
10
2.4k
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
2k
「確率的なオウム」にできること、またそれがなぜできるのかについて
eumesy
PRO
8
4.5k
A Theory of Emergent In-Context Learning as Implicit Structure Induction
eumesy
PRO
5
1.8k
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
eumesy
PRO
25
19k
Other Decks in Research
See All in Research
生成AI による論文執筆サポート・ワークショップ データ分析/論文ドラフト編 / Generative AI-Assisted Paper Writing Support Workshop: Data Analysis and Drafting Edition
ks91
PRO
0
110
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
1
230
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
290
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
100
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
140
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
130
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
270
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
2.3k
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
550
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
360
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.6k
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
0
110
Featured
See All Featured
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
180
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Typedesign – Prime Four
hannesfritz
42
3k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
Code Review Best Practice
trishagee
74
20k
How to Talk to Developers About Accessibility
jct
2
160
Darren the Foodie - Storyboard
khoart
PRO
3
3.1k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
260
Transcript
知らない用語の調べかた 「Google の外側」 を活用するための3 つのTips 東北大学乾研究室「 研究Tips」, 2017‑10‑05 ( 木)
横井 祥 (D1)
知らない用語の調べかた: よくある失敗例 (“ ロジスティック回帰” がよく分からない…) ( 教えてGoogle!) 線形回帰分析が量的変数を予測するのに対して、 ロジスティッ ク回帰分析は発生確率を予測する手法です。
(???)
学術用語を調べたい場合に「 適当にググる」 のは悪手 前提: 世の中には信頼度の高い情報と信頼度の低い情報がある 検索結果の上位には信頼度の低い情報が大量に存在 “ 調べてみた” 系 blog
記事, メンテナンスされていない “ 事典” フィルタする必要がある 書籍としてのみ存在する( 電子化・ オンライン化されていない), または有料DB として存在する信頼度の高い情報はたくさんある 専門事典, 教科書 一概に「 ググるのはダメ」 というわけではない 良質なネットコンテンツも増える一方 どんな分野の話かを知るするためにググってみるのも効果的 しかし, 書籍や有料DB を活用しないと調べ物の効率が大幅に落ちる
今日触れるTips 辞書事典ポー タルとしてジャパンナレッジを使う 分野くらいは分かっている用語に対しては専門事典を使う 教科書や講義資料をストックしておいて用語集として使う
情報源の粒度 ↑ 情報の粒度が粗い, 初学者向け, 古い( 確立している), 先に調べる 1. 百科事典; レファレンス・
サー ビス 2. 専門事典 3. 教科書; OCWs, MOOCs, 講義資料 4. サー ベイ論文 5. 原著論文, 著者スライド ↓ 情報の粒度が細かい, 専門家向け, 新しい ほか, 各種インター ネットリソー ス (blog, 掲示板, etc.)
1. 百科事典 「 何も分からない… 何も…」「 どんな分野に属する用語なのかも分 からない…」 という状態でまず調べるべきもの ありとあらゆることに関して基礎的な説明を与えることを目指 した事典
ここに書いてあることは既知の事実として扱われる( と思って 良い) 分野や関連キー ワー ドのあたりをつけるのに使う ( 図書館に行って引いても良いが…) 紙の百科事典は大部で辛い → ネット資源に頼る i. ジャパンナレッジで検索できる各種百科事典 ii. Wikipedia
ジャパンナレッジ, ニッポニカ ジャパンナレッジ 百科事典をはじめとした多くの辞書事典のオンラインポー タル たとえばこのような事典が入っている: 小学館『 日本大百科全書 ( ニッポニカ)』,
約14 万項目 平凡社『 改訂新版 世界大百科事典』, 約9 万項目 調べ物の強い味方 年間2 万円程度で利用できる → ( それなりに大きな) 大学の附属図書館は団体契約してくれている ので, 大学に所属していると無料で利用できる 電子ブック ‑ 東北大学附属図書館 ジャパンナレッジ 同時利用人数: 基本コレクション:4 利用終了時は必ずログアウトしてください
… 次にどんな分野の文献を辿れば良いか分かる
小学館『 日本方言大辞典』 百科事典以外にも色々 な辞書事典が入っている
『 日本国語大辞典』( 通称“ 日国”, 50 万項目, 唯一の“ 大事典”) も利用可 語源や語史の記述に優れる
Wikipedia よくある前時代的な批判: 「 匿名なので信用できない」 紙媒体・ 記名性の百科事典と同程度の信頼性 [Giles'05, etc.] 我々 が調べるドメインの品質は別に悪くない(
とくに英語版) 著名な人が書いた信頼できない記事だっていくらでもある よくある小学生向け指導: 「 信用できないので引用してはいけない」 そもそも辞書事典は引用しない 理解の助けになりそうならどんどん使う ( 特に我々 のドメインに関しては) 英語版推奨 “References” が結構充実しているので活用する Wikiwand で少し見やすく
2. 専門事典 専門事典= 分野別の事典 その道のプロが「 一言で言うと…」「1 ペー ジでまとめると…」 をやってくれている, 日常的な調べ物の初手として非常に便利
日常的に調べたくなる用語はだいたい分野くらいは分かってい る, 百科事典まで戻らなくて良い 図書館の参考図書コー ナー には各分野の専門事典が揃っている 2017 年現在ほとんどオンライン化されていない, 紙で引くしかない 個人的おすすめ:『 言語処理学事典』, 『 人工知能学大事典』, 『MIT 認知科学大事典』; 『 言語学百科事典』, 『 英語学要語辞 典』; 『 現代数理科学事典』; 『 岩波数学入門辞典』, 『 プリン ストン数学大全』; 『 岩波哲学・ 思想事典』, Stanford Encyclopedia of Philosophy (SEP); etc. 全部研究室にあります
『MIT 認知科学大事典』 目次 哲学, 心理学, 神経科学, 計算論的知能( 所謂人工知能), 言語学, 文化・
認知・ 進化 のトピックについてそれぞれ2 ペー ジ程度の解説 我々 に馴染み深いテー マ多数. 超おすすめ
『 岩波数学入門辞典』s 数学用語のみならず, “ 数学語” も多数 掲載. 気持ちをたくさん書いてくれて いる稀有な数学辞典. 著者のひとりによる紹介
最終段階では, 700ペー ジの 辞書を最初から最後 まで通して 読む, という, かなり非人間的 な作業を, 何人もの執筆者が行 い, たとえば筆者は少なくとも 1 0回は繰り返した.
3. 教科書; OCWs/MOOCs, 講義資料 ググるよりも, 事典を引くよりも, 教科書を調べてしまうのが早い話 題はたくさんある 講義資料のPDF やOCWs/MOOCs
の動画が今は山ほど手に入る いずれも一般にその辺の blog よりもはるかに正確で分かりやすい おすすめアクション 有用な( 自分にとって分かりやすく正確な) 教科書を探す, リスト アップしておく 有用な講義資料はまとめてダウンロー ドしておく, 全文検索の対象 にする
例えば… ロジックの用語が分からない → 教科書: 『 論理と計算のしくみ』, 『 情報科学における論理』; 新井『 数学基礎論』
機械学習用語が分からない → 教科書: 『 はじめてのパター ン認識』, 中川『 機械学習』, 『 統 計的学習の基礎』, Murphy『Machine Learning: A Probabilistic Perspective』 講義資料: Bonen&Ng2017 鈴木& 野村2015 杉山2013 鹿島2010 ※ オンライン用語集朱鷺の杜Wiki も有用
まとめ 百科事典 分野すら分からない場合は百科事典を使う ジャパンナレッジを使う ( ニッポニカ, 日国, etc.) 専門事典 専門家による“
まとめ記事”, 調べ物の初手としておすすめ ほとんど電子化されていないので紙で引く 教科書; OCWc/MOOCs, 講義資料 教科書や講義資料も大事な“ 用語集” 自分にとって分かりやすい& 有用な教科書のリストを作る 有用な講義資料はロー カルに保存して全文検索の対象にする
蛇足1: 勿論ネットリソー スも極めて重要 たとえば 数学の調べ物: Stack Exchange Mathematics; MathOverflow Tech
な話: 各種公式 Docs, Stack Overflow 論文に関する議論, 速報: reddit, Twitter 分野毎に「 どこに調べに行けば良いか」 は異なる リストを更新し続けましょう
蛇足2: ポエム 「Google の外」 をも活用し, 不案内な概念の正確な定義に素早くた どり着く力は, 高等教育で身につけるべき重要な情報リテラシー 武器を買い替え, 磨き,
鍛え続けましょう 研究活動を通して「 調べ方」 そのものをチュー ニングし続けま しょう 有用な文献・ ウェブサイトのリストを常に更新し続けましょう