Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
積ん読を消化するために
Search
Doarakko
January 21, 2021
Programming
0
1.2k
積ん読を消化するために
Doarakko
January 21, 2021
Tweet
Share
More Decks by Doarakko
See All by Doarakko
Cloudflare Workers で X(Twitter)のボットを作ってみた
doarakko
0
240
Vercel Edge Functions を使って作る画像メーカー
doarakko
0
64
JOIN して1ヶ月のエンジニアに聞いた Liiga の良いところ 3 選
doarakko
0
80
わんわおーん
doarakko
0
66
職場を明るくする
doarakko
0
290
コードレビューの時間を削減しました
doarakko
0
92
仕事中に隠れてテレビ番組表を見るぞ
doarakko
0
170
GitHub Project の運用を自動化しました
doarakko
0
110
GitHub Actions に入門しました
doarakko
0
1.3k
Other Decks in Programming
See All in Programming
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
41
27k
C++20 射影変換
faithandbrave
0
500
Cline指示通りに動かない? AI小説エージェントで学ぶ指示書の書き方と自動アップデートの仕組み
kamomeashizawa
1
540
Prism.parseで 300本以上あるエンドポイントに 接続できる権限の一覧表を作ってみた
hatsu38
1
110
Spring gRPC で始める gRPC 入門 / Introduction to gRPC with Spring gRPC
mackey0225
2
520
Javaのルールをねじ曲げろ!禁断の操作とその代償から学ぶメタプログラミング入門 / A Guide to Metaprogramming: Lessons from Forbidden Techniques and Their Price
nrslib
3
2k
Rails産でないDBを Railsに引っ越すHACK - Omotesando.rb #110
lnit
1
160
生成AIで日々のエラー調査を進めたい
yuyaabo
0
610
型付きアクターモデルがもたらす分散シミュレーションの未来
piyo7
0
800
DroidKnights 2025 - 다양한 스크롤 뷰에서의 영상 재생
gaeun5744
3
300
「ElixirでIoT!!」のこれまでとこれから
takasehideki
0
370
ktr0731/go-mcpでMCPサーバー作ってみた
takak2166
0
170
Featured
See All Featured
Building an army of robots
kneath
306
45k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
Scaling GitHub
holman
459
140k
The Cost Of JavaScript in 2023
addyosmani
51
8.4k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.5k
RailsConf 2023
tenderlove
30
1.1k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
43
2.4k
Why Our Code Smells
bkeepers
PRO
337
57k
For a Future-Friendly Web
brad_frost
179
9.8k
Gamification - CAS2011
davidbonilla
81
5.3k
Transcript
積ん読を消化するために @Doarakko
・2019年12月入社(2社目) ・エンジニア歴1.5年 - 仕事: Go, PHP - 趣味: Python, C++
・AtCoder 緑 ・海外サッカーをよく見ます 自己紹介 2
今日は「デジタル積ん読」の話 3
Pocket(後で読むアプリ)使ってます 4 いろいろ機能があるらしい ・他の人が多く保存している記事 ・記事のハイライト ・記事へのタグ付け(手動) 私は「保存」と「検索」しか使ってなかった
私の Pocket の使い方(ブラウザ) 5 スマホだと保存までに複数回アクションがあってつらい
なぜ積ん読を解消する必要があるのか 6 情報の鮮度が落ちる ・波に乗り遅れる ・「もっと早くこの情報を知っていれば」 積ん読しておくのが気持ち悪い?
解決策 案1. その場で読む → それができたら苦労しない 案2. 一定期間たったものは自動で捨てる → もったいない 案3.
毎日時間を確保して習慣化する → できるわけがない 案4. 後で読む基準を厳しくする → さらっと概要を掴んで全部読むか判断する 7
「さらっと概要を掴んで」 8
文章要約 9
文章要約の活用事例 10 https://www.asahi.com/corporate/info/13124567 https://about.yahoo.co.jp/info/blog/20190424/chi ebukuro.html
文章要約:要約対象 11 単一ドキュメント 複数ドキュメント
文章要約:要約手法 12 抽出型 ・元の文章の中から重要だと判断したものを、 そのまま抽出する ・メリット:元文章をそのまま使うので文法はおかしくならない ・デメリット:文章中にない単語は生まれない、文のつながりはおかしい 抽象型 ・元の文章から内容を理解して、人が作ったような 要約文を生成する
・メリット:元文章にない単語も生まれる、文章のつながりが自然 ・デメリット:文法に違和感がなく、自然な文章を生成する難易度高い
今回試したもの LexRank ・抽出型の手法で、ページランクの仕組みを応用したもの BERTSUM ・BERT の学習済みモデルを文章要約用に拡張した抽出型のモデル ・よくわからないので詳しく知りたい方は論文を読んでください → よくわからなくても動かせるくらい身近なものになっている 13
ページランク:他からリンクされているものほど良いページとする(超ざっくり)
試した記事 14 【転職エントリ】Googleに入社します 約 6,500 文字 15 分(by Pocket) https://note.com/neko_chan0214/n/n3a64bc1e1412
LexRank 15 要約文 電話面接やオンサイト面接を受けることになること、競技プログラミングのような問題が出題されること などを知りました。(58行目) このタイミングで、とある元Googleのソフトウェアエンジニアの方から声をかけていただき、模擬面接を していただけることになりました。 (78行目) 面接で聞かれた内容は秘密にする約束なので、自分が勉強した内容を記事に書くのは、面接を受ける 前に書いておいた方がいいだろうと考えました。
(136行目)
BERTSUM 16 要約文 2018年の年末年始に時間があったので、有料版を契約してきちんと Pythonの勉強をしてみようと思い ました・DataCampの分量は非常に多くて、年末年始だけでは当然終わらせることはできず、 3ヶ月以 上かかってDataScientistコースを修了しました(4行目) エンジニア採用のカジュアル面談を受け入れている医療 ×ITの企業を見つけて、いくつかネットで申し
込んでみたりもしました(31行目) この時点でとても幸運だったのは、日本語で書かれた入社体験談が同時期にたくさん投稿されていた ことです(57行目)
感想 17 ・微妙 ・全文読んだがもっと抽出してほしい文章があった ・日本語はハンデ(自然言語処理をやる上で) ・要約する文章のドメインのデータ集めないと ・これからも積み続ける
積ん読を消化するために @Doarakko