$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
積ん読を消化するために
Search
Doarakko
January 21, 2021
Programming
0
1.3k
積ん読を消化するために
Doarakko
January 21, 2021
Tweet
Share
More Decks by Doarakko
See All by Doarakko
Cloudflare Workers で X(Twitter)のボットを作ってみた
doarakko
0
280
Vercel Edge Functions を使って作る画像メーカー
doarakko
0
75
JOIN して1ヶ月のエンジニアに聞いた Liiga の良いところ 3 選
doarakko
0
81
わんわおーん
doarakko
0
68
職場を明るくする
doarakko
0
310
コードレビューの時間を削減しました
doarakko
0
96
仕事中に隠れてテレビ番組表を見るぞ
doarakko
0
200
GitHub Project の運用を自動化しました
doarakko
0
110
GitHub Actions に入門しました
doarakko
0
1.3k
Other Decks in Programming
See All in Programming
tparseでgo testの出力を見やすくする
utgwkk
2
260
【Streamlit x Snowflake】データ基盤からアプリ開発・AI活用まで、すべてをSnowflake内で実現
ayumu_yamaguchi
1
120
Full-Cycle Reactivity in Angular: SignalStore mit Signal Forms und Resources
manfredsteyer
PRO
0
150
脳の「省エネモード」をデバッグする ~System 1(直感)と System 2(論理)の切り替え~
panda728
PRO
0
110
UIデザインに役立つ 2025年の最新CSS / The Latest CSS for UI Design 2025
clockmaker
18
7.6k
C-Shared Buildで突破するAI Agent バックテストの壁
po3rin
0
400
バックエンドエンジニアによる Amebaブログ K8s 基盤への CronJobの導入・運用経験
sunabig
0
160
LLM Çağında Backend Olmak: 10 Milyon Prompt'u Milisaniyede Sorgulamak
selcukusta
0
130
新卒エンジニアのプルリクエスト with AI駆動
fukunaga2025
0
230
ローターアクトEクラブ アメリカンナイト:川端 柚菜 氏(Japan O.K. ローターアクトEクラブ 会長):2720 Japan O.K. ロータリーEクラブ2025年12月1日卓話
2720japanoke
0
740
Microservices rules: What good looks like
cer
PRO
0
1.5k
FluorTracer / RayTracingCamp11
kugimasa
0
240
Featured
See All Featured
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
240
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.3k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
110
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.6k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Getting science done with accelerated Python computing platforms
jacobtomlinson
0
72
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.7k
KATA
mclloyd
PRO
33
15k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
21
Six Lessons from altMBA
skipperchong
29
4.1k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
0
67
Transcript
積ん読を消化するために @Doarakko
・2019年12月入社(2社目) ・エンジニア歴1.5年 - 仕事: Go, PHP - 趣味: Python, C++
・AtCoder 緑 ・海外サッカーをよく見ます 自己紹介 2
今日は「デジタル積ん読」の話 3
Pocket(後で読むアプリ)使ってます 4 いろいろ機能があるらしい ・他の人が多く保存している記事 ・記事のハイライト ・記事へのタグ付け(手動) 私は「保存」と「検索」しか使ってなかった
私の Pocket の使い方(ブラウザ) 5 スマホだと保存までに複数回アクションがあってつらい
なぜ積ん読を解消する必要があるのか 6 情報の鮮度が落ちる ・波に乗り遅れる ・「もっと早くこの情報を知っていれば」 積ん読しておくのが気持ち悪い?
解決策 案1. その場で読む → それができたら苦労しない 案2. 一定期間たったものは自動で捨てる → もったいない 案3.
毎日時間を確保して習慣化する → できるわけがない 案4. 後で読む基準を厳しくする → さらっと概要を掴んで全部読むか判断する 7
「さらっと概要を掴んで」 8
文章要約 9
文章要約の活用事例 10 https://www.asahi.com/corporate/info/13124567 https://about.yahoo.co.jp/info/blog/20190424/chi ebukuro.html
文章要約:要約対象 11 単一ドキュメント 複数ドキュメント
文章要約:要約手法 12 抽出型 ・元の文章の中から重要だと判断したものを、 そのまま抽出する ・メリット:元文章をそのまま使うので文法はおかしくならない ・デメリット:文章中にない単語は生まれない、文のつながりはおかしい 抽象型 ・元の文章から内容を理解して、人が作ったような 要約文を生成する
・メリット:元文章にない単語も生まれる、文章のつながりが自然 ・デメリット:文法に違和感がなく、自然な文章を生成する難易度高い
今回試したもの LexRank ・抽出型の手法で、ページランクの仕組みを応用したもの BERTSUM ・BERT の学習済みモデルを文章要約用に拡張した抽出型のモデル ・よくわからないので詳しく知りたい方は論文を読んでください → よくわからなくても動かせるくらい身近なものになっている 13
ページランク:他からリンクされているものほど良いページとする(超ざっくり)
試した記事 14 【転職エントリ】Googleに入社します 約 6,500 文字 15 分(by Pocket) https://note.com/neko_chan0214/n/n3a64bc1e1412
LexRank 15 要約文 電話面接やオンサイト面接を受けることになること、競技プログラミングのような問題が出題されること などを知りました。(58行目) このタイミングで、とある元Googleのソフトウェアエンジニアの方から声をかけていただき、模擬面接を していただけることになりました。 (78行目) 面接で聞かれた内容は秘密にする約束なので、自分が勉強した内容を記事に書くのは、面接を受ける 前に書いておいた方がいいだろうと考えました。
(136行目)
BERTSUM 16 要約文 2018年の年末年始に時間があったので、有料版を契約してきちんと Pythonの勉強をしてみようと思い ました・DataCampの分量は非常に多くて、年末年始だけでは当然終わらせることはできず、 3ヶ月以 上かかってDataScientistコースを修了しました(4行目) エンジニア採用のカジュアル面談を受け入れている医療 ×ITの企業を見つけて、いくつかネットで申し
込んでみたりもしました(31行目) この時点でとても幸運だったのは、日本語で書かれた入社体験談が同時期にたくさん投稿されていた ことです(57行目)
感想 17 ・微妙 ・全文読んだがもっと抽出してほしい文章があった ・日本語はハンデ(自然言語処理をやる上で) ・要約する文章のドメインのデータ集めないと ・これからも積み続ける
積ん読を消化するために @Doarakko