Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenTalks.AI - Алексей Бурнаков, Тематическое м...
Search
OpenTalks.AI
February 21, 2020
Science
0
2.1k
OpenTalks.AI - Алексей Бурнаков, Тематическое моделирование новостей на основе детекции цитирований
OpenTalks.AI
February 21, 2020
Tweet
Share
More Decks by OpenTalks.AI
See All by OpenTalks.AI
OpenTalks.AI - Виктор Лемпицкий, Моделирование 3Д сцен: новые подходы в 2020 году
opentalks
0
480
OpenTalks.AI - Алексей Чернявский, Нейросетевые алгоритмы для повышения качества медицинских изображений
opentalks
0
420
OpenTalks.AI - Александр Громов, Устойчивость нейросетевых моделей при анализе КТ/НДКТ-исследований
opentalks
0
370
OpenTalks.AI - Денис Тимонин, Megatron-LM: Обучение мультимиллиардных LMs при помощи техники Model Parallelism
opentalks
0
500
OpenTalks.AI - Егор Филимонов, Возможности платформы Huawei Atlas и эффективный гетерогенный инференс.
opentalks
0
140
OpenTalks.AI - Александр Прозоров, Референсная архитектура робота сервисного центра в отраслях с изменчивыми бизнес-процессами
opentalks
0
370
OpenTalks.AI - Наталья Лукашевич, Анализ тональности по отношению к компании — с чем не справился BERT
opentalks
0
330
OpenTalks.AI - Константин Воронцов, Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования
opentalks
0
430
OpenTalks.AI - Дмитрий Ветров, Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики
opentalks
0
460
Other Decks in Science
See All in Science
Cross-Media Information Spaces and Architectures (CISA)
signer
PRO
3
31k
[第62回 CV勉強会@関東] Long-CLIP: Unlocking the Long-Text Capability of CLIP / kantoCV 62th ECCV 2024
lychee1223
1
960
データベース08: 実体関連モデルとは?
trycycle
PRO
0
740
機械学習 - pandas入門
trycycle
PRO
0
280
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
170
データベース02: データベースの概念
trycycle
PRO
2
770
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
820
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
220
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
120
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
120
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
720
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
700
Featured
See All Featured
Docker and Python
trallard
45
3.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Why Our Code Smells
bkeepers
PRO
336
57k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
KATA
mclloyd
30
14k
Art, The Web, and Tiny UX
lynnandtonic
299
21k
Designing for Performance
lara
610
69k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Bash Introduction
62gerente
613
210k
A Modern Web Designer's Workflow
chriscoyier
695
190k
The World Runs on Bad Software
bkeepers
PRO
69
11k
Transcript
NEWS TOPIC MODELLING BASED ON CITATION DETECTION Alexey Burnakov, TASS
ITAR-TASS www.tass.ru 115th birthday It's been a while…
News Media Market: A Complex Graph
Citation Detection
News Specific Citation Detection Personal data Headline Editorial Cite number
Cite index Citing media Date News rating Editor rating Board rating Organization rating
Methods I Cosine similarity Bag of words / tf-idf Generalized
linear models
Methods II PageRank Random-Walk Graph Partitioning
Citation Detection: results precision = 0.89 recall = 0.87 Logistic
regression output F1 score = 0.88 MCC score = 0.88 AUC: 0.998 We did good at a train dataset
PageRank: results. TOP-25 of the Russian Mass Media
NLP Pipeline Raw text Tokenization Who cites TASS Which news
was cited Topic modelling Customer facing
Topic Modelling I Motivation: Are there big topics today? Notre-Dame
de Paris’s on fire : (
Topic Modelling II Airbus emergency landing Motivation: Are there big
topics today?
Topic Modelling III Flood in the Irkutsk Region :( `Losharik`
Submarine deadly accident :( Motivation: Are there big topics today?
Topic Report Ex-Kyrgyz president Atambaev seizure by special forces
Competition Snapshot Which agency did a good job?
Daily Competition Snapshot Who is the hero of the day?
Personal data Personal data Personal data Personal data Personal data
Daily Competition Snapshot https://www.gazeta.ru/politics/2019/08/08_a_12564199.shtml
THANK YOU!