Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenTalks.AI - Алексей Бурнаков, Тематическое м...
Search
OpenTalks.AI
February 21, 2020
Science
0
2.1k
OpenTalks.AI - Алексей Бурнаков, Тематическое моделирование новостей на основе детекции цитирований
OpenTalks.AI
February 21, 2020
Tweet
Share
More Decks by OpenTalks.AI
See All by OpenTalks.AI
OpenTalks.AI - Виктор Лемпицкий, Моделирование 3Д сцен: новые подходы в 2020 году
opentalks
0
480
OpenTalks.AI - Алексей Чернявский, Нейросетевые алгоритмы для повышения качества медицинских изображений
opentalks
0
430
OpenTalks.AI - Александр Громов, Устойчивость нейросетевых моделей при анализе КТ/НДКТ-исследований
opentalks
0
370
OpenTalks.AI - Денис Тимонин, Megatron-LM: Обучение мультимиллиардных LMs при помощи техники Model Parallelism
opentalks
0
500
OpenTalks.AI - Егор Филимонов, Возможности платформы Huawei Atlas и эффективный гетерогенный инференс.
opentalks
0
140
OpenTalks.AI - Александр Прозоров, Референсная архитектура робота сервисного центра в отраслях с изменчивыми бизнес-процессами
opentalks
0
370
OpenTalks.AI - Наталья Лукашевич, Анализ тональности по отношению к компании — с чем не справился BERT
opentalks
0
330
OpenTalks.AI - Константин Воронцов, Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования
opentalks
0
430
OpenTalks.AI - Дмитрий Ветров, Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики
opentalks
0
470
Other Decks in Science
See All in Science
学術講演会中央大学学員会府中支部
tagtag
0
300
Agent開発フレームワークのOverviewとW&B Weaveとのインテグレーション
siyoo
0
330
Lean4による汎化誤差評価の形式化
milano0017
1
300
MCMCのR-hatは分散分析である
moricup
0
440
動的トリートメント・レジームを推定するDynTxRegimeパッケージ
saltcooky12
0
190
データベース02: データベースの概念
trycycle
PRO
2
900
生成検索エンジン最適化に関する研究の紹介
ynakano
2
1.3k
01_篠原弘道_SIPガバニングボード座長_ポスコロSIPへの期待.pdf
sip3ristex
0
660
モンテカルロDCF法による事業価値の算出(モンテカルロ法とベイズモデリング) / Business Valuation Using Monte Carlo DCF Method (Monte Carlo Simulation and Bayesian Modeling)
ikuma_w
0
250
CV_3_Keypoints
hachama
0
200
科学で迫る勝敗の法則(電気学会・SICE若手セミナー講演 2024年12月) / The principle of victory discovered by science (Lecture for young academists in IEEJ-SICE))
konakalab
0
130
05_山中真也_室蘭工業大学大学院工学研究科教授_だてプロの挑戦.pdf
sip3ristex
0
630
Featured
See All Featured
How GitHub (no longer) Works
holman
315
140k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Bash Introduction
62gerente
615
210k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Building Adaptive Systems
keathley
43
2.7k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Site-Speed That Sticks
csswizardry
10
820
Producing Creativity
orderedlist
PRO
347
40k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
113
20k
How to train your dragon (web standard)
notwaldorf
96
6.2k
Transcript
NEWS TOPIC MODELLING BASED ON CITATION DETECTION Alexey Burnakov, TASS
ITAR-TASS www.tass.ru 115th birthday It's been a while…
News Media Market: A Complex Graph
Citation Detection
News Specific Citation Detection Personal data Headline Editorial Cite number
Cite index Citing media Date News rating Editor rating Board rating Organization rating
Methods I Cosine similarity Bag of words / tf-idf Generalized
linear models
Methods II PageRank Random-Walk Graph Partitioning
Citation Detection: results precision = 0.89 recall = 0.87 Logistic
regression output F1 score = 0.88 MCC score = 0.88 AUC: 0.998 We did good at a train dataset
PageRank: results. TOP-25 of the Russian Mass Media
NLP Pipeline Raw text Tokenization Who cites TASS Which news
was cited Topic modelling Customer facing
Topic Modelling I Motivation: Are there big topics today? Notre-Dame
de Paris’s on fire : (
Topic Modelling II Airbus emergency landing Motivation: Are there big
topics today?
Topic Modelling III Flood in the Irkutsk Region :( `Losharik`
Submarine deadly accident :( Motivation: Are there big topics today?
Topic Report Ex-Kyrgyz president Atambaev seizure by special forces
Competition Snapshot Which agency did a good job?
Daily Competition Snapshot Who is the hero of the day?
Personal data Personal data Personal data Personal data Personal data
Daily Competition Snapshot https://www.gazeta.ru/politics/2019/08/08_a_12564199.shtml
THANK YOU!