Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
COVID19の症状を視覚化
Search
akinorisaito
May 22, 2020
Science
1
140
COVID19の症状を視覚化
akinorisaito
May 22, 2020
Tweet
Share
More Decks by akinorisaito
See All by akinorisaito
中学数学で新型コロナ罹患者数を予測(2020/05/22更新)
akinorisaito
0
96
中学数学で新型コロナ罹患者数を予測
akinorisaito
1
160
製薬会社における安全性監視活動の負担最小化の検討
akinorisaito
0
140
Other Decks in Science
See All in Science
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
350
点群ライブラリPDALをGoogleColabにて実行する方法の紹介
kentaitakura
1
400
生成検索エンジン最適化に関する研究の紹介
ynakano
2
1.3k
データベース02: データベースの概念
trycycle
PRO
2
900
ランサムウェア対策にも考慮したVMware、Hyper-V、Azure、AWS間のリアルタイムレプリケーション「Zerto」を徹底解説
climbteam
0
110
学術講演会中央大学学員会府中支部
tagtag
0
300
機械学習 - 授業概要
trycycle
PRO
0
240
LayerXにおける業務の完全自動運転化に向けたAI技術活用事例 / layerx-ai-jsai2025
shimacos
2
1.5k
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
940
データから見る勝敗の法則 / The principle of victory discovered by science (open lecture in NSSU)
konakalab
1
150
機械学習 - DBSCAN
trycycle
PRO
0
1k
地表面抽出の方法であるSMRFについて紹介
kentaitakura
1
870
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
49
14k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
520
RailsConf 2023
tenderlove
30
1.2k
Speed Design
sergeychernyshev
32
1.1k
Producing Creativity
orderedlist
PRO
347
40k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Why Our Code Smells
bkeepers
PRO
339
57k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
Transcript
None
目的 • COVID19重症者(重症および死亡)と軽症・中等症の症状を視覚 化し、COVID19の症状を理解する • 特に重症以上と中等度以下の症状の違いを明らかにする • 症状を理解することにより、COVID19が疑われる場合は正しく 医療機関受診をできるようにする
データ • SIGNATE COVID-19 Case Dataset(2020/05/22時点) https://drive.google.com/drive/folders/1EcVW5JQKMB6zoyfHm8_zLVj---t_hccF • シート「罹患者」 •
列「ステータス」、「症状・経過」を使用 • 「ステータス」を目的変数とする • 「症状・経過」に自然言語処理を行い、単語行列を作成し説明変数とする • 「ステータス」が「重症」、「死亡」の場合、「1」 • 216件 • 「症状・経過」に「死亡」、「逝去」等、死亡を表す語が含まれていた場合、 「ステータス: 死亡」へ変換 • 「ステータス」が「無症状」、「軽症」、「中等症」の場合、「0」 • 2,385件
使用したツール、アルゴリズム等 プロセス ツール、アルゴリズム等 プログラミング環境 Python3 (Google Coraboratory) R version 3.6.1
形態素解析辞書 MeCab + NEologd Manbyo (医療用語辞書: http://sociocom.jp/~data/2018-manbyo/index.html) Vectrizer Count Vectrizer 特徴量選択 SelectKBest (sklearn.feature_selection) 視覚化 wordcloud2 (R package) DecisionTreeClassifier (sklearn.tree)
ワードクラウド 重症以上の症状
ワードクラウド 中等度以下の症状
Train : Confusion Matrix Train : AUC Train : F1
score [1783 7] [ 145 15] 0.54 0.15 決定木 Test : Confusion Matrix Test : AUC Test : F1 score [595 0] [ 50 6] 0.55 0.19
解釈 • 重症度を問わず発症する症状 • 発熱、咳、倦怠感 • 重症以上で発症する症状 • 肺炎、呼吸関連症状(呼吸困難、呼吸苦)、会話不可