Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発...
Search
Y-h. Taguchi
October 19, 2025
Science
0
32
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発現への影響
第83回バイオ情報学研究会
https://www.ipsj.or.jp/kenkyukai/event/bio83.html
2025年10月23日
Y-h. Taguchi
October 19, 2025
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
中央大学AI・データサイエンスセンター 2025年第6回イブニングセミナー 『知能とはなにか ヒトとAIのあいだ』
tagtag
0
79
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
37
知能とはなにかーヒトとAIのあいだー
tagtag
0
140
タンパク質間相互作⽤を利⽤した⼈⼯知能による新しい薬剤遺伝⼦-疾患相互作⽤の同定
tagtag
0
98
PPIのみを用いたAIによる薬剤–遺伝子–疾患 相互作用の同定
tagtag
0
80
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
110
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
1
150
ゲノム解析における射影: 特徴選択ツールとしてのテンソル分解と主成分分析を合理化する理論的根拠
tagtag
0
48
知能とはなにかーヒトとAIのあいだー
tagtag
0
100
Other Decks in Science
See All in Science
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
200
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
820
高校生就活へのDA導入の提案
shunyanoda
0
6k
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
590
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
300
06_浅井雄一郎_株式会社浅井農園代表取締役社長_紹介資料.pdf
sip3ristex
0
660
KH Coderチュートリアル(スライド版)
koichih
1
48k
2025-06-11-ai_belgium
sofievl
1
170
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
410
Hakonwa-Quaternion
hiranabe
1
140
機械学習 - 授業概要
trycycle
PRO
0
250
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
360
Featured
See All Featured
Side Projects
sachag
455
43k
Designing Experiences People Love
moore
142
24k
Java REST API Framework Comparison - PWX 2021
mraible
34
8.9k
How to Ace a Technical Interview
jacobian
280
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
A Modern Web Designer's Workflow
chriscoyier
697
190k
The Straight Up "How To Draw Better" Workshop
denniskardys
238
140k
It's Worth the Effort
3n
187
28k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
20
1.2k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Keith and Marios Guide to Fast Websites
keithpitt
411
23k
Transcript
主成分分析に基づく教師なし特徴抽出法を 用いたコラーゲン- グリコサミノグリカン メッシュの遺伝子発現への影響 Y.-h. Taguchi, Turki Turki / Polymers
13 (2021) 4117 Y.-h. Taguchi, Turki Turki / Polymers 13 (2021) 4117 本発表スライドは原著論文をChatGPT に読み込ませて「 この論文の内容を20 分の日本語講演スライドにまとめてください。図表を入れるのが難しい場合は 図表をいれられる場所だけを空けてどの図や表をいれるのかの指示をしてくだ さい 」というプロンプトで作成し表を原著論文からコピペして作成しました
2 本講演のゴール(アジェンダ) • 背景:バイオマテリアルと遺伝子発現 • データと課題設定 • 解析法:PCA ベース教師なしFE •
主結果:選択遺伝子と機能的濃縮 • 線形回帰との比較 • 含意・限界・結論
3 背景:足場材× 細胞の相互作用 • バイオマテリアルは接着・生存・増殖・ 転写制御に影響 • Collagen–GAG メッシュは創傷治癒・組織工 学で広く使用
• 標本数が少ない時系列で差異検出は困難
4 課題と着想 • 問:Collagen–GAG 接触で時間とともに遺伝子発現はどう変化? • 課題:小標本・連続変数(時間)に対する頑健な差異検出 • 着想:PCA で時間と相関する潜在成分を抽出→遺伝子選択
5 データセット(GEO: GSE6432 ) • 細胞:IMR90 (ヒト胎児肺由来線維芽細胞) • 条件:treated (Collagen–GAG
接触) vs control (非接触) • 時間:1, 2, 4, 8, 12, 24, 48 h • サンプル数:treated 19 、control 13 、計32 Table 1 (Polymers 13 (2021) 4117 )
6 解析パイプライン概観 • 標準化 → SVD (PCA ) → PC
負荷量と時間の回帰 → 有意PC 決定 • 遺伝子側スコア(u )から有意プローブ選択(ガウス仮定→χ² 、 BH 補正) • 遺伝子ID 変換 → Enrichr で機能的濃縮(GO/KEGG/ARCHS4 など)
7 PCA ベース教師なしFE :要点 • 各条件で独立にPCA を実行 • サンプル側PC 負荷量
vℓ を時間で線形回帰、多重検定補正(BH ) • treated でPC3 が時間と有意(調整p<0.05 )、control で有意PC なし
8 プローブ選択と閾値 • 遺伝子側スコア u3 をガウスと仮定し、χ² でp 値→BH 補正 •
調整p<0.01 で treated 324 プローブ選択(遺伝子変換後 約318 ) • control は選択なし
9 機能的濃縮(GO Biological Process ) • 最上位:regulation of apoptotic process
(抗アポトーシス関連) • 翻訳・ER 標的化・NMD なども有意 • 足場材× 線維芽細胞の生存促進と整合
10 機能的濃縮(GO Cellular Component ) • focal adhesion, cell-substrate junction
が上位 • collagen 含有ECM, ER lumen, リボソーム関連も上位 • 接着・足場応答が関与
11 機能的濃縮(KEGG Pathways ) • Coronavirus disease, Ribosome が強い有意 •
Focal adhesion, PI3K–Akt, Glycolysis/Gluconeogenesis も上位 • ストレス応答・翻訳活性・接着シグナリングの関与
12 外部一貫性チェック(ARCHS4 ) • Cell-lines でIMR90 が首位(本研究の細胞系)
13 • Tissues でFETAL LUNG が上位(IMR90 の由来組織) • 解析の妥当性を支持
15 比較:時刻に対する線形回帰ベースFE • treated で813 プローブ選択、control は選択なし • しかし濃縮の有意性は弱い(調整p が桁違いに大きい)
• PCA-FE は少数プローブでも生物学的に妥当な富化が強い GO Biological Process
16 GO Cellular Component
17 KEGG Pathways
18 ARCHS4
19 ARCHS4
20 なぜPCA-FE が効くのか(直観) • 教師なしに時間に沿った共通成分を抽出 • 小標本でも信号対雑音比を向上 • 連続時間を一括で扱い、多重比較の負担を軽減
21 計算上の工夫と制約 • fsMTS 等の時系列FS :特徴数が多いとメモリO(p²) で実行困難 • マイクロアレイのためRNA-seq 専用ツール(DESeq2/edgeR
) は対象外 • limma/SAM はカテゴリ比較向けで連続時間には不向き
22 バイオロジー的解釈 • 抗アポトーシス関連の富化:足場接触が生存・維持に寄与 • Focal adhesion/PI3K–Akt :接着シグナル→生存・増殖 • 翻訳機構/ER
関連:タンパク質生合成の再編
23 限界と今後 • 教師なしゆえ、外れた場合の改善手段が限定 • RNA-seq および単一細胞データでの再検証が必要 • 足場の物性(剛性・組成)・用量–反応の系統評価
24 実装ガイド(再現手順) • 小規模時系列にPCA-FE を適用(PC× 時間の回帰+BH 補正) • 外部DB (ARCHS4/GO/KEGG
)で一貫性確認 • PC× 時間散布図、ヒートマップ、富化ドットプロットで可視化
25 まとめ(Take-home messages ) • Collagen–GAG 接触で時間依存的遺伝子変動をPCA-FE で検出 • アポトーシス抑制/接着シグナル/翻訳活性が鍵
• 線形回帰より生物学的に妥当な富化が強い • 小標本× 連続時間の解析に有効な実戦的アプローチ
26 付録:図表作成メモ(再現に必要な数値) • treated でPC3 が時間と有意(調整p<0.05 )、control は該当なし • 選択プローブ:treated
324 (遺伝子変換後 約318 )、control 0 • GO BP 最上位:regulation of apoptotic process (例:調整p ≈ 2.5×10-13 ) • GO CC 最上位:focal adhesion (例:調整p ≈ 4.8×10-27 ) • KEGG 上位:Coronavirus disease (≈ 1.2×10-10 )、Ribosome (≈ 6.7×10-10 )、Focal adhesion (≈ 1.2×10-4 ) • 比較:線形回帰はtreated 813 プローブ選択も富化の有意性は弱 い(例:GO BP トップの調整p ≈ 4.6×10-2 )