Python と R それぞれの強み
Python の強み
・ AI システムや Web アプリケーション、IoT 機器・クラウド等
と相性が良い
・機械学習・深層学習モデルが構築しやすい
R の強み
・ 統計学の理論に基づいた結果を算出しやすい(例:信頼区
間、p 値など)
・可視化されるグラフがシンプルで美しい(個人的に)
Slide 5
Slide 5 text
・バイオインフォマティクスに特化した専門的
なライブラリが豊富
・ggplot2による作画がきれい
・統計解析に強み
・dplyrによるデータフレーム操作が簡便
個人的に感じるRの良いところ
James Ding et al., 2020 Characterisation of CD4+ T-cell subtypes using single cell RNA
sequencing and the impact of cell number and sequencing depth
せっかくなのでセットアップしたR環境で解析してみる
single-cell RNA sequencing:個々の細胞内の遺伝子発現パターンを研究するために使用される方法です。これにより、細胞集団内の個々の細
胞での遺伝子発現を分析することができます。今回は、COVID-19患者の末梢血細胞群のサンプルを使ったscRNA-seqデータを使って各免疫細胞
をラベリングしてみようと思います。
解析に必要なファイル
snowflakeの外部ステージにアップ
ロードして、 SPCS上のRstudioで解
析してみます
Stephanie Hicks「Welcome to the World of Single-Cell RNA-Sequencing」
Slide 17
Slide 17 text
データのアップロード
データは250MB以下ならsnowsight上から内部ステージにアップロードできます(それ以上はsnowSQLのPUT経由でいれ
る)。予めspecで設定したステージにファイルをアップロードすると、Rstudioのターミナルでボリュームに設定したパスの位
置にファイルが確認できます。
snowsql -a [アカウント名] -u [ユーザー名]
PUT file://[ローカルのファイルパス] @[ステージへのパス];