関数データ解析への招待

Slide 1

Slide 1 text

関数データ解析への招待滋賀大学データサイエンス学部松井秀俊 E-mail: [email protected] 第１３回ザッピングセミナー 2023.04.24

Slide 2

Slide 2 text

自己紹介 • 松井秀俊（まついひでとし） • 経歴： – 2009.03 九州大学大学院数理学府博士後期課程修了博士(機能数理学) – 2009.04 株式会社ニコンシステム数理解析研究室 – 2012.03 九州大学大学院数理学研究院助教 – 2016.04 滋賀大学データサイエンス教育研究センター准教授 – 2016.10 科学技術振興機構さきがけ研究員 (兼任, ~2020.03) 「情報協働栽培」領域 – 2017.04 滋賀大学データサイエンス学部准教授 • 専門分野：統計的モデリング・関数データ解析・スパース推定 2 スパース推定法による統計モデリング（共立出版）多変量解析（学術図書出版） 2023.03出版統計モデルと推測（講談社サイエンティフィク）執筆に携わった書籍（一部）

Slide 3

Slide 3 text

目次 • 関数データ解析の概要 – どういう形式のデータに対してどういうことができるか・文献紹介 • 関数データ解析の事例紹介 – さまざまな分野のデータに対する分析事例紹介 • 関数回帰モデルの推定 – 具体的な実装方法を，関数回帰モデルを例に紹介（数式多め） • 関数データ解析手法ザッピング – マニアックな発展的な手法とその応用例を紹介 3

Slide 4

Slide 4 text

4 • 観測個体（左の例では都市）それぞれが時間等の経過に伴い繰り返し計測された形式のデータを，経時測定データという • 気温のようなデータは，本来は観測時点だけではなく，連続的に存在しているはず • そこで，各個体を時間の関数として表し観測データ（ベクトルデータ）の代わりに関数をデータとして扱おう Observed data 例：3都市の1年間における月別平均気温関数データ解析 (Functional Data Analysis; FDA) ※ Food and Drug Administration ではない Functional data 那覇東京札幌

Slide 5

Slide 5 text

5 • 各個体を関数化処理することで得られる関数を関数データといい，関数データ集合を対象とした分析手法・理論を総称して関数データ解析という • 分かりやすさのために「時間の」関数データという想定で説明することが多いが，前後関係を持つものであれば何の関数でも適用可能 ✓ 深さ・位置・波長 etc. ✓ 位置（緯度経度）の場合は曲面データになる Observed data 例：3都市の1年間における月別平均気温 Functional data 那覇東京札幌関数データ解析 (Functional Data Analysis; FDA) ※ Food and Drug Administration ではない

Slide 6

Slide 6 text

Ramsay & Silverman (1997, 2005) 提唱者らによる書籍実践的な方法論を多く掲載参考書など • 和書では次の書籍の一部に記載 – 辻谷將明，竹澤邦夫 (2015). マシンラーニング第2版 (Rで学ぶデータサイエンス)，共立出版. – 福水健次 (2010). カーネル法入門ー正定値カーネルによるデータ解析，朝倉書店. – 鈴木譲 (2021). 機械学習のためのカーネル100問，共立出版. • 関数データ解析の和文サーベイ論文 – 松井(2019) ．関数データに基づく統計的モデリング，統計数理 67 (1) 73-96. 6 Kokoszka & Reimherr (2017) 関数データ解析の基本的な方法を掲載 Rのコードあり Hsing & Eubank (2015) 関数データ解析に関する理論的性質を詳しく紹介 Ramsay, Hooker & Graves (2009) RやMatlabコード掲載手を動かしながら勉強できる Horvath & Kokoszka (2013) 関数データの検定や時系列・空間データ等の分析法を掲載

Slide 7

Slide 7 text

ライブラリ • fda：データの関数化や関数回帰分析，関数主成分分析を実装 • refund：多様な種類の関数回帰モデルを実装（解説ページ） • fdANOVA：関数データに対する仮説検定を実装（解説ページ）・・・ほか多数 • CRAN Task View：関数データ解析関連のRパッケージ一覧 • scikit-fda：関数データ解析に関する手法を網羅的に実装 • FDApy：python内で処理する関数データのクラスを実装 7

Slide 8

Slide 8 text

経時測定データの例1 子供の身長の推移 • 数人の子供の身長を 1歳から18歳まで毎年計測したデータ • 2～8歳までは年1回，それ以外は年2回計測 ⇒計測時間が不均一 • 計測時間の情報を取り入れた解析をするには？ 8 年齢子供 “growth” by R package “fda”

Slide 9

Slide 9 text

経時測定データの例1 子供の身長の推移 • 数人の子供の身長を 1歳から18歳まで毎年計測したデータ • 2～8歳までは年1回，それ以外は年2回計測 ⇒計測時間が不均一 • 計測時間の情報を取り入れた解析をするには？ 9 年齢子供 “growth” by R package “fda”

Slide 10

Slide 10 text

経時測定データの例2 病状の経時変化 • ある細胞が破壊される病気の患者数名に対して数回に渡り通院してもらい細胞の血中濃度を測定 • 患者ごとに通院時点や通院回数が異なるため古典的な多変量解析を直接適用することは困難 • 喫煙や性別などの情報と細胞濃度との関係をどうモデル化する？ 10 患者時点喫煙性別濃度 1 0 無 0 45 1 1 無 0 37 : : : : : 1 10 無 0 20 2 0 有 1 38 : : : : : 2 9 有 1 12 : : : : : n 13 無 0 12 “cd4” by R package “timereg”

Slide 11

Slide 11 text

経時測定データの例2 病状の経時変化 • ある細胞が破壊される病気の患者数名に対して数回に渡り通院してもらい細胞の血中濃度を測定 • 患者ごとに通院時点や通院回数が異なるため古典的な多変量解析を直接適用することは困難 • 喫煙や性別などの情報と細胞濃度との関係をどうモデル化する？ 11 患者時点喫煙性別濃度 1 0 無 0 45 1 1 無 0 37 : : : : : 1 10 無 0 20 2 0 有 1 38 : : : : : 2 9 有 1 12 : : : : : n 13 無 0 12 “cd4” by R package “timereg”

Slide 12

Slide 12 text

経時測定データの例３骨密度の推移データ • 48名の女性に対して脊柱の骨密度を経時的に測定したデータ • 1人1人の計測時点数が2～4時点と非常に少ないため，個々のデータを独立して関数化することは困難 • このような「まばら」なデータはスパース経時測定データとよばれる • 全員分のデータを時系列的に並べれば全観測時点内でのトレンドは見える • 平均曲線をどのように推定する？ 12 James et al. (2000, Biometrika)

Slide 13

Slide 13 text

Observed data 13 Observed data • データを関数として扱うことで次のような特徴がある ✓ 経時データの観測誤差を除去して解析できる ✓ 観測時点数が多い場合データの次元を削減できる ✓ 観測時点，観測時点数が個体ごとに異なっていても容易に分析できる ✓ データの微分の情報を用いる事ができる Functional data 関数データ解析の特徴

Slide 14

Slide 14 text

関数データ解析でできることとできないこと • 関数データ解析は，サンプルサイズ 𝑛 の「関数」標本に対する分析新しい (𝑛 + 1番目の)「関数」に対する予測などを行うことができる – １個体それぞれの「先の時点の予測」が目的ではない（一般的には，1本の曲線の中での時系列解析のような予測が目的ではない） • 「経時測定データ → 関数データ解析が有効」とは限らない – 個体間で計測時点や計測時点数が密で均一であれば，通常の多変量データ解析手法で（高次元の問題はあるが）十分 – 均一でない状況やスパース経時測定データに対して関数データ解析は特に有効 14

Slide 15

Slide 15 text

目次 • 関数データ解析の概要 • 関数データ解析の事例紹介 • 関数回帰モデルの推定 • 関数データ解析手法ザッピング 15

Slide 16

Slide 16 text

関数データ解析手法 • 関数データ解析では，古典的な統計手法を関数データの枠組みへ拡張したものが多く研究されている • 関数の特性を利用した，関数データならではの分析手法もある 16 ✓ 主成分分析 ✓ 回帰分析 ✓ 仮説検定 ✓ クラスター分析 ✓ 判別分析 ✓ 空間データ解析 ✓ 時系列解析 ✓ 曲線アライメント ✓ 主微分分析 ✓ 微分方程式モデル補足：主微分分析（Principal Differential Analysis; PDA）(Ramsay, 1996, JRSS-B) 主成分分析でいう主成分の代わりに微分を用いて，データの特徴を表現する方法

Slide 17

Slide 17 text

day 応用事例 1/7：関数回帰分析イネの収量データ • さまざまな地域の水田における単位面積あたりイネの収穫量 (𝑌)と，イネの生育期間中における気温 (𝑋(𝑡)) との関係をモデル化 • 気温を関数データとして扱い回帰モデル構築 • 関数回帰モデルの係数関数から，田植えから収穫までの気温の収量への寄与を定量化 17 説明変数：気温の関数データ目的変数：イネの収穫量気温の係数関数推定値（破線は95%各点信頼区間）（田植え）（収穫） day

Slide 18

Slide 18 text

応用事例 2/7：関数判別分析多発性硬化症患者(MS)の遺伝子発現データ • 治療を行った患者に対して術後に経時的に遺伝子発現量を測定 • 治療の結果予後が良好だったグループは予後不良だったグループと比べて遺伝子の働きに違いがあるのでは？ • 遺伝子発現量の経時変化を特徴量として予後良好/不良の2群を判別するモデルを利用 18 0 5 10 15 20 3.2 3.6 4.0 4.4 time IRF8 0 5 10 15 20 3.2 3.6 4.0 4.4 time IRF8 p= 0.0059 経時遺伝子発現データ（データ出典：Baranzini et al., 2004）予後良好グループ予後不良グループ Kayano, Matsui et al. (2016, Biostatistics) 関数ロジスティック回帰モデルによる回帰係数の推定値

Slide 19

Slide 19 text

応用事例 3/7：関数主成分分析子どもの身長データ • 子どもの身長の推移の特徴を捉えるために，関数データ版の主成分分析を適用 • 主成分重みが関数として与えられ各主成分の特徴を表す – 第１：全期間での身長の高さ – 第２：成長期の身長の伸び方 • 主成分得点を計算することで曲線の特徴を低次元のベクトルに変換できる 19 ――：第１関数主成分 - - - -：第２関数主成分子どもの身長のデータと関数主成分分析による重み関数主成分得点plot （横：第１，縦：第２） Ramsay & Silverman (2005)

Slide 20

Slide 20 text

応用事例 4/7：関数クラスター分析小麦粉の混錬データ • 115種類の小麦粉を480秒間捏ね上げ，2秒間に1回生地の抵抗を測定 • これらの小麦粉からそれぞれ作られるクッキーの品質は，抵抗の経時変化に依存 • 抵抗の経時変化のデータを関数データ化し関数データに対してクラスタリングを行うことで，クッキーの品質を分類 • 端的に言うと「曲線の仲間分け」 20 Jacques & Preda (2014, Adv. Data Anal. Classifi.)

Slide 21

Slide 21 text

応用事例 5/7：関数時系列解析年齢別死亡率のデータ • 右図のデータは、1950年から2010年の1年ごとの年齢別死亡率（の対数）の推移を示したもの (R package “demography”) • 年代が進むにつれて、全年齢層で死亡率は減少傾向にある • これらのデータを用いて、未来の年における「死亡率の年齢別推移」を予測したい（「100歳より先」の予測ではない） 21 Hyndman & Ullah (2007, Comput.Statist. Data Anal.)

Slide 22

Slide 22 text

応用事例 6/7：関数空間データ分析様々な地点の年間平均気温データ • 左の図は、カナダの複数都市（右の点）で観測された、日別平均気温の推移を表したもの • このデータから、観測されていない都市・地点における気温の推移を予測する 22 Kokoszka & Reimherr (2017) ？ “CanadianWeather” by R package “fda”

Slide 23

Slide 23 text

応用事例 7/7：曲線アライメント Pinch force データ • 複数の被験者に対して物を「つまむ」実験により得られた，つまむ力の経時変化を表したもの • つまむ力のピーク位置は人それぞれ • つまむ力のピーク位置（基準点）を横軸で揃えるために，各関数データを平均関数に近くなるようずらす • 曲線アライメントを適用することで，各被験者が他と比べてどのような力の入れ方をしているかが分かりやすくなる • 揃える基準点が複数ある場合に対処した方法も • 前述の手法に比べると「前処理」的位置づけ 23 “pinch” by R package “fda” アライメント前アライメント後 Ramsay & Silverman (2005)

Slide 24

Slide 24 text

応用事例 (追記)：関数回帰分析肉標本の近赤外スペクトルデータ • 近赤外線吸収率の波長毎の変動は肉標本の成分含有量に依存 • 波長毎の吸収率を波長の関数データとみなし成分含有量との関連を見る • 非破壊検査により肉標本の成分含有量を予測できる 24 水分脂質蛋白質肉標本が吸収する近赤外線の 100チャンネル毎の吸収率成分含有量データ出典：Borggaard & Thodberg, 1992 R package “caret”から取得可能 https://www.tomra.com/en/sorting/food/food-technology Matsui et al. (2008, J. Data Sci.)

Slide 25

Slide 25 text

目次 • 関数データ解析の概要 • 関数データ解析の事例紹介 • 関数回帰モデルの推定 • 関数データ解析手法ザッピング 25

Slide 26

Slide 26 text

スカラー-関数型線形モデル • 説明変数が関数データ、目的変数がスカラーで与えられたモデル • 𝑖番目の観測における説明変数のデータを𝑥𝑖 𝑡 ，目的変数のデータを𝑦𝑖 とおくと関数線形モデルは次で与えられる 𝑦𝑖 = 𝛽0 + න 𝑇 𝑥𝑖 𝑡 𝛽1 𝑡 𝑑𝑡 + 𝜀𝑖 𝛽0 ：切片, 𝛽1 𝑡 ：回帰係数関数, 𝜀𝑖 ~𝑁 0, 𝜎2 ：誤差 • 説明変数𝑥𝑖 𝑡 が𝑡の関数として与えられているためその係数𝛽1 𝑡 も関数で与えられる • 回帰係数関数𝛽1 𝑡 は，任意の点𝑡における 𝑥𝑖 𝑡 の𝑦𝑖 への「影響度」の変動を表している 26 Ramsay & Silverman (2005)

Slide 27

Slide 27 text

基底関数展開（１） • 説明変数のデータ𝑥𝑖 𝑡 は，基底関数展開によって表されると仮定 𝑥𝑖 𝑡 = 𝒘𝑖 𝑇𝝓 𝑡 𝒘𝑖 = 𝑤𝑖1 , … , 𝑤𝑖𝑚 𝑇, 𝝓 𝑡 = 𝜙1 𝑡 , … , 𝜙𝑚 𝑡 𝑇 • この展開は，データの関数化によって得られるものしたがって，ここでは係数𝒘𝑖 は既知とする • 基底関数𝝓 𝑡 は各𝑖で共通である必要がある • 関数主成分分析によって得られる主成分得点と固有関数によって構成することもできる（Karhunen-Loéve展開） 27

Slide 28

Slide 28 text

基底関数展開（２） • 係数関数𝛽 𝑡 も𝑥𝑖 𝑡 と同様，基底関数展開によって表されると仮定 𝛽 𝑡 = 𝜸𝑇𝝓 𝑡 𝜸 = 𝛾1 , … , 𝛾𝑚 𝑇, 𝝓 𝑡 = 𝜙1 𝑡 , … , 𝜙𝑚 𝑡 𝑇 • 係数関数𝛽 𝑡 を基底関数展開した係数𝜸は未知とする • 基底関数𝜙𝑘 𝑡 の種類や数は𝑥𝑖 𝑡 のものと異なっていてもよい 28

Slide 29

Slide 29 text

関数線形モデルの変形 • 基底関数展開の仮定より，関数線形モデルは次のように変形できる 𝑦𝑖 = 𝛽0 + න 𝑇 𝑥𝑖 𝑡 𝛽1 𝑡 𝑑𝑡 + 𝜀𝑖 = 𝛽0 + 𝒘𝑖 𝑇 න 𝑇 𝝓 𝑡 𝝓 𝑡 𝑇 𝑑𝑡 ⋅ 𝜸 + 𝜀𝑖 = 𝛽0 + 𝒘𝑖 𝑇Φ𝜸 + 𝜀𝑖 = 𝛽0 + 𝒛𝑖 𝑇𝜸 + 𝜀𝑖 Φ = න 𝑇 𝝓 𝑡 𝝓 𝑡 𝑇 𝑑𝑡, 𝒛𝑖 = Φ𝒘𝑖 • これにより，一般的な回帰モデルに対する推定手法を適用できる 29

Slide 30

Slide 30 text

補足 • 基底関数 𝝓 𝑡 は各𝑖で異なってもよい？ – 答え：OK．ただしΦ𝑖 = ׬ 𝑇 𝝓𝑖 𝑡 𝝍 𝑡 𝑇 𝑑𝑡の計算が面倒になる – 𝝓 𝑡 = 𝝓𝑖 𝑡 = 𝝍 𝑡 かつ𝝓 𝑡 が正規直交基底ならΦは単位行列になり計算が容易になる • 𝑥𝑖 𝑡 = 𝒘𝑖 𝑇𝝓𝑖 𝑡 , 𝛽 𝑡 = 𝜸𝑇𝝍 𝑡 とすると 𝑦𝑖 = 𝛽0 + 𝒘𝑖 𝑇 න 𝑇 𝝓𝑖 𝑡 𝝍 𝑡 𝑇 𝑑𝑡 ⋅ 𝜸 + 𝜀𝑖 = 𝛽0 + 𝒘𝑖 𝑇Φ𝑖 𝜸 + 𝜀𝑖 = 𝛽0 + 𝒛𝑖 𝑇𝜸 + 𝜀𝑖 30

Slide 31

Slide 31 text

関数回帰モデルの展開 • 関数回帰モデルには説明変数・目的変数のいずれか，または両方が関数データとして与えられたものが提案されている • 回帰係数も関数として与えられ，影響度の経時的な変化を定量化できる • 目的変数がスカラーの場合は，スカラーデータに対する回帰モデルをそのまま拡張したものが多く提案 31 目的変数説明変数スカラー関数スカラー 𝑌 = 𝑋𝛽 + 𝜀 𝑌 = ׬ 𝑋 𝑡 𝛽 𝑡 𝑑𝑡 + 𝜀 関数 𝑌 𝑡 = 𝑋𝛽 𝑡 + 𝜀 t 𝑌 𝑡 = 𝑋 𝑡 𝛽 𝑡 + 𝜀 𝑡 𝑌 𝑡 = ׬ 𝑋 𝑠 𝛽 𝑠, 𝑡 𝑑𝑠 + 𝜀 𝑡

Slide 32

Slide 32 text

目次 • 関数データ解析の概要 • 関数データ解析の事例紹介 • 関数回帰モデルの推定 • 関数データ解析手法ザッピング 32

Slide 33

Slide 33 text

（1/4）関数線形モデルにおけるドメイン選択 • 関数線形モデル 𝑦𝑖 = න 𝑥𝑖 𝑠 𝛽1 𝑠 𝑑𝑠 + 𝜀𝑖 において，係数関数𝛽1 𝑠 が定義域の一部区間で 0と推定されれば，その時点においては説明変数は目的変数と関連していないと解釈できる（右図上:黒実線）このような推定はドメイン選択とよばれている（James et al., 2009, AoS; Zhou et al., 2013, Stat. Sinica; Lin et al., 2017, JCGS） • 「特定の時点以降は目的変数と関連していない」ように回帰係数を推定したモデル（右図下:黒実線）は切断関数線形モデルとよばれる（Hall & Hooker, 2016, JRSS-B; Guan et al., 2020, JCGS） (James et al., 2009) (Guan et al., 2020) 33

Slide 34

Slide 34 text

（1/4）実データの例ディーゼル車の粒子状物質排出データ (Clark et al., 2007) • ディーゼル車に対してエンジンの加速度と粒子状物質の排出量を経時的に（毎秒）計測 • 一定期間の加速度とその後に排出される粒子状物質排出量との関係を知りたい（各時点での加速度がどう排出量に関連しているか） ⇒ 加速度：𝑋 𝑡 ，排出量：𝑌として関数回帰モデルの係数関数𝛽 𝑡 を推定 • 「粒子状物質排出量は，何秒前までの加速度が関連しているか？」 ⇒ 係数関数𝛽 𝑡 の推定値が，𝑡 > ∃𝛿 に対して መ 𝛽 𝑡 = 0となるよう制約を課す 34 （現在）（60秒前）（現在の加速度）（←現在の排出量）

Slide 35

Slide 35 text

（2/4）変化係数関数回帰モデル • 関数データの説明変数 𝑥𝑖 𝑠 とスカラー目的変数 𝑦𝑖 との関係が外生変数 𝑡𝑖 に依存して変化 • 外生変数 𝑡𝑖 による影響を加味する方法の1つとして変化係数関数線形モデルを用いる (Cardot & Sarda, 2008, Comm. Statist. Theory Methods; Wu et al., 2010, Bernoulli) 𝑦𝑖 = න 𝑥𝑖 𝑠 𝛽 𝑠, 𝑡𝑖 𝑑𝑠 + 𝜀𝑖 • 回帰係数 𝛽 𝑠, 𝑡 を推定することで，外生変数の値に応じた説明変数の目的変数への関連を任意の時点で定量化できる 35

Slide 36

Slide 36 text

（2/4）実データの例トマトの収穫量データ • 長期栽培され日ごとに収穫されるトマトの収穫量と，栽培環境での気温との関係をモデル化したい • ある日の収穫量は，60～80日前の環境要因に影響を受けており，加えてその影響は季節によって異なると考えられている • ある日の収穫量を目的変数，その日から遡った80日間の気温を説明変数，季節（収穫日）を外生変数として変化係数関数線形モデルを適用 • 任意の季節において，何日前の気温がどのように収穫量に関連しているか定量化 36 𝛽 𝑠, 𝑡 の推定値 𝑋：Environmental factors for 80 days 𝑌：Weekly total crop yield Day Matsui (2020, arXiv) （栽培期間）（収穫日）（80日前）

Slide 37

Slide 37 text

（3/4）曲線アライメント＋クラスタリング • 位相ずれが起こっているデータに対して曲線アライメントとクラスタリングを同時に行う • クラスター数分の関数の「型」(template)を用意し，型に合うようにアライメントと型の更新を繰り返す • 各曲線がどれだけアライメントされたかを表す関数（warping関数）の推定値が得られる • R package “fdacluster”に実装 37 (Sangalli et al., 2010, Comput. Statist. Data Anal.)

Slide 38

Slide 38 text

（4/4）Wasserstein regression • 観測個体1つ1つが「確率分布」を想定（例：各国の年齢別死亡率の分布） • 説明変数と目的変数に対応するデータが共に確率分布として与えられたときこれらの関係を回帰モデルで表現（例：X：1983年の各国の年齢別死亡率の分布 Y：2013年の各国の年齢別死亡率の分布） • XとYの共分散にWasserstein covariance (Peterson & Muller, 2019, Biometrika)を利用することで，関数回帰モデルの枠組みで扱える・・・らしい 38 Chen et al. (2021, JASA) 西暦ごとの年齢別死亡率の分布 (Chen & Muller, 2018, Economics) （サーベイ不足(´・ω・`)） Wasserstein regression による予測

Slide 39

Slide 39 text

まとめ • 関数データ解析は，1つの観測が時間等の経過とともに繰り返して計測されたデータを関数化し，関数化データ集合を対象とした分析手法と理論の総称 • 関数データ解析には，古典的な多変量解析手法を関数データの枠組みへ拡張したものが多く含まれる • 最も基本的なアプローチの一つは，関数データが基底関数展開で表されると仮定し，その回帰係数をベクトルデータのように扱う • 現在もさまざまな発展的な理論・方法論が開発中 39 アカデミア・企業の方問わず，「このデータに適用できるかも？」「こういう研究できるんじゃない？」に繋がれば幸いです（一緒にやってくれる方も募集中！）

Slide 40

Slide 40 text

参考文献：書籍 • Horváth, L. and Kokoszka, P. (2012). Inference for functional data with applications. Springer, New York. • Hsing. T. and Eubank, R. (2015). Theoretical Foundations of Functional Data Analysis, with an Introduction to Linear Operators. Wiley. • Kokoszka, P. and Reimherr, M. (2017). Introduction to Functional Data Analysis. Chapman & Hall, New York. • Ramsay, J. and Silverman, B. (2005). Functional data analysis (2nd ed.). Springer, New York. • Ramsay, J., Hooker, G., and Graves, S. (2009). Functional Data Analysis with R and MATLAB. Springer, New York. 追記（スライドで紹介していなかったもの）： • Bosq, D. (2000). Linear Processes in Function Spaces. Springer, New York. （関数空間上での確率過程について解説） • Ramsay, J. and Hooker, G. (2017). Dynamic Data Analysis: Modeling Data with Differential Equations. Springer, New York. （微分方程式を用いたデータ分析） • Ramsay, J. and Silverman, B. (2002). Applied functional data analysis: methods and case studies. Springer, New York. （関数データ解析の応用例を紹介） • Shi, J. Q. and Choi, T. (2011). Gaussian Process Regression Analysis for Functional Data. Chapman & Hall. （関数データ解析にガウス過程回帰を適用） 40

Slide 41

Slide 41 text

参考文献：論文（1/2） 41 • Cardot, H. and Sarda, P. (2008). Varying-coefficient functional linear regression models. Communications in Statistics. Theory and Methods, 37(20), 3186–3203. • Chen, Y., Lin, Z., and Müller, H.-G. (2021). Wasserstein Regression, Journal of the American Statistical Association, In press. • Guan, T., Lin, Z., Cao, J., Guan, T., Lin, Z., and Cao, J. (2020). Estimating Truncated Functional Linear Models With a Nested Group Bridge Approach. Journal of Computational and Graphical Statistics, 29(3), 620–628. • Hall, P. and Hooker, G. (2016). Truncated linear models for functional data. Journal of the Royal Statistical Society Series B 78(3), 637–653. • Hyndman, R. J. and Ullah, M. S. (2007). Robust forecasting of mortality and fertility rates: A functional data approach. Computational Statistics and Data Analysis, 51(10), 4942–4956. • Jacques, J. and Preda, C. (2014). Functional data clustering: a survey. Advances in Data Analysis and Classification, 8, 231–255. • James, G., Hastie, T., and Sugar, C. (2000). Principal component models for sparse functional data. Biometrika, 87(3), 587–602. • James, G., Wang, J., and Zhu, J. (2009). Functional linear regression that’s interpretable. The Annals of Statistics, 37(5), 2083–2108.

Slide 42

Slide 42 text

参考文献：論文（2/2） • Kayano, M., Matsui, H., Yamaguchi, R., Imoto, S., and Miyano, S. (2016). Gene set differential analysis of time course expression profiles via sparse estimation in functional logistic model with application to time dependent biomarker detection. Biostatistics, 17, 235–248. • Lin, Z., Cao, J., Wang, L., and Wang, H. (2017). Locally Sparse Estimator for Functional Linear Regression Models. Journal of Computational and Graphical Statistics, 26(2):306–318. • Matsui, H., Araki, Y., and Konishi, S. (2008). Multivariate regression modeling for functional data. Journal of Data Science, 6(3), 313–331. • Petersen, A., Müller, H.-G. (2019). Wasserstein covariance for multiple random densities, Biometrika, 106, 339–351. • Ramsay, J. (1996). Principal differential analysis. Journal of the Royal Statistical Society Series B, 58, 495–508. • Ramsay, J. and Dalzell, C. (1991). Some tools for functional data analysis. Journal of the Royal Statistical Society Series B, 53, 539–572. • Sangalli, L.M., Secchi, P., Vantini, S. and Vitelli, V. (2010). K-mean alignment for curve clustering, Computational Statistics and Data Analysis, 54, 1219-1233 • Wu, Y., Fan, J., and Müller, H. (2010b). Varying-coefficient functional linear regression. Bernoulli, 16(3):730–758. • Zhou, J., Wang, N.-y., and Wang, N. (2013). Functional linear model with zero-value coefficient function at sub-regions. Statistica Sinica, 23, 25–50. 42