各組織の細胞はそれぞれの役割に特化している
肝臓の細胞:毒素を分解する酵素の産生を助ける細胞
心臓の細胞:心臓を鼓動させる特殊な筋肉細胞
細胞の運命を決めている
のが、みんな大好きDNA
幹細胞の組織への分化
人体の細胞:37兆個
Definition, Types, Uses, Function and Research (https://www.microscopemaster.com/stem-cells.html)
Slide 8
Slide 8 text
1.1.1 What is a genome?
ゲノムとは何なのか。
Slide 9
Slide 9 text
ゲノム = 生物の設計図
すべての遺伝情報を含む生物の完全な
DNA配列は、ゲノムと呼ばれます。
真核細胞では、DNAはタンパク質(ヒス
トン)の周りを包み、クロマチンや染色
体を構成するヌクレオソームのような高
次構造を形成します(右図)
ヌクレオソーム
クロマチン
クロマチン
クロモソーム(伸ばした状態)
クロモソーム
consists of
consists of
ヌクレオソーム
クロモソーム consists of クロマチン
ゲノム解析の目的:ゲノム配列を読み、生物学的示唆を得る!
ヌクレオソーム ヒストン, DNA
ATCTCGATCTATCT....
TAGAGCTAGATAGA...
Slide 10
Slide 10 text
(補足)生物種間のゲノムサイズは異なる
ヒト:30億塩基
大麦:150億塩基
How big are genomes? (http://book.bionumbers.org/how-big-are-genomes/)
Slide 11
Slide 11 text
ゲノムはどのように読むのか
ゲノムを読む際の基本的な流れ
1. 対象のゲノム配列(DNA、RNA)を
検体から抽出
2. 抽出した配列をバラバラにする
(断片化)
3. 断片化した配列を読む
4.断片同士を並べる(アライメント)
5.バラバラにする前の配列を推測する
The Cost of Sequencing a Human Genome (https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost)
Slide 12
Slide 12 text
No content
Slide 13
Slide 13 text
ゲノムシーケンスのコストは劇的に落ちている
1999-2000年では$30億だった。
↓
2020年現在$1000を下回った。
コストが下がることにより生成される
データ量は指数関数的に増加している。
データストレージのコストが増加、
バイオインフォマティクス関連データ
を扱える人材の需要も高まる。
チャンス!!
米国のマーケット別次世代シーケンシング市場
ヒトゲノム1検体のシーケンシングコスト変化
The Cost of Sequencing a Human Genome (https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost)
Next Generation Sequencing (NGS) Market Analysis And Segment Forecasts To 2022
(https://healthcaremarketanalysis.wordpress.com/2016/03/21/next-generation-sequencing-ngs-market-analysis-and-segment-forecasts-to-2022/)
生物種間でゲノム配列は異なる
チンパンジーとヒトのゲノムは
98.8%が相同。
1.2%の違いがチンパンジー
とヒトを区別している。
Scientists discover protein factories hidden in human jumping genes
(https://phys.org/news/2015-10-scientists-protein-factories-hidden-human.html)
突然変異のメカニズム
ゲノムの変異は、いくつかの理由で発生します。
DNA複製のミス
:
:
環境要因
:
DNA修復のミス
10 ~ 10 塩基対に 1 回ミスをする
10
8
紫外線などの変異原はゲノムに変異を誘発する
毎日、人間の細胞は複数のDNA損傷を受けている。
その度にDNA修復が行われるが、このプロセスでミスをする
(DNA修復メカニズムによってエラー率は異なる)
DNA polymerase II - Wikipedia (https://en.wikipedia.org/wiki/DNA_polymerase_II)
Slide 39
Slide 39 text
突然変異の種類
突然変異はその種類、サイズによって分けられます。
変異のサイズで分類することもできる
全ゲノム倍数化:全ゲノム単位での重複
点突然変異:1塩基が関与する変異
小規模突然変異:いくつかの塩基を含む突然変異
大規模突然変異:より大きな染色体領域を含む突然変異
異数性:染色体全体の挿入または削除
転座:DNA断片がゲノムの別の場所に移動する
挿入:ゲノムに新しい塩基が挿入される
遺伝子重複:DNA断片が重複する
欠失:ゲノムから塩基が欠失する
反転:DNA断片の向きが変わる
Different types of DNA mutations (gene vs chromosomal). Their causes and the Ames test procedure.
(https://biology.reachingfordreams.com/biology/molecular-genetics/18-gene-and-chromosomal-types-of-dna-mutations)
Slide 40
Slide 40 text
突然変異の種類(遺伝子機能への影響)
遺伝子産物が新しい分子機能または遺伝子発現の
新しいパターンを持っているような変異
タンパク質機能の低下または廃止をもたらす変異
B. 機能損失型変異(Loss-of-function mutation)
A. 機能獲得型変異(Gain-of-function mutation)
突然変異は遺伝子機能への影響によっても分けられます。
Q. 今の技術だと繰り返し配列のエラー率はどれくらいに
なりますか?
A. アセンブリの際のエラー率は、繰り返し配列の量・長さに依ります
。
一般的に繰り返し配列はユニークな配列に対し、エラー率が高くなること
が言われています
。
Repetitive DNA and next-generation sequencing: computational
challenges and solutions
https://pubmed.ncbi.nlm.nih.gov/22124482
参考:
Slide 66
Slide 66 text
Q. ロングリードシーケンスについて、PacBioはランニン
グコストが高いが正確、Nonoporeは安いが不安定?
A. PacBioは構造上分子を複数回シーケンスして高品質のデータを生成するこ
とができるのに対し、ONTは分子を2回しかシーケンスできません。
精度に関してはPacBioの方が高いといえます
。
導入コストに関してPacBioは$350万~750万、ONTは$1000
のため、ONTの方が安価です(ライブラリのコストは同程度)。