Upgrade to Pro — share decks privately, control downloads, hide ads and more …

論文LT会: A deep convolutional neural network approach to single-particle recognition in cryo-electron microscopy

takatoh
August 02, 2019

論文LT会: A deep convolutional neural network approach to single-particle recognition in cryo-electron microscopy

takatoh

August 02, 2019
Tweet

More Decks by takatoh

Other Decks in Science

Transcript

  1. A deep convolutional neural
    network approach to single-
    particle recognition in cryo-
    electron microscopy
    紹介者 たかとー @takatoh1
    論⽂LT会 2019/08/02
    @LPixel
    BMC Bioinformatics (2017) 18:348

    View Slide

  2. ⽣体を構成するタンパク質の構造を知ること
    は、⽣命の仕組みを理解することにつながる。
    フリー https://www.jstage.jst.go.jp/article/jccj/17/1/17_2018-0007/_html/-char/jaより引⽤
    構造を知ることで
    その治療に役⽴てる
    こともできる。

    View Slide

  3. クライオ電⼦顕微鏡は氷包理法とCMOSにより
    試料内の構造情報を⾼分解能により取得する
    フリー https://www.jstage.jst.go.jp/article/jccj/17/1/17_2018-0007/_html/-char/jaより引⽤

    View Slide

  4. クライオ電⼦顕微鏡は複数枚の画像から
    3次元の⽴体構造を構築する。
    フリー https://www.jstage.jst.go.jp/article/jccj/17/1/17_2018-0007/_html/-char/jaより引⽤
    今回の論⽂は
    この画像の収集
    に関する論⽂

    View Slide

  5. 概要
    • タンパク質の⽴体構造解析において、
    本論⽂は深層学習を⽤いた画像解析の初めての例である。
    • ⾼密度やSNRが低い画像解析においての有⽤性を⽰している。
    • Cryo-EMにおいて初めてNN使った論⽂なのでこの分野を布教
    したい
    • 創薬の対象としての興味
    この論⽂を選んだ理由

    View Slide

  6. DeepEMは3つの畳み込み層と
    3つのプーリング層から成る

    View Slide

  7. タンパク質の種類ごとにハイパーパラメータの
    チューニングを⾏ってから画像認識に⽤いる

    View Slide

  8. KLHと19Sタンパク質においてDeepEMによる
    タンパク質の粒⼦収集の有⽤性を⽰した
    parameters used in this study are shown in Table 1. In
    general, the output dimension of the convolutional layer is
    chosen as 70–90% of its input dimension, and the output
    dimension of the subsampling layer is scaled to about half
    its input dimension. We implemented the DeepEM algo-
    rithm based on the DeepLearnToolbox [31], a toolbox for
    the development of deep learning algorithms, in conjunc-
    tion with Matlab.
    Particle recognition and selection in the DeepEM model
    When a well-trained CNN is used to recognize particles,
    a square box of pixels is taken as the CNN input. Each
    input image boxed out of a testing micrograph is rotated
    incrementally, to generate three additional copies of the
    input image with rotations of 90°, 180° and 270°, relative
    to the original. Each copy is used as a separate input to
    generate a CNN output. The final expectation value of
    each input image is taken as the average of its four out-
    put values from the non-rotated and rotated copies. The
    boxed area is initially placed into a corner of the testing
    micrograph, and is raster-scanned across the whole
    micrograph to generate an array of CNN outputs.
    old score must be defined. The boxed image is identified
    as a candidate if the CNN output score of the particle is
    above the threshold score. Those particles whose CNN
    scores are below the threshold are rejected. We used the
    F-measure [32], which is a measure of the accuracy of a
    test that combines both precision and recall for binary
    classification problems, to determine the threshold score
    in our approach, which is defined as.
    Fβ ¼ 1 þ β2
    À Á
    Ã
    precisionÃrecall
    β2Ãprecision þ recall
    À Á ; ð6Þ
    where β is a coefficient weighting the importance of
    precision and recall. In our method, we used the F2
    score, which weights the recall higher than the precision.
    The F2
    -score reaches its best value at 1 and its worst at
    0. We defined the cutoff threshold at the highest value
    of the F2
    -score.
    Secondly, candidate images were further selected
    based on the standard deviation of the pixel intensities.
    There are often carbon-rich areas or contaminants in
    raw micrographs where the initially detected particles
    may not be good choices for downstream single-particle
    Table 1 Hyper-parameters used in different datasets
    Dataset Particle
    size
    Corresponding layer in DeepEM
    C1 S2 C3 S4 C5 S6
    KLH 272 × 272 [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]
    19S 160 × 160 [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]
    26S 150 × 150 [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]
    Inflammasome 112 × 112 [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]
    KLH(keyhole limpet hemocyanin):免疫原性が⾼く、ペプチド抗原の調製に使⽤されるキャリアタンパク質
    19S:タンパク質分解酵素プロテアソームの⼀種
    26S:タンパク質分解酵素プロテアソームの⼀種
    Inflammasome:炎症やアポトーシスに関与するタンパク質の複合体

    View Slide

  9. ⾼密度でもタンパク質粒⼦を判別できるように
    なった。またノイズが⼤きい画像からもタンパク
    質粒⼦が判別できるようになった。この時F値は⼩
    さいながらも検出できている。

    View Slide

  10. まとめ
    • タンパク質の⽴体構造解析において、
    本論⽂は深層学習を⽤いた画像解析の初めての例である。
    • ⾼密度やSNRが低い画像解析においての有⽤性を⽰して
    いる。
    • 画像解析の問題点に踏み込んでいるのは良い
    • ⼿法としては難しくない
    • 粒⼦選択だけでなく3D再構成にも踏み込んで欲しい!
    所感

    View Slide