Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Контроль и диагностика биологических систем на основе интеллектуального анализа данных

Контроль и диагностика биологических систем на основе интеллектуального анализа данных

cansadadeserfeliz

June 08, 2011
Tweet

More Decks by cansadadeserfeliz

Other Decks in Science

Transcript

  1. РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ
    Факультет физико-математических и естественных наук
    Кафедра «Информационных технологий»
    Выполнил
    Студент Мажуга В.В.
    Научный руководитель, Хачумов В.М.
    д.т.н., проф.
    МОСКВА
    2011

    View Slide

  2. 2
    Работа посвящена контролю и диагностике биологических систем на примере
    анализа мочекаменной болезни человека, а также анализа сигнала
    электрокардиограммы.
     В первой части рассмотрено применение методов распознавания
    образов и компьютерной обработки изображений к задаче диагностики
    мочекаменной болезни. Используемый подход основан на
    исследовании изображений дегидратированных образцов
    биологической жидкости пациентов – фаций.
     Во второй части рассматривается выявление характерных признаков
    сигнала электрокардиограммы.

    View Slide

  3. 3
    Низкая степень
    заболевания
    Высокая степень
    заболевания
    Имеются изображения фаций (наблюдаемых под микроскопом
    графических образцов биологической жидкости пациентов).

    View Slide

  4. 4
    Для постановки диагноза необходимо выделить на снимке очертания
    фации.
    При обработке изображения, получаемого с микроскопа, оператор либо
    размещает фацию в центре снимка, либо выделяет лишь фрагмент
    фации.

    View Slide

  5. 5
    Выделим области, расположенные по углам снимка:
    Как было показано ранее, в одних случаях в эти области попадут части
    фации, в других – фрагменты фона.

    View Slide

  6. 6
    Построим гистограммы интенсивностей яркостей для каждой выбранной
    области:
    argmax ( )

    k k i
    I p z
    max max
    ( , )
       
    l r
    I I I x y I I

    View Slide

  7. 7
    Для каждого изображения получим набор признаков на основе
    автоматического измерения характеристик полутонового снимка
    фации:
    (x1
    , x2
    , x3
    , x4
    , x5
    , x6
    , x7
    )

    View Slide

  8. 8
    ( )  i
    i
    n
    p z
    n
    где ni
    – i-ый уровень яркости zi
    (i = 0, …, L – 1), n – общее число пикселей.

    View Slide

  9. 9
    x1
    – математическое ожидание:
    Математическое ожидание случайной величины z равно сумме произведений
    значений zi
    на соответствующие им вероятности p(zi
    ):
    1
    0
    ( )
    L
    i i
    i
    m z p z


     
    x2
    – дескриптор относительной гладкости:
    1
    2 2
    0
    ( ) ( ) ( )
    L
    i i
    i
    z z m p z



     

    x3
    – однородность:
    1
    2
    0
    ( )
    L
    i
    i
    U p z


     

    View Slide

  10. 10
    x4
    – энтропия:
    Энтропия характеризует изменчивость яркости изображения. Для
    изображения, имеющего p(zi
    ) = const для всех значений zi
    , энтропия будет
    принимать наибольшее значение.
    Вид фации мочи: (слева) – при отсутствии процесса камнеобразования,
    (справа) – при наличии камнеобразования.
    1
    2
    0
    ( )log ( )
    L
    i i
    i
    e p z p z


     

    View Slide

  11. 11
    Обозначим матрицу совместной встречаемости через Cr
    = (cij
    ),
    где r – отношение, в котором находятся пиксели i и j:
    x5
    – максимум вероятности:
    x6
    – однородность для матрицы Cr
    :
    x7
    – средняя энтропия:
    max
    ,
    max( )
    ij
    i j
    p c

    1 1
    2
    0 0
    L L
    c ij
    i j
    U c
     
     
     
    2
    , :
    1
    ( , )
    i j
    r i j
    z z r
    p z z
    s
     
    C
    1 1
    2
    0 0
    log
    L L
    c ij ij
    i j
    e c c
     
     
     

    View Slide

  12. 12
    Для классификации полученных образов будем определять расстояние
    до каждого из классов, используя метрики Евклида и Махаланобиса:
    1. Метрика Евклида. Нахождение минимального
    покрывающего дерева
    Расстояние Евклида между двумя точками (x1
    , x2
    , …, xn
    )T и (y1
    , y2
    ,, …, yn
    )T
    вычисляется по следующей формуле:
    На основе таблицы расстояний между имеющимися образцами фаций
    построим минимальное покрывающее дерево, используя алгоритм
    Краскала.
    2 2
    1 1
    ( ) ( ) ( ) ( )
    T
    E n n
    d x y x y x y x y
           

    View Slide

  13. 13
    Минимальное дерево
    расстояний, построенное в
    соответствии с метрикой
    Евклида.
    Красным цветом выделены
    объекты, изначально
    относящиеся к первому классу
    ("High"), а синим – ко второму
    ("Normal")

    View Slide

  14. 14
    2. Классификация на основе расстояния Махаланобиса
    В отличие от метрики Евклида, расстояние Махаланобиса учитывает
    корреляцию между компонентами векторов (признаками) и
    определяется по следующей формуле:
    где C – ковариационная матрица, составленная из попарных ковариаций
    элементов векторов (x1
    , x2
    , …, xn
    )T и (y1
    , y2
    ,, …, yn
    )T . Данная матрица
    представляет собой математическое ожидание произведения
    центрированных случайных величин:
    1
    ( ) ( )
    T
    M
    d x y C x y

      
     
    cov( , ) ( )( )
    C x y M x Mx y My
       

    View Slide

  15. 15
    Результаты классификации с
    использованием расстояния Махаланобиса
    Расстояние
    до класса "High"
    Расстояние
    до класса "Normal"
    Класс
    1. 5.05 414.199 High
    2. 4.99 748.379 High
    3. 5.10 1098.079 High
    4. 0.00 43.34 High
    5. 4.69 1788.14 High
    6. 4.22 17898.63 High
    7. 5.13 80.80 High
    8. 4.85E14 6.12 Normal
    9. 5.05E15 6.12 Normal
    10. 9.57E12 6.12 Normal
    11. 8.27E14 6.12 Normal
    12. 1.51E16 6.12 Normal
    13. 4.03E16 6.12 Normal
    14. 1.07E16 6.12 Normal
    15. 1.63E14 6.12 Normal

    View Slide

  16. 16
    K-means – это метод кластерного анализа, применяемый для разделения
    N объектов на K классов, в которых каждый из объектов относится к
    определенному классу исходя их близости к центру кластера.
    Центр кластера – математическое ожидание μi
    координат
    (признаков) всех объектов, входящих в рассматриваемый кластер.
    Обозначим множество искомых классов как S = {S1
    , S2
    , …, SK
    }, (K ≤ N).
    Шаг 1. Назначение объекта наиболее подходящему (похожему) кластеру.
    Шаг 2. Пересчет кластерных центров.
    j i
    j
    S
    i
    i
    S



    x
    x
    μ
    *
    1
    argmin ( , )
    j i
    K
    j i
    S i S
    S d
     
      
    x
    x μ

    View Slide

  17. 17

    View Slide

  18. 18
    Результаты работы алгоритма K-means

    View Slide

  19. 19
    Рассмотрим методы предварительной обработки сигнала,
    поступающего от кардиографа, распознавания QRS комплекса,
    а также классификацию пиков кардиограммы.

    View Slide

  20. 20
    Пример сигнала, полученного из базы данных MIT-BIN ECG.
    Основные этапы анализа ЭКГ.

    View Slide

  21. 21

    View Slide

  22. 22
    Зубец Р представляет собой суммарное отображение прохождения
    синусового импульса по проводящей системе предсердий
    и поочередное возбуждение сначала правого (восходящее колено зубца Р),
    а затем левого (нисходящее колено зубца Р) предсердий.

    View Slide

  23. 23
    Импульс, выходящий из синусового узла, направляется к предсердно-
    желудочковому соединению. Электрический импульс достигает
    проводящих путей желудочков (пучок Гиса), проходит нему, возбуждая
    при этом миокард желудочков.

    View Slide

  24. 24
    Охватив возбуждением желудочки, импульс угасает. Процессы угасания
    возбуждения и восстановление исходного состояния также регистрируются
    на ЭКГ. Они называются процессами реполяризации и отображаются
    графически на ЭКГ отрезком S-Т и зубцом Т.

    View Slide

  25. 25
    Выделяют следующие виды помех,
    присутствующие в ЭКГ:
     сетевая наводка;
     мышечный тремор;
     плохой контакт электродов с кожей;
     импульсные помехи, влияющие на
    кардиомонитор через сеть при включении
    мощной медицинской аппаратуры;
     двигательные артефакты;
     напряжение собственных шумов
    электродов и усилителя биопотенциалов в
    низкочастотном диапазоне;
     импульсные помехи.

    View Slide

  26. 26
    1. Фильтр Гаусса
    Маска фильтра формируется с использованием следующих отношений:
    где σ – среднеквадратическое отклонение распределения Гаусса (соответствует
    радиусу размытия).
    2. Фильтр Баттерворта
    Фильтры Баттерворта характеризуются амплитудно-частотной характеристикой,
    максимально плоской в полосе пропускания и монотонно спадающей за ее
    пределами:
    где n – порядок фильтра (определяет крутизну спада), ωс
    – частота среза (частота, на
    которой модуль коэффициента передачи равен √½).
     
    2
    2
    2


    u
    H u Ae
     2
    2
    1
    1




     
     
     
    n
    c
    H j

    View Slide

  27. 27
    Исходный сигнал ЭКГ и сигналы, полученные
    после фильтрации с использованием фильтров
    Баттерворта и Гаусса.

    View Slide

  28. 28
    Дискретное преобразование Фурье от исходного сигнала ЭКГ может быть
    представлено в следующем виде:
    где x0
    , x1
    , …, xN-1
    – дискретные значения сигнала,
    а X0
    , X1
    , …, XN-1
    – комплексные амплитуды синусоидальных сигналов,
    слагающих исходный сигнал.
    Вычислим значения амплитуд для исходного сигнала зашумленного
    ЭКГ-сигнала, а также амплитудный спектр сигнала после фильтрации:
    2
    1
    0
    , 0, , 1

     

      
     i
    N kn
    N
    k n
    n
    X x e k N
    , 0, , 1
      
    k
    k
    X
    A k N
    N

    View Slide

  29. 29
    Амплитудные спектры зашумленного
    сигнала ЭКГ и сигнала после фильтрации.

    View Slide

  30. 30
    ( ( ) ( )) ( ( ) ( )) 0
         
    x n x n m x n m x n

    View Slide

  31. 31
    Сигнал ЭКГ с размеченным QRS-комплексом.

    View Slide

  32. 32

    View Slide

  33. 33
    Результат работы алгоритма.

    View Slide

  34. 34
    График Пуанкаре.

    View Slide

  35. 35
    В данной работе рассмотрена возможность применения методов интеллектуального
    анализа данных к некоторым задачам анализа и диагностики в области медицины.
     В первой части работы был исследован способ анализа графических
    изображений образцов биологической жидкости путем выявления
    статистических признаков. Предложен алгоритм отделения пикселей
    на изображении, лежащих внутри фации, от пикселей, относящихся к
    предметному столику микроскопа, на котором оператор размещает
    фацию для получения снимка. Приведено решение задачи
    классификации полученных характеризующих векторов.
     Вторая часть работы была посвящена выявлению характерных
    элементов электрокардиограммы. В результате работы был
    реализован алгоритм, осуществляющий предварительную обработку
    ЭКГ-сигнала и позволяющий выделить пять основных зубцов:
    P, Q, R, S и T.

    View Slide

  36. View Slide