Контроль и диагностика биологических систем на основе интеллектуального анализа данных

F2cd01da431a9d14801538d75e6f8931?s=47 vero4ka
June 08, 2011

Контроль и диагностика биологических систем на основе интеллектуального анализа данных

F2cd01da431a9d14801538d75e6f8931?s=128

vero4ka

June 08, 2011
Tweet

Transcript

  1. РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ Факультет физико-математических и естественных наук Кафедра

    «Информационных технологий» Выполнил Студент Мажуга В.В. Научный руководитель, Хачумов В.М. д.т.н., проф. МОСКВА 2011
  2. 2 Работа посвящена контролю и диагностике биологических систем на примере

    анализа мочекаменной болезни человека, а также анализа сигнала электрокардиограммы.  В первой части рассмотрено применение методов распознавания образов и компьютерной обработки изображений к задаче диагностики мочекаменной болезни. Используемый подход основан на исследовании изображений дегидратированных образцов биологической жидкости пациентов – фаций.  Во второй части рассматривается выявление характерных признаков сигнала электрокардиограммы.
  3. 3 Низкая степень заболевания Высокая степень заболевания Имеются изображения фаций

    (наблюдаемых под микроскопом графических образцов биологической жидкости пациентов).
  4. 4 Для постановки диагноза необходимо выделить на снимке очертания фации.

    При обработке изображения, получаемого с микроскопа, оператор либо размещает фацию в центре снимка, либо выделяет лишь фрагмент фации.
  5. 5 Выделим области, расположенные по углам снимка: Как было показано

    ранее, в одних случаях в эти области попадут части фации, в других – фрагменты фона.
  6. 6 Построим гистограммы интенсивностей яркостей для каждой выбранной области: argmax

    ( )  k k i I p z max max ( , )     l r I I I x y I I
  7. 7 Для каждого изображения получим набор признаков на основе автоматического

    измерения характеристик полутонового снимка фации: (x1 , x2 , x3 , x4 , x5 , x6 , x7 )
  8. 8 ( )  i i n p z n

    где ni – i-ый уровень яркости zi (i = 0, …, L – 1), n – общее число пикселей.
  9. 9 x1 – математическое ожидание: Математическое ожидание случайной величины z

    равно сумме произведений значений zi на соответствующие им вероятности p(zi ): 1 0 ( ) L i i i m z p z     x2 – дескриптор относительной гладкости: 1 2 2 0 ( ) ( ) ( ) L i i i z z m p z       x3 – однородность: 1 2 0 ( ) L i i U p z    
  10. 10 x4 – энтропия: Энтропия характеризует изменчивость яркости изображения. Для

    изображения, имеющего p(zi ) = const для всех значений zi , энтропия будет принимать наибольшее значение. Вид фации мочи: (слева) – при отсутствии процесса камнеобразования, (справа) – при наличии камнеобразования. 1 2 0 ( )log ( ) L i i i e p z p z    
  11. 11 Обозначим матрицу совместной встречаемости через Cr = (cij ),

    где r – отношение, в котором находятся пиксели i и j: x5 – максимум вероятности: x6 – однородность для матрицы Cr : x7 – средняя энтропия: max , max( ) ij i j p c  1 1 2 0 0 L L c ij i j U c       2 , : 1 ( , ) i j r i j z z r p z z s   C 1 1 2 0 0 log L L c ij ij i j e c c      
  12. 12 Для классификации полученных образов будем определять расстояние до каждого

    из классов, используя метрики Евклида и Махаланобиса: 1. Метрика Евклида. Нахождение минимального покрывающего дерева Расстояние Евклида между двумя точками (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T вычисляется по следующей формуле: На основе таблицы расстояний между имеющимися образцами фаций построим минимальное покрывающее дерево, используя алгоритм Краскала. 2 2 1 1 ( ) ( ) ( ) ( ) T E n n d x y x y x y x y        
  13. 13 Минимальное дерево расстояний, построенное в соответствии с метрикой Евклида.

    Красным цветом выделены объекты, изначально относящиеся к первому классу ("High"), а синим – ко второму ("Normal")
  14. 14 2. Классификация на основе расстояния Махаланобиса В отличие от

    метрики Евклида, расстояние Махаланобиса учитывает корреляцию между компонентами векторов (признаками) и определяется по следующей формуле: где C – ковариационная матрица, составленная из попарных ковариаций элементов векторов (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T . Данная матрица представляет собой математическое ожидание произведения центрированных случайных величин: 1 ( ) ( ) T M d x y C x y       cov( , ) ( )( ) C x y M x Mx y My    
  15. 15 Результаты классификации с использованием расстояния Махаланобиса Расстояние до класса

    "High" Расстояние до класса "Normal" Класс 1. 5.05 414.199 High 2. 4.99 748.379 High 3. 5.10 1098.079 High 4. 0.00 43.34 High 5. 4.69 1788.14 High 6. 4.22 17898.63 High 7. 5.13 80.80 High 8. 4.85E14 6.12 Normal 9. 5.05E15 6.12 Normal 10. 9.57E12 6.12 Normal 11. 8.27E14 6.12 Normal 12. 1.51E16 6.12 Normal 13. 4.03E16 6.12 Normal 14. 1.07E16 6.12 Normal 15. 1.63E14 6.12 Normal
  16. 16 K-means – это метод кластерного анализа, применяемый для разделения

    N объектов на K классов, в которых каждый из объектов относится к определенному классу исходя их близости к центру кластера. Центр кластера – математическое ожидание μi координат (признаков) всех объектов, входящих в рассматриваемый кластер. Обозначим множество искомых классов как S = {S1 , S2 , …, SK }, (K ≤ N). Шаг 1. Назначение объекта наиболее подходящему (похожему) кластеру. Шаг 2. Пересчет кластерных центров. j i j S i i S    x x μ * 1 argmin ( , ) j i K j i S i S S d      x x μ
  17. 17

  18. 18 Результаты работы алгоритма K-means

  19. 19 Рассмотрим методы предварительной обработки сигнала, поступающего от кардиографа, распознавания

    QRS комплекса, а также классификацию пиков кардиограммы.
  20. 20 Пример сигнала, полученного из базы данных MIT-BIN ECG. Основные

    этапы анализа ЭКГ.
  21. 21

  22. 22 Зубец Р представляет собой суммарное отображение прохождения синусового импульса

    по проводящей системе предсердий и поочередное возбуждение сначала правого (восходящее колено зубца Р), а затем левого (нисходящее колено зубца Р) предсердий.
  23. 23 Импульс, выходящий из синусового узла, направляется к предсердно- желудочковому

    соединению. Электрический импульс достигает проводящих путей желудочков (пучок Гиса), проходит нему, возбуждая при этом миокард желудочков.
  24. 24 Охватив возбуждением желудочки, импульс угасает. Процессы угасания возбуждения и

    восстановление исходного состояния также регистрируются на ЭКГ. Они называются процессами реполяризации и отображаются графически на ЭКГ отрезком S-Т и зубцом Т.
  25. 25 Выделяют следующие виды помех, присутствующие в ЭКГ:  сетевая

    наводка;  мышечный тремор;  плохой контакт электродов с кожей;  импульсные помехи, влияющие на кардиомонитор через сеть при включении мощной медицинской аппаратуры;  двигательные артефакты;  напряжение собственных шумов электродов и усилителя биопотенциалов в низкочастотном диапазоне;  импульсные помехи.
  26. 26 1. Фильтр Гаусса Маска фильтра формируется с использованием следующих

    отношений: где σ – среднеквадратическое отклонение распределения Гаусса (соответствует радиусу размытия). 2. Фильтр Баттерворта Фильтры Баттерворта характеризуются амплитудно-частотной характеристикой, максимально плоской в полосе пропускания и монотонно спадающей за ее пределами: где n – порядок фильтра (определяет крутизну спада), ωс – частота среза (частота, на которой модуль коэффициента передачи равен √½).   2 2 2   u H u Ae  2 2 1 1           n c H j
  27. 27 Исходный сигнал ЭКГ и сигналы, полученные после фильтрации с

    использованием фильтров Баттерворта и Гаусса.
  28. 28 Дискретное преобразование Фурье от исходного сигнала ЭКГ может быть

    представлено в следующем виде: где x0 , x1 , …, xN-1 – дискретные значения сигнала, а X0 , X1 , …, XN-1 – комплексные амплитуды синусоидальных сигналов, слагающих исходный сигнал. Вычислим значения амплитуд для исходного сигнала зашумленного ЭКГ-сигнала, а также амплитудный спектр сигнала после фильтрации: 2 1 0 , 0, , 1         i N kn N k n n X x e k N , 0, , 1    k k X A k N N
  29. 29 Амплитудные спектры зашумленного сигнала ЭКГ и сигнала после фильтрации.

  30. 30 ( ( ) ( )) ( ( ) (

    )) 0       x n x n m x n m x n
  31. 31 Сигнал ЭКГ с размеченным QRS-комплексом.

  32. 32

  33. 33 Результат работы алгоритма.

  34. 34 График Пуанкаре.

  35. 35 В данной работе рассмотрена возможность применения методов интеллектуального анализа

    данных к некоторым задачам анализа и диагностики в области медицины.  В первой части работы был исследован способ анализа графических изображений образцов биологической жидкости путем выявления статистических признаков. Предложен алгоритм отделения пикселей на изображении, лежащих внутри фации, от пикселей, относящихся к предметному столику микроскопа, на котором оператор размещает фацию для получения снимка. Приведено решение задачи классификации полученных характеризующих векторов.  Вторая часть работы была посвящена выявлению характерных элементов электрокардиограммы. В результате работы был реализован алгоритм, осуществляющий предварительную обработку ЭКГ-сигнала и позволяющий выделить пять основных зубцов: P, Q, R, S и T.
  36. None