Диагностика мочекаменной болезни на основе анализа изображений фаций

F2cd01da431a9d14801538d75e6f8931?s=47 vero4ka
February 27, 2010

Диагностика мочекаменной болезни на основе анализа изображений фаций

F2cd01da431a9d14801538d75e6f8931?s=128

vero4ka

February 27, 2010
Tweet

Transcript

  1. РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ Факультет физико-математических и естественных наук Кафедра

    «Информационных технологий» Выполнил Студент Мажуга В.В. Научный руководитель, Хачумов В.М. д.т.н., проф. МОСКВА 2011
  2. 2 В данной работе рассмотрено применение методов распознавания образов и

    компьютерной обработки изображений к задаче диагностики мочекаменной болезни. Используемый подход основан на исследовании изображений дегидратированных образцов биологической жидкости пациентов – фаций.  В первой части работы на основе статистического подхода для каждого снимка фации был сформирован вектор признаков. Для классификации изображений применялся подход, основанный на измерении ближайших расстояний между образцами.  Во второй части рассматривается применение алгоритма K-means для разделения изображений фаций на две группы: снимков, принадлежащих пациентам с низкой и высокой степенями камнеобразования.
  3. 3 Низкая степень заболевания Высокая степень заболевания Имеются изображения фаций

    (наблюдаемых под микроскопом графических образцов биологической жидкости пациентов).
  4. 4 Для постановки диагноза необходимо выделить на снимке очертания фации.

    При обработке изображения, получаемого с микроскопа, оператор либо размещает фацию в центре снимка, либо выделяет лишь фрагмент фации.
  5. 5 Выделим области, расположенные по углам снимка: Как было показано

    ранее, в одних случаях в эти области попадут части фации, в других – фрагменты фона.
  6. 6 Построим гистограммы интенсивностей яркостей для каждой выбранной области: argmax

    ( )  k k i I p z max max ( , )     l r I I I x y I I
  7. 7 Для каждого изображения получим набор признаков на основе автоматического

    измерения характеристик полутонового снимка фации: (x1 , x2 , x3 , x4 , x5 , x6 , x7 )
  8. 8 ( )  i i n p z n

    где ni – i-ый уровень яркости zi (i = 0, …, L – 1), n – общее число пикселей.
  9. 9 x1 – математическое ожидание: Математическое ожидание случайной величины z

    равно сумме произведений значений zi на соответствующие им вероятности p(zi ): 1 0 ( ) L i i i m z p z     x2 – дескриптор относительной гладкости: 1 2 2 0 ( ) ( ) ( ) L i i i z z m p z       x3 – однородность: 1 2 0 ( ) L i i U p z    
  10. 10 x4 – энтропия: Энтропия характеризует изменчивость яркости изображения. Для

    изображения, имеющего p(zi ) = const для всех значений zi , энтропия будет принимать наибольшее значение. Вид фации мочи: (слева) – при отсутствии процесса камнеобразования, (справа) – при наличии камнеобразования. 1 2 0 ( )log ( ) L i i i e p z p z    
  11. 11 Максимальное значение энтропии показало изображение, относящееся к классу "High"

    и характеризующееся практически полным отсутствием краевой белковой зоны: Номер образца Класс "High" Номер образца Класс "Normal" 1 7.239 8 6.607 2 7.293 9 5.886 3 7.458 10 6.582 4 6.535 11 6.368 5 6.916 12 5.222 6 7.525 13 3.268 7 7.207 14 5.114 15 7.088 'high-6'
  12. 12 Обозначим матрицу совместной встречаемости через Cr = (cij ),

    где r – отношение, в котором находятся пиксели i и j: x5 – максимум вероятности: x6 – однородность для матрицы Cr : x7 – средняя энтропия: max , max( ) ij i j p c  1 1 2 0 0 L L c ij i j U c       2 , : 1 ( , ) i j r i j z z r p z z s   C 1 1 2 0 0 log L L c ij ij i j e c c      
  13. 13

  14. 14 Для классификации полученных образов будем определять расстояние до каждого

    из классов, используя метрики Евклида и Махаланобиса: 1. Метрика Евклида. Нахождение минимального покрывающего дерева Расстояние Евклида между двумя точками (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T вычисляется по следующей формуле: На основе таблицы расстояний между имеющимися образцами фаций построим минимальное покрывающее дерево, используя алгоритм Краскала. 2 2 1 1 ( ) ( ) ( ) ( ) T E n n d x y x y x y x y        
  15. 15 Минимальное дерево расстояний, построенное в соответствии с метрикой Евклида.

    Красным цветом выделены объекты, изначально относящиеся к первому классу ("High"), а синим – ко второму ("Normal")
  16. 16 2. Классификация на основе расстояния Махаланобиса В отличие от

    метрики Евклида, расстояние Махаланобиса учитывает корреляцию между компонентами векторов (признаками) и определяется по следующей формуле: где C – ковариационная матрица, составленная из попарных ковариаций элементов векторов (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T . Данная матрица представляет собой математическое ожидание произведения центрированных случайных величин: 1 ( ) ( ) T M d x y C x y       cov( , ) ( )( ) C x y M x Mx y My    
  17. 17 Результаты классификации с использованием расстояния Махаланобиса Расстояние до класса

    "High" Расстояние до класса "Normal" Класс 1. 5.05 414.199 High 2. 4.99 748.379 High 3. 5.10 1098.079 High 4. 0.00 43.34 High 5. 4.69 1788.14 High 6. 4.22 17898.63 High 7. 5.13 80.80 High 8. 4.85E14 6.12 Normal 9. 5.05E15 6.12 Normal 10. 9.57E12 6.12 Normal 11. 8.27E14 6.12 Normal 12. 1.51E16 6.12 Normal 13. 4.03E16 6.12 Normal 14. 1.07E16 6.12 Normal 15. 1.63E14 6.12 Normal
  18. 18 K-means – это метод кластерного анализа, применяемый для разделения

    N объектов на K классов, в которых каждый из объектов относится к определенному классу исходя их близости к центру кластера. Центр кластера – математическое ожидание μi координат (признаков) всех объектов, входящих в рассматриваемый кластер. Обозначим множество искомых классов как S = {S1 , S2 , …, SK }, (K ≤ N). Шаг 1. Назначение объекта наиболее подходящему (похожему) кластеру. Шаг 2. Пересчет кластерных центров. j i j S i i S    x x μ * 1 argmin ( , ) j i K j i S i S S d      x x μ
  19. 19

  20. 20

  21. Результаты работы алгоритма K-means 21 Результаты работы алгоритма K-means

  22. 22  В данной работе был исследован способ анализа графических

    изображений образцов биологической жидкости путем выявления статистических признаков. Предложен алгоритм отделения пикселей на изображении, лежащих внутри фации, от пикселей, относящихся к предметному столику микроскопа, на котором оператор размещает фацию для получения снимка.  Приведено решение задачи классификации полученных характеризующих векторов. В рамках данной задачи исследована эффективность применения метрик Евклида и Махаланобиса, а также рассмотрено применение минимального дерева расстояний для решения задачи кластеризации.  Во второй части работы было предложено применение алгоритма K-means для разделения исходных снимков на два класса: снимки, относящиеся к высокой и низкой степеням заболевания.
  23. None