Диагностика мочекаменной болезни на основе анализа изображений фаций

РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ Факультет физико-математических и естественных наук Кафедра
«Информационных технологий» Выполнил Студент Мажуга В.В. Научный руководитель, Хачумов В.М. д.т.н., проф. МОСКВА 2011

2 В данной работе рассмотрено применение методов распознавания образов и
компьютерной обработки изображений к задаче диагностики мочекаменной болезни. Используемый подход основан на исследовании изображений дегидратированных образцов биологической жидкости пациентов – фаций.  В первой части работы на основе статистического подхода для каждого снимка фации был сформирован вектор признаков. Для классификации изображений применялся подход, основанный на измерении ближайших расстояний между образцами.  Во второй части рассматривается применение алгоритма K-means для разделения изображений фаций на две группы: снимков, принадлежащих пациентам с низкой и высокой степенями камнеобразования.

3 Низкая степень заболевания Высокая степень заболевания Имеются изображения фаций
(наблюдаемых под микроскопом графических образцов биологической жидкости пациентов).

4 Для постановки диагноза необходимо выделить на снимке очертания фации.
При обработке изображения, получаемого с микроскопа, оператор либо размещает фацию в центре снимка, либо выделяет лишь фрагмент фации.

5 Выделим области, расположенные по углам снимка: Как было показано
ранее, в одних случаях в эти области попадут части фации, в других – фрагменты фона.

6 Построим гистограммы интенсивностей яркостей для каждой выбранной области: argmax
( )  k k i I p z max max ( , )     l r I I I x y I I

7 Для каждого изображения получим набор признаков на основе автоматического
измерения характеристик полутонового снимка фации: (x1 , x2 , x3 , x4 , x5 , x6 , x7 )

8 ( )  i i n p z n
где ni – i-ый уровень яркости zi (i = 0, …, L – 1), n – общее число пикселей.

9 x1 – математическое ожидание: Математическое ожидание случайной величины z
равно сумме произведений значений zi на соответствующие им вероятности p(zi ): 1 0 ( ) L i i i m z p z     x2 – дескриптор относительной гладкости: 1 2 2 0 ( ) ( ) ( ) L i i i z z m p z       x3 – однородность: 1 2 0 ( ) L i i U p z    

10 x4 – энтропия: Энтропия характеризует изменчивость яркости изображения. Для
изображения, имеющего p(zi ) = const для всех значений zi , энтропия будет принимать наибольшее значение. Вид фации мочи: (слева) – при отсутствии процесса камнеобразования, (справа) – при наличии камнеобразования. 1 2 0 ( )log ( ) L i i i e p z p z    

11 Максимальное значение энтропии показало изображение, относящееся к классу "High"
и характеризующееся практически полным отсутствием краевой белковой зоны: Номер образца Класс "High" Номер образца Класс "Normal" 1 7.239 8 6.607 2 7.293 9 5.886 3 7.458 10 6.582 4 6.535 11 6.368 5 6.916 12 5.222 6 7.525 13 3.268 7 7.207 14 5.114 15 7.088 'high-6'

12 Обозначим матрицу совместной встречаемости через Cr = (cij ),
где r – отношение, в котором находятся пиксели i и j: x5 – максимум вероятности: x6 – однородность для матрицы Cr : x7 – средняя энтропия: max , max( ) ij i j p c  1 1 2 0 0 L L c ij i j U c       2 , : 1 ( , ) i j r i j z z r p z z s   C 1 1 2 0 0 log L L c ij ij i j e c c      

14 Для классификации полученных образов будем определять расстояние до каждого
из классов, используя метрики Евклида и Махаланобиса: 1. Метрика Евклида. Нахождение минимального покрывающего дерева Расстояние Евклида между двумя точками (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T вычисляется по следующей формуле: На основе таблицы расстояний между имеющимися образцами фаций построим минимальное покрывающее дерево, используя алгоритм Краскала. 2 2 1 1 ( ) ( ) ( ) ( ) T E n n d x y x y x y x y        

15 Минимальное дерево расстояний, построенное в соответствии с метрикой Евклида.
Красным цветом выделены объекты, изначально относящиеся к первому классу ("High"), а синим – ко второму ("Normal")

16 2. Классификация на основе расстояния Махаланобиса В отличие от
метрики Евклида, расстояние Махаланобиса учитывает корреляцию между компонентами векторов (признаками) и определяется по следующей формуле: где C – ковариационная матрица, составленная из попарных ковариаций элементов векторов (x1 , x2 , …, xn )T и (y1 , y2 ,, …, yn )T . Данная матрица представляет собой математическое ожидание произведения центрированных случайных величин: 1 ( ) ( ) T M d x y C x y       cov( , ) ( )( ) C x y M x Mx y My    

17 Результаты классификации с использованием расстояния Махаланобиса Расстояние до класса
"High" Расстояние до класса "Normal" Класс 1. 5.05 414.199 High 2. 4.99 748.379 High 3. 5.10 1098.079 High 4. 0.00 43.34 High 5. 4.69 1788.14 High 6. 4.22 17898.63 High 7. 5.13 80.80 High 8. 4.85E14 6.12 Normal 9. 5.05E15 6.12 Normal 10. 9.57E12 6.12 Normal 11. 8.27E14 6.12 Normal 12. 1.51E16 6.12 Normal 13. 4.03E16 6.12 Normal 14. 1.07E16 6.12 Normal 15. 1.63E14 6.12 Normal

18 K-means – это метод кластерного анализа, применяемый для разделения
N объектов на K классов, в которых каждый из объектов относится к определенному классу исходя их близости к центру кластера. Центр кластера – математическое ожидание μi координат (признаков) всех объектов, входящих в рассматриваемый кластер. Обозначим множество искомых классов как S = {S1 , S2 , …, SK }, (K ≤ N). Шаг 1. Назначение объекта наиболее подходящему (похожему) кластеру. Шаг 2. Пересчет кластерных центров. j i j S i i S    x x μ * 1 argmin ( , ) j i K j i S i S S d      x x μ

Результаты работы алгоритма K-means 21 Результаты работы алгоритма K-means

22  В данной работе был исследован способ анализа графических
изображений образцов биологической жидкости путем выявления статистических признаков. Предложен алгоритм отделения пикселей на изображении, лежащих внутри фации, от пикселей, относящихся к предметному столику микроскопа, на котором оператор размещает фацию для получения снимка.  Приведено решение задачи классификации полученных характеризующих векторов. В рамках данной задачи исследована эффективность применения метрик Евклида и Махаланобиса, а также рассмотрено применение минимального дерева расстояний для решения задачи кластеризации.  Во второй части работы было предложено применение алгоритма K-means для разделения исходных снимков на два класса: снимки, относящиеся к высокой и низкой степеням заболевания.

Диагностика мочекаменной болезни на основе анал...

Диагностика мочекаменной болезни на основе анализа изображений фаций

cansadadeserfeliz

More Decks by cansadadeserfeliz

Other Decks in Science

Featured

Transcript

РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ Факультет физико-математических и естественных наук Кафедра

2 В данной работе рассмотрено применение методов распознавания образов и

3 Низкая степень заболевания Высокая степень заболевания Имеются изображения фаций

4 Для постановки диагноза необходимо выделить на снимке очертания фации.

5 Выделим области, расположенные по углам снимка: Как было показано

6 Построим гистограммы интенсивностей яркостей для каждой выбранной области: argmax

7 Для каждого изображения получим набор признаков на основе автоматического

8 ( )  i i n p z n

9 x1 – математическое ожидание: Математическое ожидание случайной величины z

10 x4 – энтропия: Энтропия характеризует изменчивость яркости изображения. Для

11 Максимальное значение энтропии показало изображение, относящееся к классу "High"

12 Обозначим матрицу совместной встречаемости через Cr = (cij ),

13

14 Для классификации полученных образов будем определять расстояние до каждого

15 Минимальное дерево расстояний, построенное в соответствии с метрикой Евклида.

16 2. Классификация на основе расстояния Махаланобиса В отличие от

17 Результаты классификации с использованием расстояния Махаланобиса Расстояние до класса

18 K-means – это метод кластерного анализа, применяемый для разделения

19

20

Результаты работы алгоритма K-means 21 Результаты работы алгоритма K-means

22  В данной работе был исследован способ анализа графических