Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Диагностика мочекаменной болезни на основе анализа изображений фаций

Диагностика мочекаменной болезни на основе анализа изображений фаций

cansadadeserfeliz

February 27, 2010
Tweet

More Decks by cansadadeserfeliz

Other Decks in Science

Transcript

  1. РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ
    Факультет физико-математических и естественных наук
    Кафедра «Информационных технологий»
    Выполнил
    Студент Мажуга В.В.
    Научный руководитель, Хачумов В.М.
    д.т.н., проф.
    МОСКВА
    2011

    View Slide

  2. 2
    В данной работе рассмотрено применение методов распознавания образов
    и компьютерной обработки изображений к задаче диагностики
    мочекаменной болезни.
    Используемый подход основан на исследовании изображений
    дегидратированных образцов биологической жидкости пациентов –
    фаций.
     В первой части работы на основе статистического подхода для
    каждого снимка фации был сформирован вектор признаков. Для
    классификации изображений применялся подход, основанный на
    измерении ближайших расстояний между образцами.
     Во второй части рассматривается применение алгоритма K-means
    для разделения изображений фаций на две группы: снимков,
    принадлежащих пациентам с низкой и высокой степенями
    камнеобразования.

    View Slide

  3. 3
    Низкая степень
    заболевания
    Высокая степень
    заболевания
    Имеются изображения фаций (наблюдаемых под микроскопом
    графических образцов биологической жидкости пациентов).

    View Slide

  4. 4
    Для постановки диагноза необходимо выделить на снимке очертания
    фации.
    При обработке изображения, получаемого с микроскопа, оператор либо
    размещает фацию в центре снимка, либо выделяет лишь фрагмент
    фации.

    View Slide

  5. 5
    Выделим области, расположенные по углам снимка:
    Как было показано ранее, в одних случаях в эти области попадут части
    фации, в других – фрагменты фона.

    View Slide

  6. 6
    Построим гистограммы интенсивностей яркостей для каждой выбранной
    области:
    argmax ( )

    k k i
    I p z
    max max
    ( , )
       
    l r
    I I I x y I I

    View Slide

  7. 7
    Для каждого изображения получим набор признаков на основе
    автоматического измерения характеристик полутонового снимка
    фации:
    (x1
    , x2
    , x3
    , x4
    , x5
    , x6
    , x7
    )

    View Slide

  8. 8
    ( )  i
    i
    n
    p z
    n
    где ni
    – i-ый уровень яркости zi
    (i = 0, …, L – 1), n – общее число пикселей.

    View Slide

  9. 9
    x1
    – математическое ожидание:
    Математическое ожидание случайной величины z равно сумме произведений
    значений zi
    на соответствующие им вероятности p(zi
    ):
    1
    0
    ( )
    L
    i i
    i
    m z p z


     
    x2
    – дескриптор относительной гладкости:
    1
    2 2
    0
    ( ) ( ) ( )
    L
    i i
    i
    z z m p z



     

    x3
    – однородность:
    1
    2
    0
    ( )
    L
    i
    i
    U p z


     

    View Slide

  10. 10
    x4
    – энтропия:
    Энтропия характеризует изменчивость яркости изображения. Для
    изображения, имеющего p(zi
    ) = const для всех значений zi
    , энтропия будет
    принимать наибольшее значение.
    Вид фации мочи: (слева) – при отсутствии процесса камнеобразования,
    (справа) – при наличии камнеобразования.
    1
    2
    0
    ( )log ( )
    L
    i i
    i
    e p z p z


     

    View Slide

  11. 11
    Максимальное значение энтропии показало изображение, относящееся к
    классу "High" и характеризующееся практически полным отсутствием краевой
    белковой зоны:
    Номер
    образца
    Класс "High"
    Номер
    образца
    Класс
    "Normal"
    1 7.239 8 6.607
    2 7.293 9 5.886
    3 7.458 10 6.582
    4 6.535 11 6.368
    5 6.916 12 5.222
    6 7.525 13 3.268
    7 7.207 14 5.114
    15 7.088
    'high-6'

    View Slide

  12. 12
    Обозначим матрицу совместной встречаемости через Cr
    = (cij
    ),
    где r – отношение, в котором находятся пиксели i и j:
    x5
    – максимум вероятности:
    x6
    – однородность для матрицы Cr
    :
    x7
    – средняя энтропия:
    max
    ,
    max( )
    ij
    i j
    p c

    1 1
    2
    0 0
    L L
    c ij
    i j
    U c
     
     
     
    2
    , :
    1
    ( , )
    i j
    r i j
    z z r
    p z z
    s
     
    C
    1 1
    2
    0 0
    log
    L L
    c ij ij
    i j
    e c c
     
     
     

    View Slide

  13. 13

    View Slide

  14. 14
    Для классификации полученных образов будем определять расстояние
    до каждого из классов, используя метрики Евклида и Махаланобиса:
    1. Метрика Евклида. Нахождение минимального
    покрывающего дерева
    Расстояние Евклида между двумя точками (x1
    , x2
    , …, xn
    )T и (y1
    , y2
    ,, …, yn
    )T
    вычисляется по следующей формуле:
    На основе таблицы расстояний между имеющимися образцами фаций
    построим минимальное покрывающее дерево, используя алгоритм
    Краскала.
    2 2
    1 1
    ( ) ( ) ( ) ( )
    T
    E n n
    d x y x y x y x y
           

    View Slide

  15. 15
    Минимальное дерево
    расстояний, построенное в
    соответствии с метрикой
    Евклида.
    Красным цветом выделены
    объекты, изначально
    относящиеся к первому классу
    ("High"), а синим – ко второму
    ("Normal")

    View Slide

  16. 16
    2. Классификация на основе расстояния Махаланобиса
    В отличие от метрики Евклида, расстояние Махаланобиса учитывает
    корреляцию между компонентами векторов (признаками) и
    определяется по следующей формуле:
    где C – ковариационная матрица, составленная из попарных ковариаций
    элементов векторов (x1
    , x2
    , …, xn
    )T и (y1
    , y2
    ,, …, yn
    )T . Данная матрица
    представляет собой математическое ожидание произведения
    центрированных случайных величин:
    1
    ( ) ( )
    T
    M
    d x y C x y

      
     
    cov( , ) ( )( )
    C x y M x Mx y My
       

    View Slide

  17. 17
    Результаты классификации с
    использованием расстояния Махаланобиса
    Расстояние
    до класса "High"
    Расстояние
    до класса "Normal"
    Класс
    1. 5.05 414.199 High
    2. 4.99 748.379 High
    3. 5.10 1098.079 High
    4. 0.00 43.34 High
    5. 4.69 1788.14 High
    6. 4.22 17898.63 High
    7. 5.13 80.80 High
    8. 4.85E14 6.12 Normal
    9. 5.05E15 6.12 Normal
    10. 9.57E12 6.12 Normal
    11. 8.27E14 6.12 Normal
    12. 1.51E16 6.12 Normal
    13. 4.03E16 6.12 Normal
    14. 1.07E16 6.12 Normal
    15. 1.63E14 6.12 Normal

    View Slide

  18. 18
    K-means – это метод кластерного анализа, применяемый для разделения
    N объектов на K классов, в которых каждый из объектов относится к
    определенному классу исходя их близости к центру кластера.
    Центр кластера – математическое ожидание μi
    координат
    (признаков) всех объектов, входящих в рассматриваемый кластер.
    Обозначим множество искомых классов как S = {S1
    , S2
    , …, SK
    }, (K ≤ N).
    Шаг 1. Назначение объекта наиболее подходящему (похожему) кластеру.
    Шаг 2. Пересчет кластерных центров.
    j i
    j
    S
    i
    i
    S



    x
    x
    μ
    *
    1
    argmin ( , )
    j i
    K
    j i
    S i S
    S d
     
      
    x
    x μ

    View Slide

  19. 19

    View Slide

  20. 20

    View Slide

  21. Результаты работы алгоритма K-means
    21
    Результаты работы алгоритма K-means

    View Slide

  22. 22
     В данной работе был исследован способ анализа графических
    изображений образцов биологической жидкости путем выявления
    статистических признаков. Предложен алгоритм отделения пикселей на
    изображении, лежащих внутри фации, от пикселей, относящихся к
    предметному столику микроскопа, на котором оператор размещает фацию
    для получения снимка.
     Приведено решение задачи классификации полученных
    характеризующих векторов. В рамках данной задачи исследована
    эффективность применения метрик Евклида и Махаланобиса, а также
    рассмотрено применение минимального дерева расстояний для решения
    задачи кластеризации.
     Во второй части работы было предложено применение алгоритма
    K-means для разделения исходных снимков на два класса: снимки,
    относящиеся к высокой и низкой степеням заболевания.

    View Slide

  23. View Slide