Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data science в life sciences

Data science в life sciences

В настоящее время life sciences (науки о жизни) — одна из самых бурно развивающихся прикладных научных областей. Data science (наука о данных) с начала 2010-х годов тоже стала очень популярной — во многом благодаря росту вычислительной мощности машин, с одной стороны, и росту количества данных в цифровом виде, с другой. Я хочу рассказать, как наука о данных помогает наукам о жизни делать мир лучше:
• что такое life sciences и что они изучают;
• что такое data science и чем она занимается;
• как data science работает в life sciences — а если не работает, то почему;
• какие проблемы life sciences мы решаем в Аркадии при помощи data science.

JSC “Arcadia Inc.”

October 13, 2018
Tweet

More Decks by JSC “Arcadia Inc.”

Other Decks in Programming

Transcript

  1. 2018 О себе • 18 лет в IT • Frontend,

    backend, DB – MS stack • C++ -> .NET -> R/Python 2
  2. 2018 Machine Learning 5 Train Predict Training set X, Y

    Model Loss function Training algorithm Trained model New data X Y
  3. 2018 Life sciences 6 • Agriculture, Fisheries & Food •

    Anatomy & Morphology • Behavioral Sciences • Biology, Biochemistry and Biotechnology • Biophysics • Ecology, Evolution & Environment • Entomology • Forestry • Genetics & Heredity • Immunology • Mycology • Paleontology • Parasitology • Pharmacology & Pharmacy • Physiology • Plant Sciences • Toxicology • Veterinary Sciences • Virology • Zoology • …
  4. 2018 Пример – компьютерная диагностика 16 • Сегментирование: на что

    именно смотрим? • Извлечение признаков: как представляем? • Классификация: к какому классу относится представление?
  5. 2018 Пример – компьютерная диагностика 18 • Сегментирование: на что

    именно смотрим? • Извлечение признаков: как представляем? • Классификация: к какому классу относится представление?
  6. 2018 Пример – компьютерная диагностика 20 • Сегментирование: на что

    именно смотрим? • Извлечение признаков: как представляем? • Классификация: к какому классу относится представление? 0.1 0.1 0.8
  7. 2018 Проблемы: использование не по назначению 22 Модель Обучена на

    Используется на Одних данных Других данных
  8. 2018 Пример – компьютерная диагностика • Более простая форма –

    триаж • Разбивает случаи на классы по степени критичности • Выполняется до того, как пациент поступает к эксперту 23 0.2 0.8 Помочь ASAP Подождет
  9. 2018 Пример – разработка лекарств • Найти действующее вещество с

    нужными свойствами • Связывается с правильным белком • Не связывается с неправильными • Перебирать все – слишком долго и дорого (1060 веществ) 24
  10. 2018 Пример – разработка лекарств • Предсказать результат до эксперимента

    • Отбросить обречённые вещества • Сосредоточиться на перспективных 25 Virtual Screening Candidates Good Bad
  11. 2018 Пример – разработка лекарств • Arcadia: Biosignature Based Drug

    Design • Известна способность некоторых веществ связываться с некоторыми белками • Предсказать эту способность для других комбинаций вещество-белок 26 Белок 1 Белок 2 … Белок m Вещество 1 Модель 1 Модель 2 … Модель m Вещество 2 … Вещество n
  12. 2018 Пример – разработка лекарств • Arcadia: Biosignature Based Drug

    Design • Известна способность некоторых веществ связываться с некоторыми белками • Предсказать эту способность для других комбинаций вещество-белок 27
  13. 2018 IBM Watson for Oncology 32 Истории болезни Медицинские журналы

    Учебники Исследования Данные нового пациента Диагноз Рекомендации по лечению
  14. 2018 IBM Watson for Oncology 33 Истории болезни Медицинские журналы

    Учебники Исследования Данные нового пациента Диагноз Рекомендации по лечению Из одного медцентра. Предвзятость.