NLP cookbook: анализируем тексты на Python с минимальными знаниями о машинном обучении

NLP cookbook: анализируем тексты на Python с минимальными знаниями о машинном обучении

Пётр Ермаков (Lamoda / Datagym) @ Moscow Python №72

"Большой объем информации в интернете хранится в текстах: новости, комментарии, сообщения и даже вакансии. В докладе мы рассмотрим набор рецептов по анализу текста на Python не углубляясь в теорию. Возможно, рецепты вдохновят вас узнать про лежащие в основе методы больше, но в любом случае сразу после доклада у вас будет понимание, как применять полученные сниппеты у себя в работе".

Видео: http://www.moscowpython.ru/meetup/72/nlp-cookbook/

53b0434aded1fb944ec3037c382158c1?s=128

Moscow Python Meetup

January 30, 2020
Tweet

Transcript

  1. 2.

    О себе • Петр Ермаков • https://ermakovpetr.ru • Founder @

    DataGym.ru • Lamoda, ex-mail.ru, ex-hh.ru • t.me/PowerOfData • dscast.ru
  2. 3.

    Agenda • Сравнение текстов • Лемматизация • Орфография • Word2Vec

    • Тематическое моделирование • Выделение сущностей
  3. 30.
  4. 33.

    Лойс • годно, лойс • лойс за песню • из

    принципа не поставлю лойс • взаимные лойсы • лойс если не согласен Павел Калайдин, DataFest
  5. 36.

    Кек • кек, что ли? • кек)))))) • ну ты

    кек Павел Калайдин, DataFest
  6. 37.
  7. 38.
  8. 42.
  9. 53.
  10. 54.
  11. 55.
  12. 59.

    + bonus Xeon E5 2678 V3 (бу), 128 (4x32) GB

    DDR3 http://bit.ly/ali_server
  13. 60.

    + bonus Xeon E5 2678 V3 (бу), 128 (4x32) GB

    DDR3 http://bit.ly/ali_server
  14. 62.