$30 off During Our Annual Pro Sale. View Details »

(21.04.2021) Семинар – "Прогнозы результатов оп...

ТиМПИ
April 21, 2021

(21.04.2021) Семинар – "Прогнозы результатов опросников «Большой пятерки» через анализ контента, публикуемого пользователями в социальных сетях: обзор решений"

ТиМПИ

April 21, 2021
Tweet

More Decks by ТиМПИ

Other Decks in Science

Transcript

  1. 21.04.2021 Анна Сергеевна Пугачёва 2 курс бакалавриата МОиАИС`23, СПбГУ Прогнозы

    результатов опросников «Большой пятерки» через анализ контента, публикуемого пользователями в социальных сетях: обзор решений
  2. • Только в Instagram ежедневно публикуются более 100 миллионов фотографий

    и видео. • К 2024 году данные из социальных сетей будут составлять 40% от мирового объема данных. Актуальность 2/15 Рис. 1 https://wearesocial.com/digital-2020
  3. Обзор существующих решений в вопросе прогнозов результатов опросников «Большой пятерки»

    через анализ контента, публикуемого пользователями в социальных сетях. Цель 3/15
  4. 4/15 Пример 1: что исследуется? Связь Большой Пятерки черт личности

    с пользовательской активностью в социальной сети “Вконтакте” [1]. Выборка: 1020 человек. Данные: • вариация “большой пятерки”: NEO-FFI; • информация из профиля; • посты; • комментарии; • репосты. Рис. 2 http://www.socialcompas.com/wp-content/uploads/2019/03/800px-Wiki-grafik_peats-de_big_five_ENG.png
  5. • Случайный лес — это алгоритм классификации, состоящий из многих

    деревьев решений. • Метод опорных векторов — это техника машинного обучения с учителем. Она используется в классификации, может быть применена к регрессионным задачам. Пример 1: случайный лес и метод опорных векторов 5/15
  6. Анализ связи между лексикой пользователей в социальной сети и их

    личностными чертами [2]. Выборка: 75 000 респондентов. Данные: • результаты “большой пятерки”; • пол; • возраст; • опубликованные посты в Facebook. Пример 2: что исследуется? Рис. 4 https://i.ya-webdesign.com/images/iphone-text-message-bubble-png-6.png 7/15
  7. LDA строит — два распределения: • Распределение тем по текстам.

    • Распределение слов по темам. Linguistic Inquiry and Word Count (LIWC) — программа, которая может рассчитывать в какой степени люди используют разные категории слов в широком спектре текстов. Пример 2: метод LDA и LIWC 8/15
  8. Выборка: 1008 записей. Данные: • вариация “большой пятерки”: Ten-Item Personality

    Inventory; • результаты опроса по использованию социальных сетей. Пример 3: что исследуется? 10/15 Рис. 6 https://www.imnewswatch.com/wp-content/uploads/2020/02/Social-Media-Platforms-1-1024x67 9.jpg Взаимосвязь между личностными чертами респондента и предпочтениями в выборе социальной сети [3].
  9. Определение личностных черт на основе анализа опубликованных изображений • Определение

    личностных факторов на основе анализа опубликованных и понравившихся изображений в социальной сети «Twitter»[12]; • Определение личностных факторов на основе изображений, опубликованных в «Facebook»[13]; Пример 4: что исследуется? 11/15 Рис. 7 http://www.adm-tavda.ru/sites/default/files/fbtwin.png
  10. На основе выполненного анализа публикаций можно сделать следующие выводы: •

    Среди пяти личностных черт пользователей, уровни экстраверсии и нейротизма выявляются с лучшем качеством. • Практически все методы оценки личностных черт по изображениям показывают достаточную точность даже при отсутствии текстовой информации; • при этом объединение информации об опубликованных изображениях в социальных сетях, понравившихся публикаций, а также совместный анализ графической и текстовой информации, приводят к увеличению точности решений по сравнению с раздельными подходами. Вывод: 12/15
  11. 13/15 Что можно применить? • Сбор не всех данных. •

    Алгоритмы машинного обучения. Рис. 8 https://miro.medium.com/max/1200/1*91TZsf7mZidi68IOzMY6ew.png
  12. 1. Станкевич Максим Алексеевич, Игнатьев Николай Алексеевич, Смирнов Иван Валентинович,

    Кисельникова Наталья Владимировна Выявление личностных черт у пользователей социальной сети Вконтакте // Вопросы кибербезопасности. 2019. №4 (32). URL: https://cyberleninka.ru/article/n/vyyavlenie-lichnostnyh-chert-u-polzovateley-sotsialnoy-seti-vkontakte (дата обращения: 05.04.2021). 2. Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach 3. Kircaburun, K., Alhabash, S., Tosuntaş, Ş.B. et al. Uses and Gratifications of Problematic Social Media Use Among University Students: a Simultaneous Examination of the Big Five of Personality Traits, Social Media Platforms, and Social Media Use Motives. Int J Ment Health Addiction 18, 525–547 (2020). https://doi.org/10.1007/s11469-018-9940-6 4. Литвинова Татьяна Александровна, Литвинова Ольга Александровна, Рыжкова Екатерина Сергеевна, Бирюкова Елизавета Дмитриевна, Середин Павел Владимирович, Загоровская Ольга Владимировна Исследование влияния пола и психологических характеристик автора на количественные параметры его текста с использованием программы Linguistic Inquiry and Word Count // Научный диалог. 2015. №12 (48). URL: https://cyberleninka.ru/article/n/issledovanie-vliyaniya-pola-i-psihologicheskih-harakteristik-avtora-na-kolichestvennye-parametry-ego-teksta-s-ispolzovaniem-programmy (дата обращения: 10.04.2021). 5. Латышев Андрей Валерьевич, Талалаев Александр Анатольевич, Фраленко Виталий Петрович, Хачумов Вячеслав Михайлович, Хачумов Михаил Вячеславович Методы оценки личностных факторов по визуальной информации, публикуемой в социальных сетях (обзор) // Мир науки. Педагогика и психология. 2019. №1. URL: https://cyberleninka.ru/article/n/metody-otsenki-lichnostnyh-faktorov-po-vizualnoy-informatsii-publikuemoy-v-sotsialnyh-setyah-obzor (дата обращения: 05.04.2021). 6. Pennacchiotti, M., Popescu, A.M.: A machine learning approach to twitter user classification. In: Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media (2011) 7. Dutta, K., Singh, V.K., Chakraborty, P. et al. Analyzing Big-Five Personality Traits of Indian Celebrities Using Online Social Media. Psychol Stud 62, 113–124 (2017). https://doi.org/10.1007/s12646-017-0408-8 8. Obschonka, M., Lee, N., Rodríguez-Pose, A. et al. Big data methods, social media, and the psychology of entrepreneurial regions: capturing cross-county personality traits and their impact on entrepreneurship in the USA. Small Bus Econ 55, 567–588 (2020). https://doi.org/10.1007/s11187-019-00204-2 9. Guilfoyle S., Bergman S.M., Hartwell C., Powers J. (2016) Social Media, Big Data, and Employment Decisions: Mo’ Data, Mo’ Problems?. In: Landers R., Schmidt G. (eds) Social Media in Employee Selection and Recruitment. Springer, Cham. https://doi.org/10.1007/978-3-319-29989-1_7 10. Keith Campbell W., McCain J. (2018) Theoretical Perspectives on Narcissism and Social Media: The Big (and Beautiful) Picture. In: Hermann A., Brunell A., Foster J. (eds) Handbook of Trait Narcissism. Springer, Cham. https://doi.org/10.1007/978-3-319-92171-6_48 11. Bruce Ferwerda, Markus Schedl, and Marko Tkalcic. 2015. Predicting Personality Traits with Instagram Pictures. In Proceedings of the 3rd Workshop on Emotions and Personality in Personalized Systems 2015 (EMPIRE '15). Association for Computing Machinery, New York, NY, USA, 7–10. DOI:https://doi.org/10.1145/2809643.2809644 12. Chandra S., Lin W., Carpenter J., Keong W., Lyle H., Preoţiuc-Pietro D. Studying personality through the content of posted and liked images on Twitter // Conference: ACM Web Science, 17, June 25-28, 2017, Troy, NY, USA, DOI: 10.1145/3091478.3091522 [Электронный ресурс] https://www.sas.upenn.edu/~ danielpr/files/persimages17websci.pdf. 13. Segalin C., Celli F., Polonio L., Kosinski M., Stillwell D., Sebe N., Cristani M., Lepri B. What your facebook profile picture reveals about your personality // Proceedings of the 25th ACM international conference on Multimedia, 2017, pp. 460–468, DOI: 10.1145/3123266.3123331. 14. Kosinski M., Stillwell D., Graepel T. Private traits and attributes are predictable from digital records of human behavior // Proceedings of the National Academy of Sciences, 2013, 110(15), pp. 5802–5805, DOI: 10.1073/pnas.1218772110. Список Литературы 14/15
  13. 21.04.2021 Анна Сергеевна Пугачёва 2 курс бакалавриата МОиАИС`23, СПбГУ Прогнозы

    результатов опросников «Большой пятерки» через анализ контента, публикуемого пользователями в социальных сетях: обзор решений