Upgrade to Pro — share decks privately, control downloads, hide ads and more …

카카오뱅크 고객의 금융 행동 패턴 파악하기

kakao
PRO
December 08, 2022

카카오뱅크 고객의 금융 행동 패턴 파악하기

#ML #NLP

고객의 금융 sequence 데이터로 고객이 카카오뱅크를 어떻게 이용하고 있는지 고객의 유형을 파악하고, 다음 행동을 예측하는 것을 목표로 합니다.
발표에서는 금융 sequence 데이터로 고객 행동 패턴을 분석하는 과정을 소개하고자 합니다.

발표자 : sunny.yun
카카오뱅크 빅데이터분석팀에서 고객과 상품/서비스 분석을 하고 있는 Sunny입니다.

kakao
PRO

December 08, 2022
Tweet

More Decks by kakao

Other Decks in Programming

Transcript

  1. 카카오뱅크 고객의 금융 행동 패턴 파악하기 윤지선 Sunny.yun 손재의 Mark.sohn

    카카오뱅크 Copyright 2022. Kakao Corp. All rights reserved. Redistribution or public display is not permitted without written permission from Kakao. if(kakao)2022
  2. Platform User Behavior Data

  3. Cluster Predict 고객의 유형 고객의 선택

  4. 분석 모델 모델 결과 - 고객 행동 예측 적용 -

    고객 행동 유형 나누기 정리 및 이후 방향성
  5. 고객 행동 데이터 결제 앱로그 거래내역

  6. 적용 대용량 데이터 학습(pre - training)하여 다양한 Task에 적용( fi

    ne - tuning) 언어모델와 행동 패턴 예측의 유사성 모델 선택 유사성
  7. 유사성 - 텍스트와 행동 패턴의 유사성 TEXT Behavior Model Next

    오늘 늦잠을 자서 출근 버스를 이체 신청 금액 입력 이체대상 확인 놓쳤다 이체완료
  8. 적용 - 다양한 task에 적용가능한 model Model Adaptation Data Clustering

    Prediction Feature Extraction Transformer, LDA
  9. LDA 고객 행동의 Topic을 파악하기

  10. LDA(Latent Dirichlet Allocation) Documents Topic Document Topic Topic Topic

  11. LDA - 적용 한식 x 1 커피 x 2 영화관

    x 1 백화점 x 2 카페 x 2 편의점 x 3 영화관 x 1 Topic 음식 쇼핑 문화 한식 0.5 커피 0.3 0.1 0.1 영화관 0.7 백화점 0.8 0.2 편의점 0.2 0.1 음식 x 0.7 문화 x 0.2 쇼핑 x 0.1
  12. Transformer 고객 행동 Sequence 패턴을 파악하기

  13. Attention The animal didn’t cross the street because it was

    too tired
  14. Sequence Recommendation w/ Transformer Transformer Action Sequence Embedding Prediction A

    B C Self Attention Layer … Pointwise - FFN Prediction Layer …
  15. SASRec vs BERT4rec Transformer Prediction + Cloze Task Unidirection Bidirection

    Next Item Masked Item SASRec BERT4Rec
  16. Cloze Task Input : Labels: [v1 , v2 , v3

    , v4 , v5 ] [v1 , [mask]1 , v3 , [mask]2 , v5 ] [mask]1 = v2 , [mask]2 = v4 Randomly Mask
  17. Transformer - 적용 … … Transformer Linear Layer Predict Next

    Item User Embedding Clustering Data
  18. 분석 모델 모델 결과 - 고객 행동 예측 적용 -

    고객 행동 유형 나누기 정리 및 이후 방향성
  19. 예측 모델 결과 비교 - 체크카드 ItemKNN POP BPR -

    MF SASRec BERT4Rec ItemKNN POP BPR - MF SASRec BERT4Rec [email protected] [email protected] 22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상
  20. 예측 모델 결과 비교 - 체크카드 ItemKNN POP BPR -

    MF SASRec BERT4Rec ItemKNN POP BPR - MF SASRec BERT4Rec [email protected] [email protected] Transformer Transformer 22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상
  21. Side Information A B C … … 가맹점 C 업종

    결제 시간 결제 금액 Emb Trm
  22. SASRecF DIF - SR ITEM F1 F2 Fusion func ITEM

    F1 F2 Att. Att. Att. Fusion func SR with Side Information
  23. 쇼핑몰 카페 패스트푸드점 영화관 Time Intervals 1일 1주 1일 Time

    Intervals 1시간 2시간 2시간 Next Item - A Next Item - B TiSASRec SR with Side Information
  24. 예측 모델 결과 비교 - 체크카드 SASRec BERT4Rec SASRecF DIF

    - SR SASRec BERT4Rec SASRecF DIF - SR [email protected] [email protected] 22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상
  25. 예측 모델 결과 비교 - 체크카드 SASRec BERT4Rec SASRecF DIF

    - SR SASRec BERT4Rec SASRecF DIF - SR [email protected] [email protected] 22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상 + Side Information + Side Information
  26. 분석 모델 모델 결과 - 고객 행동 예측 적용 -

    고객 행동 유형 나누기 정리 및 이후 방향성
  27. 고객 소비 유형 분류 결제 위치, 성별, 연령 기반의 소비

    현황을 넘어, 고객의 페르소나에 따른 소비패턴 파악
  28. 22.04.01 - ‘22.04.07 제주 지역 가맹점 결제 & 10건 이상

    결제 고객 현황 결제 업종 비중 편의점 26.8% 커피/음료전문점 6.7% 한식 6.6% 슈퍼마켓 4.7% 주유소 2.7% 비디오방/게임방 2.4% 휴게음식점 2.3% 면세점 2.0% ﹒﹒﹒ ﹒﹒﹒ 제주지역 가맹점 체크카드 현황
  29. 제주도민들의 핫플레이스는? 여행자들의 성지는? 고객들의 여행 스타일은? 우리가 궁금한 것은?

  30. 결제 Sequence BERT4Rec Emb. 
 + Clustering Group B Group

    A Group C B A
  31. Group B Group A Group C 주요 결제 업종 비디오방/게임방

    한식 기념품/면세점, 유통 주유/주차 카페/제과점 음식점 제주도민 비중 74% 11% 17% 제주도민 쇼핑족 여행자 식도락 여행자
  32. 앱 사용 패턴 분류 앱 로그 이벤트별 집계 현황을 넘어,

    고객의 앱 사용 패턴을 유형화 하여 이용 현황 파악
  33. Group B Group A Group C A B 
 +

    Clustering X : 이벤트 발생 순서 Y : Session 앱로그 Sequence
  34. Group A

  35. Group B

  36. Group C

  37. 고객 행동 패턴 변화 확인(코로나 전/후) 2019.12 2020.08 배달플랫폼A 배달플랫폼B

    편의점 비디오방/게임방 자판기 스터디카페 C대학교생협 코인노래방 공항면세점 호텔예약플랫폼A 숙박시설 항공예약사이트C 공항라운지 배달플랫폼A 배달플랫폼B 편의점 비디오방/게임방 자판기 스터디카페A + 복사/제본
  38. 서비스 런칭 후 고객 유형별 영향도 파악 수신거래 앱로그 체크카드

    A B C D E F G H 서비스 미이용 서비스 이용 A B C D E F G H A B C D E F G H
  39. 체크카드 수신거래 앱로그 앱로그&카드 거래&앱로그 거래&카드 거래&앱로그&카드 고객 유형 Dimension

    확장 고객 유형별 캠페인 반응율의 최대값 - 최소값
  40. 분석 모델 모델 결과 - 고객 행동 예측 적용 -

    고객 행동 유형 나누기 정리 및 이후 방향성
  41. 정리 모델 문제 이후 방향성 Transformer + Side Information LDA

    모델 성능 개선 고객 행동 범위 확장 Predict Cluster
  42. E.O.D