$30 off During Our Annual Pro Sale. View Details »

카카오뱅크 고객의 금융 행동 패턴 파악하기

kakao
December 08, 2022

카카오뱅크 고객의 금융 행동 패턴 파악하기

#ML #NLP

고객의 금융 sequence 데이터로 고객이 카카오뱅크를 어떻게 이용하고 있는지 고객의 유형을 파악하고, 다음 행동을 예측하는 것을 목표로 합니다.
발표에서는 금융 sequence 데이터로 고객 행동 패턴을 분석하는 과정을 소개하고자 합니다.

발표자 : sunny.yun
카카오뱅크 빅데이터분석팀에서 고객과 상품/서비스 분석을 하고 있는 Sunny입니다.

kakao

December 08, 2022
Tweet

More Decks by kakao

Other Decks in Programming

Transcript

  1. 카카오뱅크 고객의


    금융 행동 패턴 파악하기
    윤지선 Sunny.yun 손재의 Mark.sohn


    카카오뱅크


    Copyright 2022. Kakao Corp. All rights reserved. Redistribution or public display is not permitted without written permission from Kakao.
    if(kakao)2022

    View Slide

  2. Platform
    User
    Behavior
    Data

    View Slide

  3. Cluster Predict
    고객의 유형 고객의 선택

    View Slide

  4. 분석 모델


    모델 결과 - 고객 행동 예측


    적용 - 고객 행동 유형 나누기


    정리 및 이후 방향성

    View Slide

  5. 고객 행동 데이터
    결제
    앱로그 거래내역

    View Slide

  6. 적용
    대용량 데이터 학습(pre
    -
    training)하여


    다양한 Task에 적용(
    fi
    ne
    -
    tuning)
    언어모델와 행동 패턴 예측의 유사성
    모델 선택
    유사성

    View Slide

  7. 유사성 - 텍스트와 행동 패턴의 유사성
    TEXT
    Behavior
    Model Next
    오늘 늦잠을 자서 출근 버스를
    이체 신청 금액 입력 이체대상 확인
    놓쳤다
    이체완료

    View Slide

  8. 적용 - 다양한 task에 적용가능한 model
    Model Adaptation
    Data
    Clustering
    Prediction
    Feature


    Extraction
    Transformer, LDA

    View Slide

  9. LDA
    고객 행동의 Topic을 파악하기

    View Slide

  10. LDA(Latent Dirichlet Allocation)
    Documents
    Topic
    Document Topic
    Topic
    Topic

    View Slide

  11. LDA - 적용
    한식 x 1
    커피 x 2
    영화관 x 1
    백화점 x 2
    카페 x 2
    편의점 x 3
    영화관 x 1
    Topic
    음식 쇼핑 문화
    한식 0.5
    커피 0.3 0.1 0.1
    영화관 0.7
    백화점 0.8 0.2
    편의점 0.2 0.1
    음식 x 0.7


    문화 x 0.2


    쇼핑 x 0.1

    View Slide

  12. Transformer
    고객 행동 Sequence 패턴을 파악하기

    View Slide

  13. Attention
    The animal didn’t cross the street


    because it was too tired

    View Slide

  14. Sequence Recommendation w/ Transformer
    Transformer
    Action Sequence
    Embedding
    Prediction
    A B C
    Self Attention Layer

    Pointwise - FFN
    Prediction Layer

    View Slide

  15. SASRec vs BERT4rec
    Transformer
    Prediction
    + Cloze Task
    Unidirection Bidirection
    Next Item Masked Item
    SASRec BERT4Rec

    View Slide

  16. Cloze Task
    Input :
    Labels:
    [v1
    , v2
    , v3
    , v4
    , v5
    ] [v1
    , [mask]1
    , v3
    , [mask]2
    , v5
    ]
    [mask]1
    = v2
    , [mask]2
    = v4
    Randomly Mask

    View Slide

  17. Transformer - 적용


    Transformer
    Linear Layer
    Predict Next Item
    User Embedding
    Clustering
    Data

    View Slide

  18. 분석 모델


    모델 결과 - 고객 행동 예측


    적용 - 고객 행동 유형 나누기


    정리 및 이후 방향성

    View Slide

  19. 예측 모델 결과 비교 - 체크카드
    ItemKNN POP BPR
    -
    MF SASRec BERT4Rec ItemKNN POP BPR
    -
    MF SASRec BERT4Rec
    NDCG@10
    Recall@10
    22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상

    View Slide

  20. 예측 모델 결과 비교 - 체크카드
    ItemKNN POP BPR
    -
    MF SASRec BERT4Rec ItemKNN POP BPR
    -
    MF SASRec BERT4Rec
    NDCG@10
    Recall@10
    Transformer Transformer
    22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상

    View Slide

  21. Side Information
    A B C


    가맹점 C
    업종
    결제 시간
    결제 금액
    Emb
    Trm

    View Slide

  22. SASRecF DIF
    -
    SR
    ITEM F1 F2
    Fusion func
    ITEM F1 F2
    Att. Att. Att.
    Fusion func
    SR with Side Information

    View Slide

  23. 쇼핑몰 카페 패스트푸드점 영화관
    Time Intervals 1일 1주 1일
    Time Intervals 1시간 2시간 2시간
    Next Item - A
    Next Item - B
    TiSASRec
    SR with Side Information

    View Slide

  24. 예측 모델 결과 비교 - 체크카드
    SASRec BERT4Rec SASRecF DIF
    -
    SR SASRec BERT4Rec SASRecF DIF
    -
    SR
    NDCG@10
    Recall@10
    22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상

    View Slide

  25. 예측 모델 결과 비교 - 체크카드
    SASRec BERT4Rec SASRecF DIF
    -
    SR SASRec BERT4Rec SASRecF DIF
    -
    SR
    NDCG@10
    Recall@10
    22.04.01 - ‘22.04.07 체크카드 10건 이상 결제 고객 대상
    + Side


    Information
    + Side


    Information

    View Slide

  26. 분석 모델


    모델 결과 - 고객 행동 예측


    적용 - 고객 행동 유형 나누기


    정리 및 이후 방향성

    View Slide

  27. 고객 소비 유형 분류
    결제 위치, 성별, 연령 기반의 소비 현황을 넘어, 고객의 페르소나에 따른 소비패턴 파악

    View Slide

  28. 22.04.01 - ‘22.04.07 제주 지역 가맹점 결제 & 10건 이상 결제 고객 현황
    결제 업종 비중
    편의점 26.8%
    커피/음료전문점 6.7%
    한식 6.6%
    슈퍼마켓 4.7%
    주유소 2.7%
    비디오방/게임방 2.4%
    휴게음식점 2.3%
    면세점 2.0%
    ﹒﹒﹒ ﹒﹒﹒
    제주지역 가맹점 체크카드 현황

    View Slide

  29. 제주도민들의 핫플레이스는?


    여행자들의 성지는?


    고객들의 여행 스타일은?
    우리가 궁금한 것은?

    View Slide

  30. 결제 Sequence
    BERT4Rec Emb.

    + Clustering
    Group B
    Group A Group C
    B
    A


    View Slide

  31. Group B
    Group A Group C
    주요 결제 업종
    비디오방/게임방


    한식
    기념품/면세점, 유통


    주유/주차
    카페/제과점


    음식점
    제주도민 비중 74% 11% 17%
    제주도민 쇼핑족 여행자 식도락 여행자

    View Slide

  32. 앱 사용 패턴 분류
    앱 로그 이벤트별 집계 현황을 넘어, 고객의 앱 사용 패턴을 유형화 하여 이용 현황 파악

    View Slide

  33. Group B
    Group A Group C
    A
    B

    + Clustering
    X : 이벤트 발생 순서
    Y : Session
    앱로그 Sequence

    View Slide

  34. Group A

    View Slide

  35. Group B

    View Slide

  36. Group C

    View Slide

  37. 고객 행동 패턴 변화 확인(코로나 전/후)
    2019.12
    2020.08
    배달플랫폼A
    배달플랫폼B
    편의점
    비디오방/게임방
    자판기
    스터디카페
    C대학교생협 코인노래방
    공항면세점
    호텔예약플랫폼A
    숙박시설
    항공예약사이트C
    공항라운지
    배달플랫폼A
    배달플랫폼B
    편의점
    비디오방/게임방
    자판기
    스터디카페A
    +
    복사/제본

    View Slide

  38. 서비스 런칭 후 고객 유형별 영향도 파악
    수신거래 앱로그 체크카드
    A B C D E F G H
    서비스 미이용 서비스 이용
    A B C D E F G H A B C D E F G H

    View Slide

  39. 체크카드 수신거래 앱로그 앱로그&카드 거래&앱로그 거래&카드 거래&앱로그&카드
    고객 유형 Dimension 확장
    고객 유형별 캠페인 반응율의 최대값 - 최소값

    View Slide

  40. 분석 모델


    모델 결과 - 고객 행동 예측


    적용 - 고객 행동 유형 나누기


    정리 및 이후 방향성

    View Slide

  41. 정리
    모델 문제 이후 방향성
    Transformer


    + Side


    Information


    LDA
    모델 성능 개선


    고객 행동 범위 확장
    Predict


    Cluster

    View Slide

  42. E.O.D

    View Slide