Slide 1

Slide 1 text

데이터 분석 정보 공유방 2024년 5월 생성형 AI와 함께하는 데이터 분석가 커리어

Slide 2

Slide 2 text

No content

Slide 3

Slide 3 text

지난 세미나 보러가기 지난 데이터리안 세미나 2024년 01월 2024년 03월 2024년 05월

Slide 4

Slide 4 text

진행 순서 생성형 AI 시대의 데이터 사이언스 쉬는 시간 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 시간 시간 연사 15:00 - 15:50 김진영 16:00-17:00 윤선미, 이보민, 김진영 15:50 - 16:00 시간 패널

Slide 5

Slide 5 text

연사&패널 현) 네이버 서치 Head of Data Science 전) Snap Lead Data Scientist 전) Microsoft Senior Applied Scientist 김진영 연사 현) 데이터리안 데이터 분석가 전) 잡플래닛 데이터 분석가 이보민 모더레이터 현) 데이터리안 데이터 분석가 전) 쿠팡, 하이퍼커넥트, 카카오 데이터 분석가 윤선미 패널

Slide 6

Slide 6 text

연사 소개 생성형 AI 시대의 데이터 사이언스 김진영 링크드인 네이버 서치 Head of Data Science 전) Snap Lead Data Scientist 전) Microsoft Senior Applied Scientist

Slide 7

Slide 7 text

패널 소개 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 윤선미 데이터리안 데이터 분석가 전) 카카오 데이터 분석가 전) 하이퍼커넥트 데이터 분석가 전) 쿠팡 데이터 분석가 링크드인

Slide 8

Slide 8 text

패널 소개 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 이보민 데이터리안 데이터 분석가 전) 잡플래닛 데이터 분석가 링크드인

Slide 9

Slide 9 text

김진영 현) 네이버 서치 Head of Data Science 저서) ʻ헬로 데이터 과학’ 생성형 AI 시대의 데이터 사이언스 1부 강연

Slide 10

Slide 10 text

연사 소개 검색 랭킹 & 품질 평가 관련 대학원 연구 MS & Snap에서 검색 및 추천 관련 업무 네이버에서 Data&Analytics 팀 리드 + 논문 / 저서 / 팟캐스트 등등 홈페이지: https://brunch.co.kr/@lifidea

Slide 11

Slide 11 text

연사 소개 https://slideplayer.c om/slide/4517578/

Slide 12

Slide 12 text

Data&Analytics팀 소개 네이버의 검색 및 추천시스템의 품질 평가 및 사용자 경험 개선을 위한 플랫폼 / 지표 / 분석까지 담당 (채용 문의 환영입니다!) 팀블로그: https://medium.com/naver-dna-tech-blog

Slide 13

Slide 13 text

Data&Analytics팀 소개

Slide 14

Slide 14 text

Data&Analytics팀 소개

Slide 15

Slide 15 text

목차 1. 생성형 AI, 어디까지 써봤니? 2. 생성형 AI 분석 활용 사례: NBA 선수가 되기 위한 조건은? 3. 생성형 AI와 함께하는 분석의 미래 발표 내용은 발표자의 사견임을 밝힙니다.

Slide 16

Slide 16 text

생성형 AI, 어디까지 써봤니?

Slide 17

Slide 17 text

생성형 AI 수용의 3 단계 실망/ 안심 깨달음 놀람/ 두려움

Slide 18

Slide 18 text

놀라움: 못하는게 없네? •GPT한테 다 시켜보자 • 데이터 가공 및 조인 • 가설 수립 • 모델링 • 시각화 • … 참고: https://brunch.co.kr/@lifidea/59

Slide 19

Slide 19 text

실망: 제대로 하는것은 없네… •GPT한테 다 시켜보자 • 데이터 가공 및 조인 • 가설 수립 • 모델링 • 시각화 • … •실망 • 한번에 제대로 하는 것은 별로 없음 • 정확히 원하는 결과를 얻기 어려움 • 기억상실증 / 튕겨나옴 / … 하지만, 범용 AI에 단순히 코딩 기능을 붙인 결과물이 이정도라면?

Slide 20

Slide 20 text

깨달음: 이런 변화의 본질은? • 기계가 자연어를 이해하고 말하게 되었다 • 인간이 기계어를 (Python / SQL) 배울 필요가 없어졌다 • 문제해결에는 필요에 따라 다양한 도구를 활용할 수 있다 (코딩/검색) • 언어와 함께 추론 및 문제해결 능력도 생겼다 • 논리나 문제 해결 방법도 결국 언어로 배우는 것이니… • 문제 해결력은 학습 데이터가 충분한 도메인에 국한된다 • 향후 몇년 안에 데이터 분석의 개념이 바뀐다 • 데이터 분석에 특화된 모델 / 플랫폼이 등장할 것이다 • 범용 솔루션을 개별 기업이 파인튜닝해 사용할 것이다

Slide 21

Slide 21 text

No content

Slide 22

Slide 22 text

AI 분석 활용 사례: NBA 선수가 되기 위한 조건은?

Slide 23

Slide 23 text

ChatGPT+ADA(*)를 활용한 분석 & 집필 노력만 하면 누구나 NBA 선수가 되느냐? 결론: 불가능은 아니지만 매우 어렵다 * ADA: Advanced Data Analytics (= Code Interpreter)

Slide 24

Slide 24 text

ChatGPT가 만든 지표 ʻMUGGSIES’

Slide 25

Slide 25 text

ChatGPT가 만든 차트

Slide 26

Slide 26 text

ChatGPT가 만든 테이블

Slide 27

Slide 27 text

관련 연구: 검색 품질 레이블링에 LLM을 활용한다면? 출처: Perspectives on Large Language Models for Relevance Judgment

Slide 28

Slide 28 text

ChatGPT 활용의 교훈 잘 되는 부분 • 단순한 분석 및 통계 작업을 상당히 잘 수행한다 • 자연어 이해를 바탕으로 데이터 클리닝 및 인코딩 수행 • 단순 코딩을 맡기고 분석 업무에 집중하게 도와준다 아쉬운 부분 • ChatGPT가 도출한 가설 및 결론은 대부분 상식적인 수준 • ChatGPT가 작성한 코드를 (SQL 등) 꼼꼼히 검수해야 함 • 세션 제한등을 고려해서 중간 결과를 저장해 두어야

Slide 29

Slide 29 text

AI 잘쓰기: 프롬프트 엔지니어링 커뮤니케이션 • 분석 요구사항을 명확하게 표현하기 • 결과물에 대한 정확한 피드백을 주기 리더십 / 조직 관리 • 업무 성과를 높일수 있는 조직 구조 짜기 • 개인과 팀의 성과를 평가하고 피드백을 주기 결국 다시 소프트 스킬인가?

Slide 30

Slide 30 text

CoT: AI에게 생각할 수 있는 여유를 주어라

Slide 31

Slide 31 text

Self-Consistency: 여러 AI가 협업할 수 있는 구조를 짜라

Slide 32

Slide 32 text

생성형 AI와 함께하는 분석의 미래

Slide 33

Slide 33 text

과연 AI와 함께하는 분석의 미래는 어떤 모습?

Slide 34

Slide 34 text

역시 미래 예측은 함부로 하는게 아닙니다… 하지만 주제가 주제인만큼 시도해볼게요.

Slide 35

Slide 35 text

향후 3년간의 LLM 기술 진보, 활용 범위, 그 영향력을 예측한다면… 2024 2025 2026 (and beyond) LLMs Next-gen Base LLMs (e.g. GPT5) LLMs fine-tuned for generic DS tasks LLMs fine-tuned for industry / organization Ecosystem AI-powered DS workbench Autonomous DS agents Agents for cutting edge research Adoption Startups Researchers Large Organizations Most professionals Everyone Impact on Industry Pre-emptive Hiring Freeze Shift in Labor Market Stabilized to post-AI defaults 출처: 저의 뇌피셜입니다…

Slide 36

Slide 36 text

두 가지 발전 방향: Copilot vs. Agent Copilot은 인간을 보조 / Agent는 자율적으로 과업 수행 Copilot과 Agent가 결합된 형태도 발전 Copilot Agent 분석 전문가와 상호작용하며 원하는 결과물을 만들어간다. (헙업을 위한 UX /피드백 기반의 fine-tuning등이 중요) 전문가의 지시를 받아 독립적인 분석 과업을 수행한다. (넓은 업무 수행 범위 및 자율적인 문제 해결이 중요)

Slide 37

Slide 37 text

AI가 분석가 개인과 조직에 미치는 영향은? 개인 관점 • 향후 AI는 전문가의 분석 역량을 향상시키고, 비전문가의 분석 업무에 대한 장벽을 낮출 것이다 • 일반적이고 반복적인 업무는 AI 에이전트에 의해 대체될 것이다 • 전문가는 새로운 문제와 방법론을 개발하고, AI의 업무 수행을 감독하는 역할을 맡을 것이다 조직 관점 • 향후 AI는 단위 인력당 조직의 분석 역량을 향상시킬 것이다 (전문가와 비전문가 포함) • 기술 스택은 인간과 AI 에이전트를 염두에 두고 재설계되어야 한다 • 개별 분석팀의 크기는 줄고, 다른 조직에 embed된 형태로 근무할 것으로 전망된다

Slide 38

Slide 38 text

전망: 이미 기계 번역이 초벌 번역 업무를 대체하고 있는것처럼, 요구 사항을 SQL로 번역하는 수준의 업무는 점차 사라질 것이다. Machine 번역가로서의 분석가 (aka SQL Monkey)

Slide 39

Slide 39 text

그렇다면 분석 업무의 본질은 어떻게 바뀔 것인가? 도메인 지식 통계학 프로그래밍 도메인 지식 통계학 프로그래밍 소프트 스킬 Data Science 스킬 다이어그램의 진화 (좌: 2020 / 우: 2030)

Slide 40

Slide 40 text

그렇다면 분석 업무의 본질은 어떻게 바뀔 것인가? • 기술적 역량의 중요성은 줄어들 것이다 • 코딩은 GPT가 / DS 도메인 지식은 Agent가 담당 • 전문 분석 Agent를 사고 파는 시장이 생길 수도 • 더 많은 분석가가 PM / TL의 역할을 담당? • 다양한 AI를 적재적소에 배치하여 문제를 해결 • AI의 업무 결과를 평가하고 가이드할 수 있어야 • 대체될 수 없는 전문가의 영역도 분명 있을것 • 트레이닝 데이터가 없거나 부족한 리서치의 영역 • 기밀 등의 이유로 내부에서 이루어져야 하는 업무 (예: 알고리즘 트레이딩) 도메인 지식 통계학 프로그래밍 소프트 스킬

Slide 41

Slide 41 text

데이터 과학의 본질은 언제나 문제해결이었다… 인간 수준의 분석 Agent가 나와도 인간이 해결해야 할 문제는 많다 (어떤 문제를 풀것인가? 데이터는 어떻게 수집할 것인가? … )

Slide 42

Slide 42 text

AI가 분석 산업과 잡마켓에 미치는 영향은? 개인 관점 • 향후 AI는 전문가의 분석 역량을 향상시키고, 비전문가의 분석 업무에 대한 장벽을 낮출 것이다 • 일반적이고 반복적인 업무는 AI 에이전트에 의해 대체될 것이다 • 전문가는 새로운 문제와 방법론을 개발하고, AI의 업무 수행을 감독하는 역할을 맡을 것이다 조직 관점 • 향후 AI는 단위 인력당 조직의 분석 역량을 향상시킬 것이다 (전문가와 비전문가 포함) • 개별 분석팀의 크기는 줄고, 다른 조직에 embed된 형태로 근무할 것으로 전망된다 • 기술 스택은 인간과 AI 에이전트를 염두에 두고 재설계되어야 한다

Slide 43

Slide 43 text

예측: 조직의 상황에 따라 늘어난 분석 역량을 활용하는 방법이 다를 것이다 ROI 관점에서 분석 니즈가 크지 않은 조직에서는 분석 조직의 규모가 줄어들 수 있다 대부분의 조직은 늘어난 분석 역량을 잠재적인 문제 해결에 활용할 것으로 전망된다

Slide 44

Slide 44 text

전망: 개별 조직에 임베딩된 분석가의 비중이 늘어날 것이다 Machine

Slide 45

Slide 45 text

전망: 모든 기술 스택은 (플랫폼과 데이터) 인간뿐 아니라 AI 에이전트가 활용하는 것을 염두에 두고 진화해야 한다. Machine AI 에이전트가 수행하는 AB 테스트를 플랫폼은 어떻게 지원해야 할까? AI 에이전트의 활용을 위한 데이터 카탈로그는 어떻게 디자인되어야 할까? 추측: 높은 신뢰성과 사용성을 갖도록 설계되고 문서화된 플랫폼과 데이터는 인간과 AI에게 모두 유용할 것이다.

Slide 46

Slide 46 text

DS 커리어를 어떻게 준비해야 할 것인가? •분석가로서 기술적인 이해는 여전히 중요 • AI의 업무 결과를 평가하고 가이드할 수 있는 역량이 필요 • 새로 등장하는 AI 트랜드 및 도구도 익히되 락인을 주의하자 •소프트 스킬과 도메인 지식이 핵심 역량 • 범용 분석 및 코딩 스킬은 아웃소싱하는 추세가 강화될 것 • 특정 도메인의 문제해결 과정의 전반을 폭넓게 경험하자 •자동화를 위한 플랫폼과 데이터는 중요 • 인간과 에이전트가 업무에 활용할 수 있는 데이터와 플랫폼은?

Slide 47

Slide 47 text

No content

Slide 48

Slide 48 text

1부 강연 Q&A 김진영

Slide 49

Slide 49 text

데이터리안 데이터 분석 정보 공유방

Slide 50

Slide 50 text

현) 마켓핏랩 솔루션사업부 전무 전) Media.Monks Head of Data & Digital Media 전) 데이터리셔스 한국 대표 송혜정 윤선미 김선영 현) 데이터리안 대표, 데이터 분석가 전) 쿠팡, 하이퍼커넥트, 카카오 데이터 분석가 모더레이터 7/8(화) 19:00 ~ 21:00 다음 세미나 데이터 분석가, 어떤 회사로 가야할까? 33,000원 10,000원 연사 패널 현) 데이터리안 데이터 분석가 전) 리디 데이터 분석가

Slide 51

Slide 51 text

패널: 김진영, 윤선미, 이보민 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 2부 패널 토크

Slide 52

Slide 52 text

Warming Up

Slide 53

Slide 53 text

Question 01 01/12 데이터 사이언티스트 / 데이터 분석가로서 어떤 커리어를 거쳐오셨는지 궁금합니다.

Slide 54

Slide 54 text

패널 소개 생성형 AI 시대의 데이터 사이언스 김진영 네이버 서치 Head of Data Science 전) Snap Lead Data Scientist 전) Microsoft Senior Applied Scientist 링크드인

Slide 55

Slide 55 text

패널 소개 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 윤선미 데이터리안 데이터 분석가 전) 카카오 데이터 분석가 전) 하이퍼커넥트 데이터 분석가 전) 쿠팡 데이터 분석가 링크드인

Slide 56

Slide 56 text

패널 소개 성장하고 싶은 데이터 분석가들을 위한 커리어 가이드 이보민 데이터리안 데이터 분석가 전) 잡플래닛 데이터 분석가 링크드인

Slide 57

Slide 57 text

Question 02 02/12 데이터 분석가, 사이언티스트는 어떤 하루를 보내는 지 궁금합니다.

Slide 58

Slide 58 text

Q. 데이터 분석가, 사이언티스트는 어떤 하루를 보내는 지 궁금합니다. 기존 분석가 업무 운영, 서비스 측면에서 - 어떤 분석이 필요한지 논의 - 분석 - 결과 공유 사업을 하면서 추가된 일 매출, 사업 전략면에서 - 어떤 분석이 필요한지 논의 - 분석 - 결과 공유 - 사용자 행동 데이터 수집 (New!) 데이터리안 캠프 서비스 페이지 새로 나온 ʻ회돈내산' 탭을 사람들이 잘 이용하나? 이 기능이 매출에 임팩트를 냈나? 다른 비슷한 사례를 찾아 개선해볼 수 있을까?

Slide 59

Slide 59 text

Question 03 03/11 데이터 분석가, 사이언티스트는 어떻게 다른가요?

Slide 60

Slide 60 text

데이터 분석가 커리어 & 성장

Slide 61

Slide 61 text

Question 04 04/12 데이터 분석가, 사이언티스트로서 역할을 잘 하기 위해서는 어떤 역량을 꼭 갖춰야 할까요? 주니어의 핵심 역량은 무엇일까요?

Slide 62

Slide 62 text

Q. 주니어 분석가의 핵심 역량은 무엇일까요? 하드 스킬 - 자주 사용하는 툴 숙지 (SQL 등) - 업무에서 새롭게 사용하는 툴 배우기 (GA4 등) 소프트 스킬 - 분석적 시각 (분석 프레임워크에 대한 이해 포함) - 문제를 해결하는 적극적 성격

Slide 63

Slide 63 text

Question 05 05/12 시니어 데이터 분석가 / 사이언티스트가 갖춰야할 핵심 역량은 어떤 것이 있을까요?

Slide 64

Slide 64 text

Question 06 06/12 주니어 분석가 / 사이언티스트가 직무적으로 성장하려면 어떤 일들을 해보면 좋을까요? 나만의 커리어 업그레이드 꿀팁이 있을까요?

Slide 65

Slide 65 text

Q. 나만의 커리어 업그레이드 꿀팁이 있을까요?

Slide 66

Slide 66 text

Q. 나만의 커리어 업그레이드 꿀팁이 있을까요?

Slide 67

Slide 67 text

Question 07 07/12 데이터 분석가 / 사이언티스트는 어떤 것을 성과라고 하나요?

Slide 68

Slide 68 text

Question 08 08/12 조직에서 성과를 내기 위해서는 어떻게 일을 해야할까요? 성과에 대해 고민하는 분들을 위해 해주고 싶은 이야기가 있다면 공유 부탁드려요.

Slide 69

Slide 69 text

Question 09 09/12 데이터 분석가가 성과를 내기 위해 조직은 어떤 노력이 필요할까요? (ex. 조직 구성, 사내 문화 등)

Slide 70

Slide 70 text

Q. 조직은 어떤 노력을 해야할까요? “실수 예방 문화에서는 실수를 한 사람을 비난하고, 처벌하고, 따라서 실수를 감추고 그에 대해 논의하기 꺼리며 문제가 생겼을 때 협력도 덜하게 됩니다. 실수에서 배우지 못하겠지요. 반대로 실수 관리 문화에서는 실수가 나쁜 결과를 내기 전에 빨리 회복하도록 돕고, 실수를 공개하고, 실수에 대해 서로 이야기하고 거기에서 배우는 분위기가 생깁니다. 이 부분이 굉장히 중요합니다. 그런데 “이런 실수 관리 문화가 회사에 정말 도움이 될까?”하는 의문을 가질 수 있습니다. 여기에 대해서 연구가 있습니다. 우선 회사 문화가 실수 예방보다 관리에 가까울수록 그 기업의 혁신 정도가 더 높습니다. 그리고 실수 관리 문화일수록 회사의 수익성(총자산이익률로 계산)이 더 높습니다. 왜 이런 현상이 나타날까요? 이유는 간단합니다. 실수가 없으면 학습하지 못합니다(고로 직원들에게 실수하지 말라고 하는 조직은 학습하지 말라고 지시하는 것과 같습니다).” 함께 자라기: 애자일로 가는 길 (김창준 저)

Slide 71

Slide 71 text

데이터 분석가 채용

Slide 72

Slide 72 text

Question 10 10/12 네이버에서는 어떤 사람을 데이터 분석가, 데이터 사이언티스트로 채용하나요?

Slide 73

Slide 73 text

Question 11 11/12 요즘 데이터 분석 채용 시장 트렌드는 뭐가 있나요? AI의 발전으로 채용 시장의 변화가 있는지도 궁금합니다.

Slide 74

Slide 74 text

Question 12 12/12 세미나 참석자 분들께 마지막으로 해주고 싶은 한마디!

Slide 75

Slide 75 text

SQL 데이터 분석 캠프 5/17 이번주 금요일, 얼리버드 40% 할인 마감 [무료] SQL 데이터 분석 캠프 맛보기 카카오, 리디, 잡플래닛 출신 데이터 분석가가 직접 가르쳐요. 이런 분들에게 추천해요 ● SQL로 직접 데이터를 추출하고 분석해야 하는 분 ● SQL 코딩 테스트를 준비하시는 분 ● 데이터 분석가로 취업, 직무전환 준비하시는 분 (이번주 금요일, 얼리버드 40% 할인 마감)

Slide 76

Slide 76 text

SQL 데이터 분석 캠프 SQL 캠프 | 마케터 정연님 SQL 캠프 | 분석가 엠마님 SQL 캠프 | 분석가 현승님 “실제로 캠프를 들어보고 나서 정말 만족했어요. 실무자 입장에서 데이터 분석에 필요한 SQL 문법을 배울 수 있어서 좋았어요.” “캠프를 수강한 후에 SQL이 익숙해지고 다가가기 쉬워졌습니다. RFM 분석, 매출 분석 같은 실무 분석 방법을 배울 수 있어요” “리텐션 분석, 코호트 분석 등의 분석 기법을 사용해서 인사이트를 뽑아낼 수 있게 되었어요. VOD 강의라 복습하며 실무에 적용하고 있습니다.”

Slide 77

Slide 77 text

데이터 분석 정보 공유방 세미나에 참여해주셔서 감사합니다