2. 도구에 맞는 매력적인 주제 및 가설 선정하기 3. 데이터 수집하기 4. 데이터 분석하기 5. 데이터 해석 및 가설 검증하기 포트폴리오 제작 6. 프로젝트 내용을 포트폴리오에 정리하기 프로젝트 진행 1. 주제 및 가설 설정하기 2. 데이터 수집하기 3. 데이터 분석하기 4. 데이터 해석 및 가설 검증하기 포트폴리오 제작 5. 프로젝트 내용을 포트폴리오에 정리하기
수 있음’ 예시 • SQL • 파이썬 • 구글 애널리틱스 • … 이미지 출처: ʻ당근 Data Analyst (인턴) | Cross Product Growth’ 채용 공고 이미지 출처: ʻ에이블리 신입 데이터 분석가’ 채용 공고 1. 기술 스택 분석가 필수 역량 분석 결과
도구 = ʻ가져온 데이터를 이렇게 구조화할 수 있음’ 예시 • RFM 분석 • 매출 분석 • 코호트 분석 • 리텐션 분석 • 퍼널 분석 • … 이미지 출처: ʻ크림 데이터 분석가’ 채용 공고 이미지 출처: ʻ당근 Data Analyst (인턴) | Cross Product Growth’ 채용 공고 분석 프레임워크 알아보기
무엇이 달라질까?’ 2. 가설 설정하기 • ʻ문제의 원인은 무엇일까? 어떻게 해결할 수 있을까?’ 3. 지표 정의하기 • ʻ가설을 어떤 숫자로 검증할 수 있을까?’ 4. 데이터 분석 방법 고민하기 • ʻ어떤 기술 스택과 분석 프레임워크로 데이터를 분석할까?’ 5. 데이터 수집 방법 고민하기 • ʻ어떤 데이터가 얼마나 필요할까?’ 주제 구체화하기
달라질까?’ • 1) 현상, 2) 문제, 3) 해결 시 기대 효과를 단계별로 생각해보자 • ❌ 안 좋은 예시 ◦ ʻ인스타그램 팔로워를 늘리고 싶다.’ • ⭕ 좋은 예시 ◦ 현상: ʻ인스타그램 계정이 성장하면서 댓글이 많아졌고, 모든 팔로워에게 같은 노력을 들여 소통하기가 어려워.’ ◦ 문제: ʻ계정 성장에 도움을 주는 팔로워를 더 효율적으로 관리할 기준이 없네.’ ◦ 해결 시 기대 효과: ʻ효율적인 소통 기준이 생기면, 소통에 드는 시간은 줄이면서 팔로워들의 소통은 유지/증가할거야. 2025년 1월 데이터리안 세미나 이재림님 강연 내용을 재구성한 예시
좋은 예시 ◦ ʻ소통을 열심히 하면 팔로워들이 좋아할 거야.’ → ʻ열심히', ʻ좋아한다'는 검증하기 어려움 • ⭕ 좋은 예시 ◦ ʻ최근 소통한 빈도와 상호작용 횟수에 따라 계정 성장에 기여하는 수준이 다를 거야.’ ◦ ʻ일부 핵심 팔로워가 계정 성장에 더 큰 영향을 미칠 거야.’ → 데이터로 측정 가능한 지표를 설정할 수 있고, 분석 결과에 따라 행동으로 이어질 수 있음 2. 가설 설정하기
후보 중 최종적으로 활용할 도구를 선정 • 주제와 도구의 연관성을 생각하자. • ❌ 안 좋은 예시 ◦ ʻ게시물 별 평균 조회수를 분석해 봐야지’ → 댓글 소통 효율화를 목적으로 했던 주제와 맞지 않음 ◦ ʻRFM 분석으로 그룹을 나눠봐야지’ → 해당 분석을 사용하는 목적이 구체적이지 않고, 분류 기준이 명확하지 않음 • ⭕ 좋은 예시 ◦ ʻRFM 분석을 활용하여, 팔로워를 Recency(최신성), Frequency(빈도) 관점에서 분류해야지. 표로 된 데이터를 수집해서 SQL로 분석해야겠다.’ 4. 데이터 분석 방법 고민하기
수 있도록 수집 방법을 구체적으로 기획 • ʻ인스타그램 댓글 데이터를 수기로 수집해야겠다' ❌ 안 좋은 예시 ◦ 댓글 내용만 복사 붙여넣기 ◦ 일부 게시물의 댓글만 수집 ⭕ 좋은 예시 ◦ 누가 남긴 댓글인지 구별할 수 있도록 팔로워의 ID 기록 ◦ Recency(최신성)를 분석할 수 있게 댓글을 남긴 날짜 기록 ◦ 게시물 업로드 주기, 소통 주기를 고려하여 3개월 간의 모든 댓글 데이터를 수집 5. 데이터 수집 방법 고민하기 이미지 출처: 2025년 1월 데이터리안 세미나 이재림님 강연 내용
공모전 데이터 활용 ◦ 공개 데이터 활용 (Ex. 캐글, 공공 데이터 등) ◦ 플랫폼에서 제공하는 나의 데이터 활용 (Ex. 가계부 어플 데이터, 스마트 워치 건강 데이터 등) 2. 직접 데이터 수집하기 ◦ 수기로 기록 (Ex. 수면 습관 기록, 식습관 기록, SNS 데이터 기록 등) ◦ 사용자 행동 데이터 분석 툴을 사용하여 수집 (Ex. GA4를 내가 운영하는 서비스에 연결하여 수집) 5. 데이터 수집 방법 고민하기 분석 프로젝트용 데이터 찾는 법
무엇이 달라질까?’ 2. 가설 설정하기 • ʻ문제의 원인은 무엇일까? 어떻게 해결할 수 있을까?’ 3. 지표 정의하기 • ʻ가설을 어떤 숫자로 검증할 수 있을까?’ 4. 데이터 분석 방법 고민하기 • ʻ어떤 기술 스택과 분석 프레임워크로 데이터를 분석할까?’ 5. 데이터 수집 방법 고민하기 • ʻ어떤 데이터가 얼마나 필요할까?’ 다섯 가지 질문에 모두 답 할 수 있는 주제라면, 해당 주제로 프로젝트 시작하기 주제 구체화하기
• 주제 선정에 시간이 오래 걸리는 것이 당연 • 그러나 우리는 채용 공고가 마감되기 전에 포트폴리오를 완성해야 한다 2. 완벽한 주제는 없다 • 주제 아이디어가 떠올랐다면 다섯 단계를 빠르게 거쳐보자 • 채용 공고를 다시 한번 살펴보고 아이디어를 얻어보자 3. 막혔다면 돌아가자 • 현업에서도 한번에 완벽하게 기획이 끝나지는 않는다 • 앞으로 돌아가는 것 자체가 분석의 품질을 높이는 과정 • 가능하다면 피드백을 받아보자
1. SQL 활용 • MySQL Workbench에 CSV 파일을 업로드하여 분석 • Google BigQuery에 CSV 파일을 업로드하여 분석 2. GA4 활용 • GA4 콘솔에서 분석 • 원본 데이터를 Google BigQuery로 연결하여 SQL로 분석 3. 파이썬 활용 • Pandas 등 파이썬 라이브러리로 분석 • 라이브러리로 MySQL, SQLite 등을 연결하여 SQL로 분석 분석 프로젝트를 위한 도구 활용법
형식이 다르면 분석하기 어려움 (Ex. 날짜 형식이 다 다름, 숫자/문자가 혼합되어 수집됨) 2. 결측치 처리 • 데이터가 수집되지 않은 것이라면 어떻게 처리할지 고민하기 (Ex. 해당 데이터를 제거, 평균값/0 등 다른 값으로 대체) • 아무런 행동이 없었다는 데이터가 수집된 것이라면, 결측치 자체로도 의미를 가짐 (Ex. 댓글을 남기지 않은 팔로워였다면, 이 데이터를 삭제했을 때 분석 결과가 달라질 수 있음) 데이터 분석하기
끝이 아니다 • ʻ그래서 어쩌라고?’ 에 답할 수 있어야 한다 ◦ ❌ 안 좋은 예시: RFM 분석을 한 결과, 이렇게 그룹이 나누어졌다 ◦ ⭕ 좋은 예시: 어떤 그룹의 비중이 가장 높았으며, 각 그룹별로 이런 소통 전략을 사용하는 것이 좋겠다 2. 앞에서 정한 분석 프레임워크를 기반으로 해석하자 • 주제 선정은 잘 했지만, 막상 분석 결과는 이와 동떨어지는 실수가 자주 발생 • 분석의 방향을 다시한번 확인하자 3. 논리적인 해석을 하자 • 어떤 논리로 분석 결과에 도달했는지를 보여주자
분석의 목적: 분석을 하는 목적, 목표 2. 결과: 분석의 결과 요약 3. (제안): 분석을 바탕으로 한 제안, 기획 4. (데이터 설명): 분석에 사용한 데이터에 대한 설명. 사용한 데이터의 기간과 범위, 데이터의 특이사항, 보고서에 사용한 용어의 정의 등이 포함됩니다. 5. 근거: 결과와 제안을 뒷받침하는 근거, 데이터 분석의 과정
수 없음 2. 헷갈리는 표현 쓰기 3. 기준을 정할 때 비즈니스적 설명 없음 4. 멋있는 툴에 연연하기 5. 잘 모르는 내용에 대해 쓰기 6. 읽는 사람은 관심 없는 프로젝트 과정에 대해 서술하기 포트폴리오의 완성도를 높이는 팁 4가지 1. 맞춤법 검사하기 2. 일관성 있게 표현하기 3. 액션 아이템 추가하기 4. 한계점에 대해 언급하고 개선 아이디어를 이야기하기 포트폴리오 작성 팁
분석 3. 데이터 가공 방법 4. 결론 특징 - 작업의 시간 흐름대로 구성 - 작업 내용을 다 보여줌 - 핵심(왜 분석을 했는지, 그래서 결론이 뭔지)에 대한 내용 부재 보고서의 구성 ⭕ 매력적인 보고서 1. 문제 정의 2. 결론 3. (선택) 실행 계획 4. 분석 세부 사항 특징 - 작업을 보고서 형식으로 재구성하여 핵심부터 빠르게 파악할 수 있음
• 작성 내용: A 프로모션 분석으로 매출 5천만원 달성 • 문제점: 기업의 실제 지표가 그대로 노출되어 보안 의식이 부족해 보임 / 비교할 기준점이 없어 기여분을 생각하기 어려움 ⭕ 좋은 예 • 작성 내용: 마케팅 프로모션의 서비스 진입부터 결제까지 퍼널 분석하여, 이전 프로모션 대비 구매 전환율 15% 증가 • 특징: 비율을 사용하여 성과를 표현하여 민감한 대외비 수치를 노출하지 않음 / 지표 개선의 기여분이 구체적임 정성적 성과 ❌ 안 좋은 예 • 작성 내용: 고객 분석을 통해 조직 내 인사이트 도출, 비즈니스 의사결정에 기여 • 문제점: ʻ인사이트 도출', ʻ의사결정에 기여'라는 표현은 너무 모호함 ⭕ 좋은 예 • 작성 내용: 퍼널 분석 시 고객별 세분화를 통해 특정 고객군의 이탈률 상승을 발견하여, 해당 단계의 사용성 개선 • 특징: 분석 결과를 바탕으로 기획 변경, 업무 방식 효율화 등 구체적인 액션이 있었다면 중요한 성과로 볼 수 있음