▶ 데이터사이언티스트는 어느 산업에서 일하는가?
기술, 금융
▶ 산업의 문제 정의가 분석가 업무에 미치는 영향
산업의 수익 구조에 따라 데이터 분석가의 분석 관점이 크게 바뀜
ex) 중고물품거래 플랫폼
같은 문제를 겪더라고 이유를 분석하는 관점이 다르다.
문제점:사기
당근마켓: :알 수 있는 정보가 제한적 - 쇼셜 활성화
중고나라: 개인대 개인의 거래 - 파트너센터 중계자
번개장터: 교환과정에서 확인이 안돼서 -안전결제
당근마켓: 광고 수수료, 광고 클릭수 -> 어떻게 하면 광고를 더 많이 누르게 할까
번개장터: 결제 이용 수수료, 결제 건수 -> 어떻게 하면 결제를 더 많이 하게 할까
▶ 다양한 직무가 있지만 데이터 분석가 직무의 신입/ 주니어에게 요구하는 역량은 비슷함
▶ 모든 분석은 사람을 중심으로 분석을 해야함
결제 시간, 요일보다 이때 결제를 한사람이 왜 그 시간에 결제를 했는지 알아보는게 중요함
서비스를 직접 사용해 보는 것이 좋음
▶ 고객으로부커 먼 직무일수록 CS , 통계 등의 기본 역량이 강하게 요구됨, 자동화가 기본 목적인 직무는 수요가 적은 경향이 있음. 기업의 규모에 따라서 석사, 박사 학위를 요구하는 경우도 있음
▶ 하드스킬: 파이썬, 시각화, r, sql - 취업에 있어서 필요 필수조건, 들이는 시간만큼 결과가 나오는 스킬, 가지고 있음을 증명하기가 상대적으로 용이한 스킬 - 코테와 포트폴리오로 증명
▶ 소프트스킬: 데이터 분석가 취업에서 충분조건, 시간을 많이 들여도 학습하기가 어렵다. 가지고 있음을 증명하기가 어렵다. - 구조화된 답변, 논리적 사고 등으로 증명
프로젝트를 하며 직접 작성한 코드 및 시각화 자료를 제출하며 하드 스킬 어필
과거경험을 어필하며 소프트스킬 어필
데이터 분석의 4단계 과정
1 묘사분석: 어떤일이 일어났는가 - 실제 현업에게 필요한 영역
2 진단분석: 왜 일어났는가 - 실제 현업에게 필요한 영역
3 예측분석: 무슨일이 일어날 것인가 - 입사 후 할 것으로 기대하는 업무 영역
4 처방분석: 우리는 무슨일을 해야 할 것인가 - 입사 후 할 것으로 기대하는 업무 영역
그래프를 보고 이 그래프를 보여주는 사람은 이 데이터를 통해 어떤 주장을 하고 싶어하는지 생각하기
수치의 변화보다 이 수치로 어떤것을 알 수 있는지에 집중하기
분석시 달성하고자 하는 목표와 연관되어 있는 숫자를 설정하고 이 숫자들을 위주로 분석을 진행하게 됨
이때 사용하는 숫자는 지표라고 하고 이 지표를 설정할때 , smart을 만족하는지 확인해야함
지표에는 어떤것이 있는지 왜 중요한지 어떤 데이터들로 산출이 되고 있는지 이해 할 수 있어야함
구체적인가
측정가능한가
달성가능한가
지표가 프로젝트의 목표와 연관이 있는가
완료 기한이 정해져 있는가
좋은 예시
북극성 지표 예시
우리 서비스 이 지표 올리면 대박난다
트위치: 오분 이상 영상 시청자 수
에어비엔비 일분기 안에 예약한 숙박의 개수
페이스북 10일안에 7명과 친구를 맺는 사용자의 수
숫자들이 다 중요한 것이 아니고 이미 중요한 지표는 거의 정해져 있음
그런 것들을 공부할 필요는 있음
상식적으로 어떤 지표가 중요한지 알고 있어야 함
지표를 잘 알기위해 공부해야 하는 것들이 있음
대부분의 서비스에서 사용하는 공통지표들에 대해 이해하기 위해서는 유저, 세션에 대해 이해 할 필요가 있음
세션: 오래 체류했는가 =페이지뷰
active user: 활성 = 방문
retention: 사용자가 얼마나 오래 유지되는지, 이때 유지의 기준은 방문으로 서수도 있고 구매로 할 수도 있음
선행지표 vs 후행지표:
퍼널분석: 유저가 서비스의 성장을 위해 필요한 액션까지 거처야 하는 단계를 정의하고 단계별 이탈률을 파악하여 가장 많은 이탈이 나는 구간을 확인. 광범위하게 쓰고 있는 분석방법
모바일 vs 데스크탑
신규유저 vs 재구매
구매많이하는 유저 vs 구매적게하는 유저 등으로 나누어 분석 가능함. 나누는 기준은 매우 다양함
AARRR: 고객유치, 활성화,리텐션.수익화,추천
▶ 비교가능한 집단끼리 비교하고 있는가?
겉으로 드러난 현상
목적과 문제를 정의 :정말 문제라고 할 수 있어야함
지표를 결정:현상과 충분히 상관성이 있는가
현재 상태를 파악: 설정한 지표를 기준으로 테이블 차트등으로 시각화하고 비교하여 련재 상황 파악
평가
원인을 분석: 난이도가 높다. 시간이 많이 소모됨. 따라서 직관적으로 판단함
해결방안 제시
▶ 프로젝트 진행시 5 why 기법을 적용하기
문제: 시간 외 근무가 많기 때문에 이를 해결하고자 한다
현황파악1: 수요일이 유독 시간 외 근무가 많다
해결방안: 수요일을 정시 퇴근 일로 지정
현황파악2: 수요일에 유독 1부서가 다른 부서에 비해 야근이 많다
해결방안: 수요일 정시 퇴근일 지정 및 1부서장에게 보고
...
역량부족 - 업무 교육
사기문제 - 평가기준 변경
부적절한 업무 분담 - 업분계획 프로세스 수정
▶ 현업에서 부딪히는 일상적인 일들:
요청 : 전주 대비 이번주 매출이 떨어짐 최근 두달간의 매출 추이를 확인해야갰다
답장 : 분석해서 줄때 뭐가 떨어졌는지, 얼마만큼 떨어진건지, 왜 떨어진건지 같이 알려줘야함
▶ 상관관계와 인과관계를 혼동하지 말것
▶ 상관계수의 함정
평균의 함정과 같이 상관계수의 함정 같이 주의
평균의 함정처럼 상관관계또한 아웃라이어에 민감하다. 이로인한 오해를 위해 반드시 상관성을 확인하고자 하는 두 변수의 산점도를 그려볼 필요가 있음
▶ 심슨의 역설
전체를 봤다면 이를 부분으로 나눠보는 시도를 해야함
전체에서 어떤 부분, 즉 어떤 속성이 중요한지 빠르게 파악 할 수 있는 도메인 지식이 있어야 함
▶ 컨설턴트 vs 인하우스
컨설턴트: 워라밸없음, 리포트 많이 씀, 발표 스킬 향상, 업무강도 쎔, 월급 높음, 업무집중도 높음
인하우스: 업무 외 할일이 많음, 업무집중도 상대적으로 낮음, 쿼리몽키, 팀장중요, 팀에 몇명있는지 중요, 데이터이해도(회사에서 매니저가 데이터를 어떻게 쓸건지 이해도가 높아야함), C level(문제의 본질을 건드리는 일을 하지 않음)
데이터 분석가 > 엔지니어 > 사이언티스트
▶ 커리어를 성장시켰던 방법들
선형대수학 공부를 수학과처럼 하기
네트워킹
회귀분석(업무에 적용)
인과추론
데이터분석가 데이터 사이언티스트 데이터 엔지니어
▶ omnibug 실제로 해보기
▶취업팁
▶ 프로젝트: 한개를 깊이 있게 : 수비 범위를 좁힐 수 있다.
가장 중요한 것은 문제 정의 그리고 why?
-어떤 문제를 풀려고 하는지, 왜 문제라고 내리게 됐는지
-왜 그 기준으로 그룹을 나눴는지 왜 그런 결론을 내리게 됐는지
지표 하나의 등락을 보고 결론을 내리는 것은 누구나 할 수 있다. 관련된 여러개의 지표를 다각적으로 봐야 한다.
▶ 포트폴리오 작성시 가장중점으로 넣어야 하는것:
1.하드스킬은 필수(파이썬, sql쿼리)
2. 어떤 상황인지(문제 정의),. 왜문제였고, 그문제를 뭘로 정의했는지, 푸는 방법, 그래서 어떤결과를 냈는지
▶ 이력서 작성 시
1.이력서에 기여도는 쓰지말것
2. situation , behavior, impact 순으로 쓰기
3. 너무 간단하면 역량 평가를 할 수 없고, 너무 자세하면 보지 않습니다. -> 현업의 용어 위주로 작성(채용공고참고)
4. 모델링 경험은 수학, 통계적 지식에 대한 엄청난 자신감이 아니라면 권장 안함
▶ 이력서 지원시
경력 3년 미만은 지원을 권장함
▶ 면접 시
준비한 대답 보다 질문에 잘맞는 대답이 중요하가
데이터 분석가는 왜를 중요시 여기는 경향이 있다. 스스로 충분히 납득이 되는 설명인지 계속 의심하기
▶ 이력서
주제, 성과(해당 프로젝트 이후 본 프로젝트 기록시 근거 자료로 활용), 참여인원, 담당업무 적기
▶ 파이널 프로젝트에 대하여
크롤링보다 api제공하는 데이터를 통해 데이터를 받아올수 있는지 확인하기.
크롤링에 가산점주는 곳은 하나도 없으므로 크롤링 시간 줄이기
모델링 하지 말고
문제정의 잘하기
개별 분석(팀원마다 보고 싶은 주제가 다를 경우 각자하고 얘기를 통해 공유)
RFM, 장바구니 분석 - 어떤 결과가 나와야 하는지 언제써야 하는지 고민해보기
▶ 현업 관련 질문
1. 쿼리머신 회사에 취직시 : 이직시 그 바쁜 와중에 본인만의 분석 프로젝트를 했음을 어필
2. 기능조직 vs 목적조직:
3. https://playinpap.github.io/
3. sql, tableau 실무에서 제일 많이씀
4. 모사적 분석 제일 많이 함, 지표뽑고, 지표와의 관계(선행, 후행), 대시보드 만들기
5. 비전공자 비율 높음
6. 파이썬, sql 역량이 중요함
7. 구조적으로 생각하기, 회사가 돈을 버는 구조 생각하기
8. 신입이 경력을 쌓기 좋은 회사: 데이터 리터러시가 좋은 회사, 무신사 , 쿠팡, 오늘의 집
9. 모든직무에서 데이터 분석을 해야함. 그래서 데이터분석가도 새로운 뭔가를 할 줄 알아야 함
10. 선형대수학 공부, 파이썬, sql 문제풀이 사이트 리트코드!!
11. 포트폴리오 하나를 제대로(필살기) 하고 부가로 두개정도
12. 소프트 스킬이 중요함
13. 토익 토스 중요하지 않음
14. 비슷한 주제 여러번 (가고싶은 분야가 확실하다면), 아니라면 여러 분야 프로젝트 해보기
15. 질문을 정확하게 하는 후배
16. 취업성공률을 높일 수 있는 활동(선형대수학, 증명하는 방법)
17. 신입채용이 없는 것으로 알고 있는데 채용공고에서 요구하는 경력이 없는 사람은 분석프로젝트로 어필하기
18. 실무면접이 가장 어려웠음,
19. 데이터분석가 직무 전망 좋음
20. 대학교 전공서적중에 통계책 보기
21. 문제를 정의하고 설계하는 능력 키우기: 첨삭 받기. 스타트업 CTO 찾아가서 커피챗 하기!!
22. 산업 정하기: 테크놀로지, 앱,웹서비스제공회사가 수요가 많음 -> GA4 공부하기
23. 도메인지식 쌓는 방법: GA4 (구글 애널리틱스) -> 지표들 이해하기, 지표들 해석하는 법
'• 패스트캠퍼스 데이터분석 부트캠프 12기' 카테고리의 다른 글
3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_10 (0) | 2024.01.14 |
---|---|
3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_09 (1) | 2024.01.14 |
numpy 기초 (0) | 2024.01.12 |
프로젝트 OT (0) | 2024.01.12 |
데이터 모델링 워크플로워 (0) | 2024.01.12 |