Blair  - Soul Eater 1. 빅데이터 이해하기 & 데이터 리터러시_오수은 강사님

• 패스트캠퍼스 데이터분석 부트캠프 12기

1. 빅데이터 이해하기 & 데이터 리터러시_오수은 강사님

oujin 2023. 12. 19. 14:12
728x90

 

1. 왜 데이터 드리븐이 중요한지

-digital transformation 기존의 업무 프로세스와 새로운 기술과 사람과의 융합

빅데이터는 가장 강력한 enabler이다.

-데이터 기반한 가치 창출이 서비스 사업 경쟁력의 원천 ->

인사이트를 바탕으로 어떻게 행동, 시도해 봄직하다고까지 나와야 분석에 가치가 있다.

-데이터 드리븐은 데이터를 기반으로 의사결정을 하는 것을 의미. 데이터가 모든 의사결정을 좌지우지하는 것

-반복적인 프로세스-어떤 직무를 맡던 계속 필요하다. 설립한 가설이 맞는지 의심과 검증을 하는 것이 데이터 관련한 일을 하는 사람의 기본적인 예의이자 행동해야 할 것임

-데이터를 활용하는 곳

제품(앱, 웹):pm, 기획자와 일하면서 제품을 더 많이 사용할 수 있는 방법 찾기

사업: 사업, 운영팀과 함께 사업 성장 시키는 방법 찾기

마케팅: 마케터와 함꼐 사업, 사업을 성장할 수 있는 방법 찾기

예측모델: 머신러닝, 딥러닝, 통계, 예측 모델 구축 및 관리

-데이터기반 의사결정 사례

(무신사)

고객, 판매 데이터 꾸준히 수집 (잘 팔리는, 상품, 디자인, 상하의 매칭)

무신사 스탠다드 자체브랜드 출시

수집된 데이터 즉각 상품에 반영후 개선을 수차례 걸쳐 매 시즌 출시함

(지피클럽)

화장품 출시 전 다년간 국내 브랜드의 중국 진출을 대행하며 데이터수집

중국인들이 피부광 중시 결론 도출

꿀광 윤광 청과 라인출시 및 45그람의 에센스??

(나우버스킹)

맛지브카페 웨이팅을 위해 모바일 메신저 카카오톡으로 대기시간, 순서 알려주는 웨이팅 서비스

고객 세분화와 특화된 쿠폰제시와 재방문율과 이용률 향상

1시간 이상 대기 손님에게 감사문자와 할인쿠폰제공했더니 항의전화 감소함

-ai, data 사례, 프로젝트 기사 읽기

스타트업 사례를 볼 때 그 서비스에는 어떤 기술이 필요했을까를 생각하면서 기술기사 읽기

-마이데이터

고객의 자산관리 수요를 효과적으로 파악하기 위한 데이터 분석이 금융회사의 핵심 역향으로 자리 잡을 것

전문 인력을 충분히 확보하고 데이터 분석결과가 경영환경에 적극 반영될 수 있도록 내부 프로세스를 정지해야 한다.

-해외은행들의 빅데이터 활용사례

도이치방크: sns 활동내역 분석 후 신용평가 점수에 합산

씨티은행: sns데이터 분석 결과 신용도 하락 가능성 발견 시 대출, 신용카드 발급제한

Boa: 대출심사, 신용리스크 조기 경보, 온라인 마케팅 등 활용

*금융권에서는 데이터이용한 분석이 더 중요해짐. KP) 통합조회, 결합되는 추세이다

 

2. 언제부터 데이터 드리븐이 중요했고 언제까지 갈 것인지

-데이터관점+시스템아키텍처관점+분석 및 비즈활용관점 =종합적인 이해 필요

데이터관점: 3V(Volume, Velocity, Variety)(볼륨, 실시간처리, 정형/반정형/비정형)  +complexity

시스템아키텍처관점:open Source S/W(하둡), 분산병렬처리(큰 문제를 작은 걸로 나눠서 각각을 해결해 합치면, 각각의 해결이 서로에게 영행을 미치지 않는다

-빅데이터로부터 actionable insight 발굴하는 게 중요하다

-빅데이터 기반의 새로운 가치창출

-데이터 유형/기술 발전으로 분석 기법의 변화를 가져옴

-주목받은 AI

-AI개요

AI, 빅데이터 응용

AI, 빅데이터 기술: 인공지능+빅데이터

SW: 클라우드 컴퓨팅, 시스템 SW, 컴퓨팅 시스템

-인공지능을 통해 가치를 찾기 위해 빅데이터가 필요하고

빅데이터가 있어야 정확도가 획기적으로 증가함

-AI가 얼마나 양질의 데이터를 학습했는지

-따라서 공생관계 상호보완 관계

-모델은 재학습, 추가학습을 하기에도 데이터와 인공지능은 상호보완 관계

-자연어 처리 기술 기반 인간지식 학습 증거 기반 해답제시

1. 인간의 언어로 된 수많은 지식정보 이해

2.knoeledge base 구축

3. 인간이 자연어로 질문

4.knoeledge base 답 찾기

5. 증거기반의 답변을 인간의 언어로 제시

-ai서비스 적용사례

-IBM Watson: 의료분야자동암진단 -오늘 새로운 환자가 찾아왔다. 약과 환자 상태를 주면 ai가 의견 제시/

+ 자동 번역 앱(워드렌즈) +자연어처리(답변도출과정)

-Google:구글포토

-네이버 적용사례:n드라이브 사진분류-사진업로드 시 카테고리를 나눠 사진을 자동분류함, 컴퓨터가 동물사진 데이터를 많이 학습했기 때문에 동물 사진의 패턴을 인지, 유사한 패턴을 가진 이미지가 들어오면  카테고리 자동 분류

-카카오적용사례:바로 이거

-분석기술이 실제 업무와 접목이 될 때 가치창출에 대한 것이 중요함

가트너는 인공지능이 실제 생산 환경에 적용된 것이 19 퍼라고 발표함

인공지능이 점점 더 주류 기술로 올라옴

-ai에 대한 언급, 관심 증가

떠오르는 ai: 챗지피티와 generative ai는 ai 트렌드의 선두주자, 확장성, 다기능성 등 측면에서 기업의 운영 방식을 변화시킬 것

ai리스트 관리: ai사용이 증가함에 따라 윤리적 문제, 학습 데이터 오염등 새로운 리스크에 노출되었고 이를 완화할 필요성 직면

윤리적, 범죄 등 책임감 있는 사용이 중요해짐. 아프리카에 있는 노동자를 데려다가 챗지피티의 답변을 검토하는 강화학습을 진행했었는데 노동비가 싼 아프리카 직원들을 데려다가 한 게 윤리적으로 문제가 되었었음. 생성형 모델이 어떤 답을 내놓을지 예측하기 어려워졌음.

-생성형 ai: 입력된 데이터를 통해 사용자가 우너 하는 결과를 유추해 텍스트 오디오 비디오 형태의 결과물을 만들어 내는 ai 알고리즘

알고리즘을 사요 해 많은 데이터 분석해 패턴을 학습하고 해당 학습을 새로운 출력을 생성

-생성형 ai 공개 플랫폼의 활용사례: 챗지피티, 미드저니, 코덱스->제공받은 코드가 내가 의도한 방향과 동일한지, 코드가 정확한지, 이 제공받은 코드가 없더라도 내가 한 프로세스를 진핼 항 줄 알아야 얘가 틀렸는지 맞았는지 알 수 없고 왜 이 코드가 나왔는지 이해가 안 가기 때문에 스스로 코딩 실력이 있어야 하고 보조 수단으로만 사용해야 한다.

내 코드에 오류가 없는지 연습용으로 병행하는 것은 ok

-생산형 ai가 나오면서 스타트업이 많이 생김

-1. 챗지피티 정보 서비스 시장의 패러다인 변화: 검색->생성+검색

브라우저경쟁:pc(netscape vs ms) ->모바일(구글 vs ms) ->ai(구글 vs ms)

생성된 정보와 웹정보를 합침: bing

지피티 4에 대항해 하이퍼클로버 서비스 등장

2. 산엽별 적용

3. 생성 ai플러그인 생태계의 출현: 애플의 '앱스토어'에 비견되는 openai의 챗지피티 '플러그인' 생태계 출현

플러그인이 나오면서 실시간 업데이트 문제 해소

익스피티디아데이터+ 나의 고객 데이터 더해서 사용하게 해 준다는 얘기= 누구나 챗지피티와 협업가능

-멀티모달 ai모델 :제미나이: 텍스트, 영상, 코드 등 학습해 활용할 수 있는 모델이다.

-바드에서는 제미나이가 반영된 ai모델 사용가능, 단 영어만 가능

 

비즈니스별 사례

1. 제조공정불량예측

2. 사내구성원보이스텍스트분석

3. 자연어처리 기술을 활용한 건설 분야 텍스트 표준화 및 추천

4. OCR 기반 영수증 인식 및 분류모델개발

 

데이터를 시각적으로 표기/ 결과에 대한 시각화 필수

 

3. 데이터 관련일

데이터 리서치 사이언티스트: 논문 연구 및 집필, 모델개발, 핵심알고리즘

 

-데이터분석가: 보유한 데이터를 통해 문제를 정의하고, 기술을 접목하여 문재를 해결.

즉 어떤 문제를 정의하고 어떤 분석기법을 사용하여 사전에 정의한 문제를 어떻게 해결할 것인지 고민하는 사람

데이터에 대한 이해, 현업담당자만큼 데이터를 이해하겠다는 포부, 비즈니스적인 상황에 적용을 할 수 있는 사람

 

-데이터 분석가는 여러 직군으로 표현가능

product analyst: 앱서비스 ㅞㅇㅂ서비스 사용자의 행동로그 분석, 게임회사 분석가들은 유저의 행동데이터 이탈률, 로그데이터 분석

business analyst: 재무회계, 사업의 성장, 매출, 수익률 분석

퍼포먼스, crm marketer: 광고전략 수립, 광고모델선정 의사결정 및 효과 극대화 위해 데이터를 위해 풀어보려는 사람, 고객데이터 많이 봄

데이터사이언티스트: 분석 및 컨설팅 역량 요구

 

-데이터엔지니어: 데이터 웨어하우스로 데이터 복사 및 전처리 후 이동, 클라우드 환경에서 데이터 웨어하우스 구축해서 데이터 저장함. 데이터 저장뿐만이 아니라 서비스를 팔기 시작함. 로그데이터 전처리, 모델링등 원하는 기술을 도입.

 

4. 필요한 역량 준비할 것

-프로그래밍 역량: 데이터 처리 및 핸들링 영역

r, python, sql

하둡, 스파크와 같이 대규모 db 플랫폼 이해

-통계, ml, dl: 분석 방법론에 따른 업무 절차

수학, 통계적인 방법론

문제 해결 및 결과 해석 능력

-도메인지식:특정 산업, 업무에 대한 저 문지식

문제 발굴 능력

결구 어떻게 일하고 있는지 기존 방법에 대해 느끼려고 해야 의미 있는 결과물이 나옴->싱가포르 인턴 할 때 느낌

-커뮤니케이션 스킬: 발표, 제안, 시각화 등 데이터 기반의 스토리 텔링 능력

 

-채용공고에서 가장 자주 등장하는 데이터 분석 툴 7가지

1. 파이썬 텐서플로우 파이토치, 쉽고 직관적인 프로그래밍 문법이 장점

수칙연산, 데이터처리, 시각화까지 모두 처리할 수 있어 데이터 분석 업무에 넓게 사용

ml, dl

2.R 통계분석에 유리한 언어, 효과적인 시각화, 단 용량이 많아지면 느림, 파이썬에 비해 느린 수행 속도

3. 엑셀

4.sql 데이터베이스에 저장되어 있는 데이터를 추출해 사용. 배우기 쉽다. 기획, 마케터도 배움

5. 타블로: 코드 없이 시각화 및 대시보드 생성, 업무 보고 할 때 좋다.

나만의 레이아웃을 만들어 놓으면 안에 자료만 바꾸어 정기적인 보고서로 활용가능

6. 파워 bi: 보고자료 많이 만드는 쪽이라면 이 툴을 잘 사용할 수 있는 것도 강력한 무기

7. 구글 analytics: 마케팅에 국한해서 쓰인다고 생각하기 쉽다

하지만 ga는 웹로그 데이터 분석에 범용적으로 쓰이는 대표적인 분석 툴

 

자격증:

한국데이터산업진흥원: 빅데이터분석기사, 데이터분석 전문가 등 7가지

AWS: Data Analytics Specialty, Machine Learning Specialty

AZURE: DS Associate, DA Associate, POWER BI DA Associate

Google Data Analytics Certificate

 

-텍스트 데이터 다룬다면 초거대 언어모델에 대한 이해도 중요함

 

5. 데이터사이언티스트가 하는 일

비즈니스이해

데이터마이닝

데이터정제

데이터 eaploration

reature engineering

predictive modeling

데이터시각화

 

+ 추가로 준비할 것

채용공고 확인하기

각 회사 기술 블로그

모두의 연구소 모두레터: 이메일로 정리해서 보내줌, 관심 있는 건 따로 찾아보기

최신 기술이나 트렌드는 간단한 거 커뮤니티 구독해서 읽어보기

기초 다루는 것과 동시에 최신 기술 트렌드 알아야 함

 

6. 데이터 분석가에 관한 QnA ◀ 클릭!  
  1. 빅데이터 전문가가 되기 위해 가장 필요한 역량 1가지, 빅데이터 분석 활용방법이 궁금합니다.  -끊임없는 의심, 확인하는 과정이 필요함. 이 과정에서 슈퍼바이저나 동료와 함께 일을 하는데 효과적으로 설명
  2. 인사(HR) 데이터와 관련 사례가 궁금합니다. -구성원의 업무 만족도, 어떤 커뮤니티의 화성도가 제일 ㄹ높은지 모델분류 결과, 데이터 현황 시각화 가 인사데이터가 될 수 있음. 면답 설문 관련 자연어, 인적정보가 나열된 인적정보나 급여 입사일 퇴직일과 같은 정량적 데이터라면 퇴직률이 높고 낮은 흐름. HR Analytics, People Analytics 사례 찾아보기
  3. 데이터 분석가와 데이터 사이언티스트가 사용하는 머신러닝의 차이점을 알고 싶습니다. -없음. 차이라면 필요한 환경. 어떤 모델을 사용하는지 모델, 조건, 성능이 제일 중요하다는 관점인지 아정성이 중요한 관점인지 적절한 모델을 선택하기 때문에 모델을 적용하는 환경이 중요한 것임. 다루는 데이터의 양, 상황에 대한 이해가 더 필수적임
  4. 이번 부트캠프를 듣는다고 취업이 보장되지 않을 수 있다고 생각합니다. 강사님께서 생각하시기에 추가적인 공부 또는 프로젝트와 같은 경험이나 취업 조언을 해주신다면 어떤 게 있을까요? -부트캠프에서는 툴에 대해 배움. 절대 이것만으로는 되지 않음. 케글이나 데이콘 추천. 공모전에 나가서 데이터를 열어보고 어떻게 생겼는지 , 전처리 해보는 걸 추천, 공부용 데이터들은 깨끗하고 잘 정돈되어 있음, 그러나 현업에서 사용하는 데이터는 준비 안되어 있는 경우가 대부분이다. 현실감 있는 데이터 경험 해보기, 케글의 분석 예제 정리 해놓은 것 읽어보고 감잡아보고 따라 해보고 코드 바꿔보면서 정리하기.(몰랐는데 알게 된 것, 이 예제에서 접근한 방법과 이유), 나만의 프로젝트 한 사이클 돌리기!!!
  5. 분석에 사용하는 데이터의 출처 / 소스가 궁금합니다. (어디에서 데이터를 끌어오는지가 궁금합니다. 기업내부인지, 외부인지가 궁금합니다.) -보통 회사에서 진행하는 프로젝트는 회사 내부 데이터이다. 데이터 엔지니어나 직접 추출하는 경우도 있음. 회사의 규모, 구성, 본인 역량에 따라 다름. 보통은 메인 소스가 있고 추가 데이터로 사용할 수 있는 공공데이터가 있는지 확인함
  6. 데이터 시각화 직무에 관심이 있는데 해당 분야에 취업하기 위해 갖춰야 항목 및 해당 직무의 전망이 궁금합니다. -시각화는 어딜 가도 할 수 있음. 자신 있는 도메인과 엮어서 하기. 많은 예제를 보는 걸 추천!!!, 태블로, 파이썬(seaborn library, plotly, dash(app)) , 시각화를 보고 사람들이 이해할 수 있게 보는 사람 입장으로 시각화를 하기
  7. 데이터 분석 관련된 취업 현황과 비전 그리고 해외 취업에 대해서 궁금합니다. -호황이었다가 많이 닫힌 추세. 코로나 끝나가면서 재택근무의 비중이 줄면서 얼은 분위기. 그러나 직군이 세분화되어 있고 도메인 따라서 다름. 데이터 추출하고 바라보는 업무에 치중될 수도 있고 예측 모델을 고도화하는 업무를 맡을 수도 있음. 따라서 본인의 역량에 맞춰서 가봄직한 분야에서 어떤 직무를 뽑는지 검색 많이 해보기. 분석 관련 스킬+현황 조사, 해외취업은 한국에서 경력을 쌓고 
  8. 데이터 분석 관련 직종 중 가장 많이 취업을 하는 직종은 무엇인가요?(데이터 분석가, 데이터베이스, 데이터 사이언티스트) -데이터 분석가와 데이터 엔지니어 데이터 사이언티스트가 하는 일이 다다름. 그러나 데이터 분석가가 제일 범용적임
  9. 데이터 분석을 하면서 분석툴을 잘 다루는 것도 당연히 중요하지만 그 밖에 중요한 것이 있는지 궁금합니다. 예를 들면, 분석 데이터에 접근하는 관점이나 태도, 경력자와 신입이 명백하게 차이나는 순간들은 어떤 경우가 있는지도 궁금합니다. -정답이 없는 경우가 많다. 문제를 어떻게 정의하고 어떻게 풀겠다는 상황에서 나의 접근방법을 논리적으로 설명해야 되는 상황이 많이 생김. 그래서 나의 이 생각을 의심하고 검토해라. 모델이 내뱉은 값을 검증하고 고민하는 태도가 매우 중요함. 경력과 신입의 차이는 프로젝트의 타임라인을 생각하지 않고 너무 고민에 빠지다 보면 큰 틀에서의 타임라인을 어그러트리지 않는 선에서 고민하기. 데드라인과 큰 태스크 안의 작은 태스크를 이해하면서 고민을 하기, 전반적은 프로젝트의 일정, 보고하고 만족시켜야 하는 대상에 대한 이해가 필요함, 조건이나 관점이 달라지기 때문. 그러나 조직이면 다 그렇지 않을까요.
  10. 부트캠프 수강생들이 취업을 위해 가장 중요하게 생각해야 할 것은 무엇인가요? -결국에 이쪽 분야는 많은 게 쏟아져 나옴. 눈뜨면 새로운 것이 나옴. 유연하게 적응하고 대처가 필요하. 기록하는 습관이 중요한 듯. 몰랐던 것(TIR)을 적는 것. 코드 관련 기록, 혹은 트렌드 기록.
  11. 현업에서 어떻게 데이터를 수집하여 활용하는지가 궁금합니다. - 넘어감
  12. 비전공자가 데이터 분석가로 취업하려면, 필요한 스펙이 어느 정도일까요? -직무에서 내가 해야 하는 일이 뭔지 예상해야 함. 관심이 있는 산업군과 매치하기. 
  13. 인사 채용 분야에서 데이터 분석가가 할 수 있는 일들이 무엇인지, 어떠한 역량이 필요한지 궁금합니다. -nlp, 인적정보 대시보드
  14. 비즈니스 별 데이터 특성을 혼자 공부할 수 있는 방법, 준비한 포트폴리오가 취업하고자 하는 산업과 관련 없는 도메인일 때? 무조건 희망산업군과 관련된 주제로 진행한 프로젝트가 있어야 하는지가 궁금합니다. -관련 있는 도메인이어야 좋다. 부트캠프에서 사용한 거 그대로 사용하면 안 됨. 이미 준비된 ㄴ주제로 하는 것은 별로임. 내가 추가로 진행한 게 있어야 함. 이것을 발판으로 내가 뭘 해봤다고 구성하는 게 중요함. 그리고 다른사람잉 떻게 했는지 보는 걸 추천. 포트폴리오 다른 사람은 어떻게 만들었는지 보기.
  15. 빅데이터가 유명해진지 꽤 되어서 다양한 직군들, 비전공자들도 데이터 관련 업종에 뛰어들어서 오히려 데이터 관련 직종이 마냥 블루오션은 아닐 수 있다는 말을 들었는데 이 부분에 대한 강사님의 의견이 궁금합니다. -본인이 잘해볼 수 있을 것 같은 도메인 정하기. 
  16. 앞으로 발달할 AI 산업에서 빅데이터 분석 역량이 어떤 식으로 발휘될 수 있을지 전망이 궁금합니다. -좋은 모델은 많이 나왔음. 그 모델이 우리 회사에서 사용할 만한가. 우리 회사에서 어떻게 사용할 것인가를 파악하고 있기. 결국에 현실에서의 우리회사의 수준과 우리회사에서 준비한 데이터와 현재 레벨에서 할 수 있는 분석 수준파악 + 우후죽순 생겨나는 기술들 파악. 현실세계에 도입할 수 있는 능력
  17. 데이터를 분석하는 직종들은 기술적인 분야에 집중된 직종과 인문학적인(기획 등...) 분야에 조금 더 치우친 직종으로 나뉜다고 생각합니다. 혹시 후자의 직종은 무엇이 있을지 궁금합니다. 혹은 현업의 경우에서는 전자와 후자 중 어떤 분들이 더 많은가요? it기획이 인공지능을 활용한 걸 해보고 싶은 회사가 많음. 트렌드를 더 많이 봄. 기획이라는 업무가 이런 것이 핫하고 다른 회사가 뭐를 했고 결과가 어땠는지 아는 걸 중요함. 트렌드에 민감해야 한다. 기술을 접목했을 때 상상력, 자원 같은 걸 상상해 보기, 서베이와 리서치를 잘 정리하는 습관이 중요함.
  18. 빅데이터와 데이터를 직무에서 어떻게 이용하고 계신지, 취업을 희망한다면 어떻게 준비하면 좋을지 질문드립니다. -넘어감
  19. 데이터 분석 직무 취업을 위해 관련 자격증이 필요한가요? 필요하다면 어떤 자격증을 취득하는 것이 좋을까요? 산업별 선호되는 자격증이 있을까요? -그렇게 까지 필수적인 것은 아님. 포트폴리오가 잘 구성되어 있거나 빨리 딸 수 있으면 따던가. 아니면 클라우드 환경에서 일하다가 따는 경우가 있음
  20. 실무자의 입장에서 부트캠프를 통해 실습하는 학습 내용들이 현업(데이터 분석) 실무와 어느 정도 연관되는지 궁금합니다.  - 부트캠프에서는 최대한 많이 본떠서 만들었겠지만. 준비가 되어있는 내용임. 현실에서는 데이터 분지 데이터 전처리가 제일 시간이 많이 걸림, 
  21. 데이터 분석 분야가 진입 장벽이 많이 높은 듯한데, 부트캠프 외에도 어떤 추가적인 활동들이 취업률을 높이는데 도움이 될지 궁금합니다. -포트폴리오 부캠 의존하지 않기 다른 사람 거 보고 따라 하기 내 거 따로 해서 정리하기. 전반적인 한 프로세스를 진행하기. 데이터 가지고 와서 전처리 모델해 보고 결과가 나왔는데 내가 이걸 어떻게 해석했는지 한 사이클 해보기
  22. 빅데이터 분석가와 데이터 분석가는 다른 건가요? 차이가 있다면 어떤 점인지 궁금합니다! -다를 게 없음
  23. 어느 정도 실력이 되어야 실무투입이 가능한지가 궁금합니다. -대답하기 어려움. 강사님의 경우 고객사에 가서 고객의 데이터를 받아서 컨설팅식으로 하는 거라 분석역량이 다들 높음(기본은 함), 
  24. 본인이 잘 모르는 분야(저 같은 경우에는 금융)를 데이터를 본다고 분석할 수 있을 것이라 생각은 들지 않는데 괜찮은지? -다른 사람이 해놓은 데이터를 많이 보기. 사기탐지, 이상탐지 어떻게 접근, 사용지표, 판단근거와 기준을 보기
  25. 졸업 이후 따로 개인 프로젝트를 하셔서 포트폴리오 준비를 하셨나요? -학교 다니면서도 했고 졸업하고 나서도 했고 인턴에서 했던 거 정리하기. 사실 실무를 하면서 사이드 프로젝트 하는 사람도 많음. 업무에서 새로 알게 된 기술을 공공데이터에 적용해 보던가 회사 공모전에 나가보기, 업무와 개인 사이드프로젝트 연계하는 분위기의 조직이 많다.
  26. 취업 면접 과정 어땠는지? 소요기간은 어느 정도였나요? -강사님의 경우라 다름
  27. 어떤 성향의 사람들에게 적합한 직무인 것 같나요?  -J가 많고 섬세하고 디테일 놓치지 않고 이상치를 제거해야 하나? 왜 발생했지? 하는 집요함. 이런 게 퀄리티를 결정하기 때문에 중요함  
  28. 강사님께서 생각하시는 패스트캠퍼스 커리큘럼의 스킬들 이외에도 중요하다고 생각하시는 부분이나 스킬이 있으신가요? -정리하기
  29. 데이터 리터러시가 데이터를 읽고 쓰는 능력이라 알고 있는데, 이런 데이터 리터러시 역량을 갖추었다고 하는 수준이 어느 정도인가요?  -계속 쌓아 나가야 하는 것. 실제 데이터를 잘 다루는 능력, 어떤 방식으로 데이터에 접근하는지 방법론 같이 익히기. 손이 굳으면 안 되고 듣는 게 되게 많아야 한다. 듣고 말하기가 많아야 한다.
  30. 이제 데이터 분석에 대해 입문하게 되는 학습자들에게 해주고 싶으신 말씀이 궁금해요! -쉬운 일은 아닌 것 같음. 스트레는 받을 수 있는 학문임. 그만큼 정답이 없고 내가 길을 정하는 것에 따라 길이 다양함. 따라서 길을 잃지 않게 내가 할 수 있는 거 하고 싶은 거 세상이 원하는 것을 정해서 길을 잘 선택하기.
  31. 강사님이나 주변 관련 직무 현업자분들의 커리어패스 사례가 궁금합니다. -컨설턴트 분들이 오실 때도 있음. 다양한 도메인에 대해 빠르게 익히는 경우, 개발자 분들, 비전공자 분들은 데이터사이언스보다는 리포트를 작성하는 데이터 분석가로 자주감. 아니면 인턴이나 내가 관심 있는 도메인에서 관련된 직무애 취업하고 일을 하는데 거기서 다루는 도메인 지식과 데이터를 받아서 자체적으로 사이트 프로젝트 다루기. 
  32. 엑셀, 파이썬, sql, 태블로 이외에 데이터 분석가로 취업하기 위해 추가로 공부하면 좋은 것이 있는지 궁금합니다. 포트폴리오는 어느 정도로 준비해야 하는지 궁금합니다. Power BI나 Google Data Studio도 실무에서 많이 쓰이는지 궁금합니다. 데이터 분석 코딩테스트는 어떤 것을 주로 준비해야 하는지 궁금합니다. (sql, 파이썬 등등), 나중에 데이터분석가에서 데이터 엔지니어로 전향이 가능한지, 전환가능하다면 데이터분석가로 일한 것들이 도움이 되는지가 궁금합니다.  -마케팅이나 대시보드를 만드는 게 주업 무면 파워비아이 씀. 그러나 잘 안 씀. 코테는 데이터 추출이면 sql중요함 그러나 모델을 고도화 개선 개발이면 파이썬 시험봄. 전향할 수 있음 그러나 주 언어가 다름. 도움은 될 수 있으나 전문성에서 다름. 전향이 쉽지 안
  33. 인공지능 분야가 빠르게 발전하면서 현재 chat gpt와 같은 여러 서비스들이 사용 가능한데,  데이터 수집과 정리, 그리고 결과 도출을 하는 과정에 있어서 ai에게 데이터분석을 맡기는 게 더 효율적이고 빠르지 않을까요? 그렇다면 이 분야에서 ai가 인간을 대체할 텐데 그럼에도 불구하고 데이터 분석을 배워야 하는 이유는 무엇이 있을지 궁금합니다. -그 정보를 검토할 수 있는 눈이 필요
  34. 전문성을 키우고자 대학원 진학을 고려 중인데 무엇을 준비해야 할까요? -어떤 분야를 가고 싶은지. 데이터를 많이 보고 수요가 있는 학문이 어딘지 확인하기. 분야를 따지고 가는 게 훨씬 유리함.
  35. 데이터 마케팅과 데이터 분석 업무의 가장 큰 차이는 무엇일까요? -분석을 해서 마케팅 전략을 세우는 것임. 마케팅에 도움을 되게 위해 데이터 분석을 하는 것임
  36. 실무에 들어가게 되면 보통 하루 일과가 어떻게 되는지 무슨 일을 하는지 알고 싶습니다. -넘어감
  37. 데이터 분석가 포트폴리오 작성 시 가장 중요한 포인트 한 가지가 궁금합니다. -이걸 보여줄 회사가 나를 어떻게 느끼는지 생각을 하면서 작성하기. 많다면 다 넣지 말고 연관되어 있는 거 위주로 작성하기. 툴 같은 경우도 손 많이 가는 걸 하기.  툴도 주로 쓰는 것만 넣기. 프로그래밍 언어 하나 익히면 다른 거 익히기 그렇게 어렵지 않음. 일단은 다루는 걸 흡수해 보고 우선순위를 두기
  38. 주어진 데이터에서 어떤 지표를 확인하고 어떻게 활용해야 하는지 감이 안 잡히는 경우가 있습니다. 이런 역량을 어떻게 하면 키울 수 있을까요? -다른 사람들이 어떤 지표를 왜 썼는지 많이 쓰는 이유 찾아보고 정리하기
  39. 데이터 분석가의 직무가 금융과 이커머스 분야에서 어떤 차이점이 있는지 궁금합니다. -이커머스 실시간으로 쌓이는 데이터가 많음 그러면 sql이 더강조되지 않을까 생각이 들음
  40. 강사님께서는 계열사와 고객사 데이터를 다루셔서 다양한 도메인을 다루신다고 하셨는데, 한 도메인의 내부 데이터가 아니라 이처럼 다양한 도메인을 다룰 수 있는 기업으로 이직하신 이유가 있으신지 궁금합니다.
  41. 관심도메인에 대한 문제를 직접 정의해 보고, 이를 해결하는 프로젝트를 진행해서 이를 포트폴리오로 만든다고 가정했을 때 취업준비생 입장에서 원하는 데이터를 얻기가 쉽지 않을 것 같습니다. 혹시 직접 데이터를 수집한다고 했을 때 그 데이터도 유의미할지 궁금합니다. (아주 작은 프로젝트이지만 포트폴리오로서 사용되기 위해서는 어느 정도의 모수가 적절한지도 궁금합니다.) -크롤링, 블락을 당함. 이런 경험 맨땅에 헤딩하는 유의미한 경험, 전처리한 경험, 전처리한 데이터로 내가 뭘 하려고 했는지, 
  42. 퍼포먼스 마케터는 구글 애널리틱스나 메타와 같은 툴을 주로 사용할 것 같고, 해당 툴 내에서도 유의미한 데이터를 많이 뽑아낼 수 있다고 생각합니다. 혹시 마케터 직군이 파이썬이나 SQL을 사용하는 경우도 자주 있을까요? -마케터 직군은 sql은 조금 쓰는 것 같음, 월별 리포트, 데이터 추출해서 보는 경우도 있지만 직접 실시간으로 체크가능 
  43. 좋은 빅데티어란? -현업에서 메타데이터가 없는 데이터가 많음. 그러다 보니 양질의 데이터. 기본적인 머신러닝 돌리려면 1만 개 있어야 함. 실제로 데이터 수집을 하지 않거나 주요 정보를 갖고 있는 데이터는 수집을 안 해놓고 쓸모없는 정보만 있는 경우가 있음
  44. 이번 빅데이터 이해 및 데이터 리터러시 강의에 대해 수강생들로부터 기대하는 이해도가 있는지 , 현업의 자료들로 포함되어 있고 향후 툴 학습이나 데이터 분석 직무에 대한 역량을 쌓기 위해 본 강의에서 얼마만큼을 이해하고 제 것으로 만드는 것이 좋을지 궁금합니다. - 용어와 사례 알기. 분석을 하면 너무 기술적인 것에 대해서만 고민을 하는데 기술은 기본이고 분석을 해서 뭐 어쩔 건데에 대한 대답을 스스로 해봐야 함. 이것만 알아도 가치 있는 시간일 것이다.
  45. 포트폴리오 -노션이나 깃허브 병행해서 썼음. 마주쳤던 에러, 진행했던 프로젝트 회고, 외부에 노출하기 어려운 것들 기록용, 편한 방법으로 하기
  46. 현업에서 일하실 때 강사님 보다 나이가 많은 주니어 직원이 있었을까요? 강사님 혹은 주변분들께서 나이 많은 신입 직원과 일할 때 어려움 혹은 고충사항이 있었는지 궁금합니다.
  47. 프로젝트마다 KPI가 다르겠지만, 데이터 분석 직무 자체로 봤을 때의 핵심 KPI가 있을까요?
  48. 인하우스 컨설팅 외에도 데이터 분석 및 시각화를 전문으로 하는 업체가 좀 있을까요? 대외비 성격이 강한 내부 데이터의 특성상 이러한 외주 업체들의 전망이 궁금합니다. 또 이러한 업체 혹은 산업의 종사자들은 포트폴리오를 어떻게 공유하는지 궁금합니다. (*고객사의 사례를 어디까지 공개해도 될지..?) -업스테이지, 라온피플, 포트폴리오 준비는 취준은 필수이고, 현업에 있는 사람들은 사례를 공개하는 것이기 때문에 오히려 안 좋을 수도 있음, 공개가능한 범위정도가 업마다 다름. 어느 회사의 어느 문제를 풀었다 정도만 하는 편.

 

 

 

 

728x90