Blair  - Soul Eater 2. 친근한 엑셀로 실무 엑셀 데이터 분석시작하기(이동훈 강사님)_01

• 패스트캠퍼스 데이터분석 부트캠프 12기

2. 친근한 엑셀로 실무 엑셀 데이터 분석시작하기(이동훈 강사님)_01

oujin 2023. 12. 20. 12:16
728x90

 

  차산업 시대에서 제일 중요한 능력은 데이터 리터러시 능력이다.

 

데이터 리터러시:

  기술적:데이터유형, 데이터 개수, 데이터 계급종류, 데이터 계급개수,계급별 데이터 개수, 데이터 합계, 데이터 평균, 데이터중앙값, 데이터 최대값, 데이터 최소값 등

  해석적: 데이터의 의미를 파악하고 유용한 정보를 알나내는것

 

데이터 리터러시가 중요한 이유:

1. 인류가 2000년 동안 생산한 정보의 앵이 2010년에는 1주일에 1번씩 생산됨

2. 우리는 넘처나는 데이터를 모두 볼 수 없다.

정보가 너무 넘치면 정보의 가뭄과 비슷하다.

3.필요한 데이터를 선별 할 수있는 역량이 필요하다.

 

데이터분석:

  유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원 하는 것을 목표로 데이터를 정리, 변환, 모델링 하는 과정.

  데이터 분석은 여러 면과 접근 방식이 있고, 다양한 이름의 다양한 기술을 아우르며 각기 다른 비즈니스, 과학, 사회과학 분야에 사용.

  오늘 비즈니스 부문에서 데이터 분석은 의사 결정을 더 과학적 으로 만들어주고 비즈니스를 더 효율적 으로 운영 할 수 있도록 도와주는 역할.

->현실에 살고있는 우리를 더 나은 미래로 나아가게 할 열쇠

내가 실제로 하고 있는 업무에 대해 내 경험에서 비롯된 나만의 정의가 있는지!

 

데이터분석의 목적: 인사이트를 도출하기

  다양한 데이터- 분석기법 활용- 문제발견- 원인파악- 해결방안모색- 인사이트도출

과거: 왜 문제의 원인이 발생했는가?-문제의 원인이 무엇인가?

현재: 문제발생

미래: 문제를 어떻게 해결할 것인가?- 문제가 다시 발생하지 않게 하기 위해 어떻게 변화해야 하는가?

 

데이터사이언스:

  수학, 통계학, 컴퓨터공학 및 다양한 학문,비즈니스 분야가 융합된 학문이므로 데이터 사이언티스트에게도 다양한 분야의 지식과경험이 반드시 필요

  컴퓨터사이언스,IT + 수학,통계 + 도메인,비즈니스 지식

 

데이터사이언티스트: 데이터 분석

시티즌 데이터 사이언티스트: 다른 주업무에 데이터분석을 활용

  데이터 분석을 할 수 있는 직무,산업 전문가

  시티즌 데이터 사이언티스트 육성을 통한 데이터 관련 직문 인력 부족 현상 해결

-Snorkel $ Dive: 넓은 시야로 데이터를 바라보다가도 필요한 순간에는 데이터에 숨겨진 의미를 파악하는 수준까지 깊게 파고듦

-Be Patient: 한번에 완벽하게 끝나는 데이터 분석은 존재하지 않으며, 끊임없는 반복의 연속

-Fun & Fun: 때로는 지루하고 고단한 데이터 분석도 더 나은 미래를 위한다는 즐거운 마음으로

 

데이터 분석 프로세스:

데이터 분석예시: 머신러닝 기법을 활용한 대졸 구직자 취업 예측 모델에 관한 연구

문제정의: 대졸자 취업률이 지속적으로 낮아지고 있다.

분석목적: 대졸자의 여러 특성을 바탕으로 취업여부를 예측하고 취업에 중요한 영향을 줄 것으로 기대되는 주요 변수 도출

데이터수집: 졸업자 대상으로 설문조사

데이터전처리: 데이터 탐색 및 이해, 가공하기 쉬운 형태로 전처리

데이터모델: 의사결정나무, 랜덤포레스트, 인공신경망, 검증 평가

데이터시각화: 사람들에게 설득력있는 시각화

결론도출: 경제적 지원 뿐만 아니라 구직자들의 목표 의식 구체화 시키고 심리 건강을 증진시킬 수 있는 다양한 프로그램 및 제도 마련 필요

 

분석결과: 취업에 중요한 요소1위: 경제적지원

해석: 대학교졸업직후 취업여부를 조사한 데이터로 분석을 진행한 것이다

경제적 지원을 많이 받은 사람일 수록 취업률이 낮음을 확인 했다.

경제적지원을 받았다면 취업준비를 더 할것이다.

따라서 취업 지원자체가 감소하여 취업률이 감소한 결과가 나왔을 것이다.

 

엑셀을 활용하여 데이터 분석하기:

 

엑셀을 왜 배워야 하는가?:

  가격이 저렴하고 난이도도 낮게 데이터를 다룰 수 있음

  회사에서 많이 쓰임

 

엑셀을 잘 한다는 것은:

  사용자 입장에서: 사용자가 누구인지, 사용자가 원하는 정보가 무엇인지

  목적에 부합하도록: 왜 이 자료가 필요한지, 어떤 관점이 있는지 , output이 무엇인지

  자료를 구성하는것: MECE, Visualization , Simple $ Easy

728x90