Blair  - Soul Eater 2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_12

• 패스트캠퍼스 데이터분석 부트캠프 12기

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_12

oujin 2023. 12. 29. 15:48
728x90

머신러닝(기계학습): 경험과 학습을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며 인공지능의 한 분야.

 

컴퓨터가 어떤 작업(T)을 하는데 있어서, 경험(E)으로부터 학습하여 성능(P)을 향상시키는 학문

 


지도학습: 지도학습은 정답이 있는 데이터를 활용해 데이터를 학습하고, 학습한 모델이 얼마나 정답을 정확하게 맞추는지 평가하는 학습이다.

분류, 회귀 문제들을 해결 가능하다

 

회귀: 연속형 수치의 입력값을 활용해 특정 수치를 예측

분류: 주어진 입력 값을 2개 혹은 여러 개의 결과값으로 분류

 

비지도학습: 비지도학습은 정답이 없는 데이터를 활용해 데이터를 학습하는 것. 데이터가 어떻게 구성되어 있는지, 혹은 어떻게 분류될 수 있는지에 대한 문제 해결

군집 문제 해결 가능하다


데이터 시각화; 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정

 

차트를 그릴때 고민 해야 할 것: 

1. 어떤 숫자로 차트를 그릴 것인가?

2. 어떤 차트가 숫자를 가장 잘 설명하는가?

3. 차트를 어떻게 디자인하는게 가장 효과적인가?

 

차트디자인:

예쁘게 꾸미는 것이 아니라 정보전달이 잘되게 디자인 해야함

1. 차트의 모든 데이터를 단색으로 변경(회색 추천) -> 회색

2. 차트에서 가장 중요한(강조해야 하는) 데이터 선정 -> 인천

3. 차트의 메인 컬러(1개) 선택 -> 주황

4. 2의 중요 데이터에만 3의 메인 컬러 적용

 

+ 데이터 레이블 숫자 추가

우클릭- 데이터 레이블 추

 

+차트의 윤곽선 제거: 데이터의 레벨이 달라질 때만 선을 그리기

보기탬 - 눈금선해제

 

+깔끔하게 하기

1. 선을 맞추기

2. 필요없는 선, 범례 등을 지우기

 

최종 그래프


콤보형 차트 : 2개 이상의 정보를 표현하는 콤보형 차트

2개 이상의 정보를 영역 선택을 한뒤, 막대선택 - 우클릭 - 계열차트 종류 변경

 

 

 


거품형차트: 숫자의 크기나 비율을 거품으로 나타냄, 거품의 위치, ㅋ,기, 색등을 활용해 정보를 표현

어떤 데이터의 현황을 볼 때 유용함

주의! 데이터 선택시 이름빼고 숫자값만 잡아야함!

ex) 거품 하나하나 각기 다른 고객을 나타냄,

거품의 크기=해당 고객의 총구매액,

가로 = 쇼핑몰 체류시간

세로 = 구매 물품 개

 

x , y , 거품크기 순서여야함

우클릭: 축서식

우클릭: 데이터 계열 서식 - 채우기 - 요소마다 다른 색 사용

 

 


폭포형 차트:  

증감 구할 때 첫번째는 첫번째 값을 그대로 적고 나머지는 각 시기에 대한 차로 증감을 구한다.

 

 

 

합계로 설정하기: 합계로 설정하고 싶은 막대를 선택하고 합계로 선택을 누르기


 

대시보드:  

피벗테이블 만들기- 피벗테이블 분석택- 슬라이서

차트 2개를 만들어서-> 하나는 슬라이서를 위한 피벗테이블과, 차트를 만드는 피벗테이블을 연결한다

 

 

내가 만들 대시보드의 레이아웃을 짜는게 중요함


+지도위에 시각화: x,y축으로 위치를 표현하기

위도 = y

경도 = x

 

사용자의 입장에서 목적에 부합하도록 데이터를 사용해야한다 


 

책추천:

1. 데이터분석가가 알아야 할 모든것 황세웅 지음 / 위키북스

2. Practicals Statistics for DATA Scientists 데이터 과학을 위한 통계 피터 브루스, 앤드루 브루스, 피터 게테크 지음 / 한빛미디어

 

 

몇몇 사람들은 비를 느끼고 다른 사람들은 그냥 젖는다

728x90