Blair  - Soul Eater Part 2.ch 01. 데이터 탐색 사례

• 패스트캠퍼스 데이터분석 부트캠프 12기/Excel

Part 2.ch 01. 데이터 탐색 사례

oujin 2023. 12. 22. 11:21
728x90

***OVER VIEW***

데이터 탐색 사례에서 어떤 대표값을 바탕으로 데이터를 탐색하는지 알기

EDA를 통한 변수의 특징 파악

다양한 통계기법을 파악해 변수가 정규성을 가지는지 파악

어떤경우에 어떤 통계기법을 사용하는지

차트로 데이터 시각화

 


● 대표값을 통한 데이터 탐색

-수집된 데이터로부터 통계량을 측정

-통계량을 통해 집단의 특성을 파악

 

● 기술통계

-테크니컬의 기술이 아니라 적다의 기술임

-각각의 세부항목에 대해서는 PART 3에서 자세히 다룸

 

● 기술통계법을 이용한 수치 요약

● 엑셀 내장함수를 통한 수치요약

● 엑셀 피벗차트를 이용한 시각화

● 파이썬에서의 기술통계 및 시각화

 

●차트로 데이터 탐색 사례

-좌석, 생존에 따른 연령 분포 등

 

●분포를 확인 할 때 함께 확인해야하는 수치

-분포의 중심: 평균,중위값,최빈값 등

-퍼짐 정도: 분산,표준편차,사분위수,변동계수

-분포의 모양(비대칭성): 왜도,첨도

-산점도,박스플롯


●  IRIS 데이터셋

변수간 상관관계분석

시각화

 

●상관관계가 높은 변수를 찾는것도 중요하지만 상관관계가 없는 데이터셋을 찾는것도 중요하다!

 

● 결측치,이상치 데이터 탐색 사례

 

 

728x90