728x90
***OVER VIEW***
데이터 탐색 사례에서 어떤 대표값을 바탕으로 데이터를 탐색하는지 알기
EDA를 통한 변수의 특징 파악
다양한 통계기법을 파악해 변수가 정규성을 가지는지 파악
어떤경우에 어떤 통계기법을 사용하는지
차트로 데이터 시각화
● 대표값을 통한 데이터 탐색
-수집된 데이터로부터 통계량을 측정
-통계량을 통해 집단의 특성을 파악
● 기술통계
-테크니컬의 기술이 아니라 적다의 기술임
-각각의 세부항목에 대해서는 PART 3에서 자세히 다룸
● 기술통계법을 이용한 수치 요약
● 엑셀 내장함수를 통한 수치요약
● 엑셀 피벗차트를 이용한 시각화
● 파이썬에서의 기술통계 및 시각화
●차트로 데이터 탐색 사례
-좌석, 생존에 따른 연령 분포 등
●분포를 확인 할 때 함께 확인해야하는 수치
-분포의 중심: 평균,중위값,최빈값 등
-퍼짐 정도: 분산,표준편차,사분위수,변동계수
-분포의 모양(비대칭성): 왜도,첨도
-산점도,박스플롯
● IRIS 데이터셋
변수간 상관관계분석
시각화
●상관관계가 높은 변수를 찾는것도 중요하지만 상관관계가 없는 데이터셋을 찾는것도 중요하다!
● 결측치,이상치 데이터 탐색 사례
728x90
'• 패스트캠퍼스 데이터분석 부트캠프 12기 > Excel' 카테고리의 다른 글
Part 2.ch 03. 차트로 엑셀 데이터 쉽게 탐색하기 (0) | 2023.12.22 |
---|---|
Part 2.ch 02. 데이터 탐색과 통계 필요성 (0) | 2023.12.22 |
Part 1.ch 03. 데이터 실습을 위한 엑셀 예제 csv 파일 찾기(Kaggle) (0) | 2023.12.22 |
Part 1.ch 02. 데이터 분석과정과 탐색적 데이터 분석(EDA) (0) | 2023.12.22 |
Part 1.ch 01. 비전공자도 기본적인 통계 기초가 필요한 이유 (0) | 2023.12.22 |