728x90
여러개의 데이터 자료간의 상관성, 관계를 알아보는 시간
▶ 회귀분석
▶ 회귀분석을 공부하는 이유: 보통의 경우 결과를 설명하기 위해서 하나의 변수만 영향을 주지는 않음
결과를 종속변수, 종속변수를 설명하기 위한 변수들을 독립변수라고
▶ 회귀분석이란?
1. 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법
2. 대표적인 모형이 선형 회귀 모형
▶ 회귀분석의 장점
1. 대부분의 경우 결과를 설명하는 요인이 매우 많음
2. 둘 이상의 변수간의 관계를 보여주는 통계적 방법
3. 종속변수에 영향을 미치는 독립변수의 영향력을 판단가능
4. 여러변수의 영향력을 파악가능
▶ 주의점:
1. 인과관계를 설명해주지는 못한다
▶ 공분산: 2개의 확률변수(데이터)의 선형관계를 나타내는 값
▶ 공분산의 부호
1. - : 음의 상관관계
2. 0 : 상관관계 없음
3. + : 양의 상관관계
▶ 주의점!!!
1. 두 변수가 아무 관계없는 독립변수일때: 공분산 = 0
2. 공분산 = 0 : 두 변수가 독립은 아닐 수 있음
▶ 상관계수
피어슨 상관 계수: -1 ~ 1 사이로 표준화
1. 상황에 따라 기준이 조금 다르지만 절대값이 0.5~0.7 이상이면 강한 상관관계를 가진다고 봄
2. -0.2~0.2 정도인 경우 상관관계가 약하거나 없다고 해석
728x90
'• 패스트캠퍼스 데이터분석 부트캠프 12기 > Excel' 카테고리의 다른 글
Part 4.ch 03. 두 변수의 상관관계 분석하기 (0) | 2023.12.28 |
---|---|
Part 4.ch 01~2. 대표값으로 데이터 분포 파악하기, 이상치 탐지 (0) | 2023.12.28 |
Part 3.ch 02. 기술통계 (1) | 2023.12.28 |
Part 3.ch 01. 왕초보 고등학교 기초통계 (0) | 2023.12.22 |
Part 2.ch 03. 차트로 엑셀 데이터 쉽게 탐색하기 (0) | 2023.12.22 |