Blair  - Soul Eater Part 3.ch 03. 회귀분석, 공분산, 상관계수

• 패스트캠퍼스 데이터분석 부트캠프 12기/Excel

Part 3.ch 03. 회귀분석, 공분산, 상관계수

oujin 2023. 12. 28. 11:09
728x90

여러개의 데이터 자료간의 상관성, 관계를 알아보는 시간


▶ 회귀분석

회귀분석을 공부하는 이유: 보통의 경우 결과를 설명하기 위해서 하나의 변수만 영향을 주지는 않음

결과를 종속변수, 종속변수를 설명하기 위한 변수들을 독립변수라고 

회귀분석이란?

1. 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법

2. 대표적인 모형이 선형 회귀 모형

회귀분석의 장점

1. 대부분의 경우 결과를 설명하는 요인이 매우 많음

2. 둘 이상의 변수간의 관계를 보여주는 통계적 방법

3. 종속변수에 영향을 미치는 독립변수의 영향력을 판단가능

4. 여러변수의 영향력을 파악가능

▶ 주의점:

1. 인과관계를 설명해주지는 못한다


공분산: 2개의 확률변수(데이터)의 선형관계를 나타내는 값

공분산의 부호

1. - : 음의 상관관계

2. 0 : 상관관계 없음

3. + : 양의 상관관계

주의점!!!

1. 두 변수가 아무 관계없는 독립변수일때: 공분산 = 0

2. 공분산 = 0 :  두 변수가 독립은 아닐 수 있음


상관계수

피어슨 상관 계수: -1 ~ 1 사이로 표준화

1. 상황에 따라 기준이 조금 다르지만 절대값이 0.5~0.7 이상이면 강한 상관관계를 가진다고 봄

2. -0.2~0.2 정도인 경우 상관관계가 약하거나 없다고 해석

 

 

 

 

 

728x90