머신러닝(기계학습): 경험과 학습을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며 인공지능의 한 분야.
컴퓨터가 어떤 작업(T)을 하는데 있어서, 경험(E)으로부터 학습하여 성능(P)을 향상시키는 학문
지도학습: 지도학습은 정답이 있는 데이터를 활용해 데이터를 학습하고, 학습한 모델이 얼마나 정답을 정확하게 맞추는지 평가하는 학습이다.
분류, 회귀 문제들을 해결 가능하다
회귀: 연속형 수치의 입력값을 활용해 특정 수치를 예측
분류: 주어진 입력 값을 2개 혹은 여러 개의 결과값으로 분류
비지도학습: 비지도학습은 정답이 없는 데이터를 활용해 데이터를 학습하는 것. 데이터가 어떻게 구성되어 있는지, 혹은 어떻게 분류될 수 있는지에 대한 문제 해결
군집 문제 해결 가능하다
데이터 시각화; 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정
차트를 그릴때 고민 해야 할 것:
1. 어떤 숫자로 차트를 그릴 것인가?
2. 어떤 차트가 숫자를 가장 잘 설명하는가?
3. 차트를 어떻게 디자인하는게 가장 효과적인가?
차트디자인:
예쁘게 꾸미는 것이 아니라 정보전달이 잘되게 디자인 해야함
1. 차트의 모든 데이터를 단색으로 변경(회색 추천) -> 회색
2. 차트에서 가장 중요한(강조해야 하는) 데이터 선정 -> 인천
3. 차트의 메인 컬러(1개) 선택 -> 주황
4. 2의 중요 데이터에만 3의 메인 컬러 적용
+ 데이터 레이블 숫자 추가
우클릭- 데이터 레이블 추
+차트의 윤곽선 제거: 데이터의 레벨이 달라질 때만 선을 그리기
보기탬 - 눈금선해제
+깔끔하게 하기
1. 선을 맞추기
2. 필요없는 선, 범례 등을 지우기
최종 그래프
콤보형 차트 : 2개 이상의 정보를 표현하는 콤보형 차트
2개 이상의 정보를 영역 선택을 한뒤, 막대선택 - 우클릭 - 계열차트 종류 변경
거품형차트: 숫자의 크기나 비율을 거품으로 나타냄, 거품의 위치, ㅋ,기, 색등을 활용해 정보를 표현
어떤 데이터의 현황을 볼 때 유용함
주의! 데이터 선택시 이름빼고 숫자값만 잡아야함!
ex) 거품 하나하나 각기 다른 고객을 나타냄,
거품의 크기=해당 고객의 총구매액,
가로 = 쇼핑몰 체류시간
세로 = 구매 물품 개
x , y , 거품크기 순서여야함
우클릭: 축서식
우클릭: 데이터 계열 서식 - 채우기 - 요소마다 다른 색 사용
폭포형 차트:
증감 구할 때 첫번째는 첫번째 값을 그대로 적고 나머지는 각 시기에 대한 차로 증감을 구한다.
합계로 설정하기: 합계로 설정하고 싶은 막대를 선택하고 합계로 선택을 누르기
대시보드:
피벗테이블 만들기- 피벗테이블 분석택- 슬라이서
차트 2개를 만들어서-> 하나는 슬라이서를 위한 피벗테이블과, 차트를 만드는 피벗테이블을 연결한다
내가 만들 대시보드의 레이아웃을 짜는게 중요함
+지도위에 시각화: x,y축으로 위치를 표현하기
위도 = y
경도 = x
사용자의 입장에서 목적에 부합하도록 데이터를 사용해야한다
책추천:
1. 데이터분석가가 알아야 할 모든것 황세웅 지음 / 위키북스
2. Practicals Statistics for DATA Scientists 데이터 과학을 위한 통계 피터 브루스, 앤드루 브루스, 피터 게테크 지음 / 한빛미디어
몇몇 사람들은 비를 느끼고 다른 사람들은 그냥 젖는다
'• 패스트캠퍼스 데이터분석 부트캠프 12기' 카테고리의 다른 글
[패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_03 (2) | 2024.01.05 |
---|---|
3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_01 (1) | 2024.01.03 |
[패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_02 (2) | 2023.12.29 |
2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_11 (1) | 2023.12.29 |
2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_10 (1) | 2023.12.29 |