Blair  - Soul Eater [패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_01

• 패스트캠퍼스 데이터분석 부트캠프 12기

[패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_01

oujin 2023. 12. 22. 12:31
728x90

2023년 12월 18일부터 데이터분석 부트캠프를 진행하게 되었습니다

오늘은 12월 22일로 시작한지 5일째 되는 날이네요!


부트캠프 2일차: 1. 빅데이터 이해하기 & 데이터 리터러시_오수은 강사님

1. 데이터 드리븐이 중요한 이유

     ->여러 분야에서 데이터를 이용한 의사결정이 진행되고 있음

2. 데이터 드리븐이 언제부터 중요했고 언제까지 갈것인지

     ->데이터관점+ 시스템아키텍처관점+분석 및 비즈활용관점 =종합적인 이해 필요

3. 데이터 관련된 일에는 어떤것이 있는지

     -> product analyst, business analyst, 퍼포먼스, crm marketer, 데이터사이언티스트

4. 데이터 분석가가 되기 위해 필요한 역량과 준비할 것

     -> 프로그래밍 역량, 통계, ml, dl, 도메인지식, 커뮤니케이션 스킬

5. 데이터 사이언티스트가 하는일

     ->비즈니스이해, 데이터마이닝, 데이터정제, 데이터 eaploration, feature engineering, predictive modeling, 데이터시각화

6. QNA

 

부트캠프 3일차: 2. 친근한 엑셀로 실무 엑셀 데이터 분석시작하기_이동훈 강사님

1. 엑셀데이터 종류와 붙여넣기

  수식 붙여넣기: 서식을 제외한 수식만 붙여넣기

   붙여넣기: 서식을 제와하고 수식을 값으로 변경해 붙여넣기

  서식 붙여넣기: 값이나 수식을 제외하고 서식만 붙여넣기

 

2. 상대참조 / 절대참조 /혼합참조

● 절대참조: $P$4와 같이 $표시가 행과 열 모두 붙어 있는것

F4 한번 누르기

● 상대참조: O2 와같이 $표시가 없는것

기본상태이다.또는 F4 네번 누르기

● 혼합참조 (행고정) :O$2처럼 행에 해당하는 부분에 $표시가 있는것

F4 두번 누르기

● 혼합참조 (열고정): :$O2처럼 열에 해당하는 부분에 $표시가 있는것

F4 세번 누르기

 

3. 기초통계량 계산

● 파일-옵션-추가기능-이동-분석도구팩

     ->평균, 표준오차,중앙값,최빈값,표준편차,분산,첨도,왜도,범위,최대값,최소값,합,관측수 등을 확인 할 수 있다

 

부트캠프 4일차: 엑셀 온라인 강의

● sum(c5:c12) :범위 합

● sum(c5,c12) :각값  합

● =average( c5:c12 ): 범위 평균

● =average( c5,c12 ): 각 값의 평균

 

● COUNTA(C5:C12): 특정범위에서 데이터가 들어가 있는데의 개수 파악 (빈셀은 세지않음)

● COUNTBLANK (C5:C12) : 특정범위에서 비어있는셀 개수세기

● COUNTIF(C5:C12."A"):특정범위에서 하나의 조건을 만족하는 셀의 개수파악

COUNTIFS(개수를파악할 데이터가 있는범위 1, "조건 1", 개수를파악할 데이터가 있는범위 2, "조건 2"): 특정범위에서 여러조건을 만족하는 셀의 개수파악

 

● =IF(조건, 조건이 맞을 때 결과값,그렇지 않을때 결과값)

● =IF(조건, 조건이 맞을 때 결과값, 조건, 조건이 맞을때 결과값, 그렇지 않을때 결과값)

 

● VLOOKUP(찾을기준데이터셀,원래 데이터의 범위(공통준열부터 선택해야함),불러올 데이터의 열번호(공통기준열을 1열로 했을때, 0(0:정확히 일치할때만 불러옴, 1:근사치를 불러옴(기본값))

=VLOOKUP($C5, 직원정보LIST!$D:$J, 3 ,0)

=VLOOKUP(사번값,사번열부터 전체 데이터 선택, 전체데이터에서 불러올 데이터의 열번호 , 0)

 

● MATCH: 내가 찾고 싶은 값이 한 행,열에서 몇번째에 있는지를 숫자로 알려줌

=MATCH( 내가 찾고 싶은값, 내가 찾고 싶은 값이 포함된 단일 열 또는 행 범위, [전확히 일치 or 근사치 넣는 곳인데 0으로 하기]

 

● INDEX(범위, 내가 찾고 싶은 데이터의 범위 내 행번호, [내가 찾고 싶은 데이터의 범위 내 열번호 ])

 

●SUMIFS: 2개 이상의 조건을 동시에 만족하는 데이터들의 합계 계산

=SUMIFS(더할 들의 범위, 더할 조건 범위1, "조건1",더할 조건 범위2,"조건2")

=SUMIFS( SALES, 연도, 2021, 지역, EAST)

 

● =SUMPRODUCT

=SUMPRODUCT ( (조건 1의 범위 = 조건값2의 셀) * (조건 2의 범위 = 조건값2의 셀) , 곱할 값범위)

=SUMPRODUCT ( ( 연도  = 2021  ) * (  지역   =  EAST  ) , SALES )

 

● =IFERROR(수식이 입력된 셀,"오류가 발생했을때 표시할 값")

=IFERROR( 함수, "") -> 오류가 난 은 빈칸으로 두겠다.

 

● =FIND: 대소문자 구분함

=FIND("찾고싶은 텍스트",긴텍스트가 입력된 셀, [문자열을 찾기 시작할 위치, 안적으면 처음문자부터 즉 1이 기본값]

=FIND("-",B5)

● =SEARCH: 대소문자 구분하지 않음

 

  LEFT / RIGHT : 텍스트의 가장 왼쪽/ 오른쪽부터 원하는 문자열까지 추

=LEFT(전체텍스트, 불러올 문자열 수)

=RIGHT(전체텍스트, 불러올 문자열 수)

=RIGHT(B5,3)

● MID : 텍스트의 중간 시작 위치부터 원하는 문자열까지 추출

=MID(B5,5,3) ->찾고싶은 데이터가 있는 열,시작위치,몇개가져올지

● =LEN(B5) B5셀의 텍스트 문자열의 총 길이

전체 문자열에서 마지막 몇개의텍스트만 불러오고 싶을때

=RIGHT($B5,LEN($B5)-E5)

 

날짜데이터 계산

=DAYS(종료일셀,시작일셀)

=DAYS(H3,D3)+1

=DATEDIF(시작일셀, 종료일셀,"D")

=DATEDIF(D3,H3,"D")+1

 

"D" : 일 수

"M" : 월 수

"Y" : 연 수

"YM" : 올 해의 월 수

"MD" : 이번 달의 일 수

 

● NETWORKDAYS.INTL : 시작일과 종료일 사이의 기간중 내가 지정한 공휴일과 다른 휴일을 제외한 근무일 수 계산

NETWORKDAYS.INT(시작일, 종료일,[주말],[휴무일])

 

 

 

 

 

 

728x90