Blair  - Soul Eater '• 패스트캠퍼스 데이터분석 부트캠프 12기' 카테고리의 글 목록 (4 Page)
728x90

• 패스트캠퍼스 데이터분석 부트캠프 12기 82

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_10

▶ 문자열 ▶ 문자열 변경 str = " hi,hello,python ! " replace_str = str.replace('hi','oh!') #replace(기존,새거) strip_str = str.strip() #앞뒤 공백 제거 split_str = str.split(',') #문자열에 ,가 있으면 ,를 기준으로 문자열 나눔 print(replace_str) print(strip_str) print(split_str) oh!,hello,python ! hi,hello,python ! [' hi', 'hello', 'python ! '] ▶ 문자열 대소문자 변환 str = "Hi,HeLLo,pYthoN !" a = str.upper() #모두 대문자로 b = str.lower() #모두 소문자로 c ..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_09

▶ 리스트에 값 추가하기 append(), extend(), insert() 1. append()는 단일 항목을 추가 2. extend()는 다른 리스트의 모든 항목( 다른 리스트나 반복 가능한(iterable) 객체의 모든 항목 )을 추가 3. insert()는 특정 위치에 항목을 추가 ( 인덱스 이후의 항목들은 한 칸씩 뒤로 밀리게 됨) a = [1,2,3] number = [777] number.append(a) print(number) number = [777] number.append(5) print(number) number = [777] number.extend(a) print(number) import numpy as np number = [777] number.append(np.arang..

[패스트캠퍼스] 데이터분석 부트캠프_현직자 강의 특강_후기

▶ 데이터사이언티스트는 어느 산업에서 일하는가? 기술, 금융 ▶ 산업의 문제 정의가 분석가 업무에 미치는 영향 산업의 수익 구조에 따라 데이터 분석가의 분석 관점이 크게 바뀜 ex) 중고물품거래 플랫폼 같은 문제를 겪더라고 이유를 분석하는 관점이 다르다. 문제점:사기 당근마켓: :알 수 있는 정보가 제한적 - 쇼셜 활성화 중고나라: 개인대 개인의 거래 - 파트너센터 중계자 번개장터: 교환과정에서 확인이 안돼서 -안전결제 당근마켓: 광고 수수료, 광고 클릭수 -> 어떻게 하면 광고를 더 많이 누르게 할까 번개장터: 결제 이용 수수료, 결제 건수 -> 어떻게 하면 결제를 더 많이 하게 할까 ▶ 다양한 직무가 있지만 데이터 분석가 직무의 신입/ 주니어에게 요구하는 역량은 비슷함 ▶ 모든 분석은 사람을 중심으로..

numpy 기초

▶ 값 2배로 출력하기 data = [0,1,2,3,4,5,6,7,8,9] #for문 사용 answer=[] for i in data: answer.append(2*i) answer #array 사용 x = np.array(data) 2*x ▶벡터화 연산은 비교 연산과 논리 연산을 포함한 모든 종류의 수학연산에 대해 적용된다. a = [1,2,3] b = [2,4,6] a = np.array(a) b = np.array(b) print(a==2) print(b==6) print((a==2) & (b==4)) 실행 결과 ↓ [False True False] [False False True] [False False False] ▶ 2차원 배열의 행과열의 개수구하기 c = np.array([[0,1,2],[3..

프로젝트 OT

주제: 자유주제 강의 때 내용들을 바탕으로 데이터 전처리, EDA등을 통해 분석결과 및 인사이트 도출 진행 SQL, Tablueau, 파이널 프로젝트에서는 데이터가 제공됩니다. 데이터 수집부터 분석까지의 과정을 전체적으로 경험 관심 있는 분야의 주제로 문제 정의부터 분석 피드백: 3번 코드, 에러 관련 피드백 X 분석하는 방향, 어느방향으로 고민을 해보면 좋은지 피드백 O 줌으로 진행 문제에 대해 DM미리 보내놓 프로젝트 개발: 필요한 데이터 프로젝트 가능성 1/17(수) 프로젝트 개발계획 발표 소회의실로 들어가서 팀별 작업 진행 가이드라인 제공 프로젝트 발표: 1/25 팀별 발표 최대 30분 (20분 적정) 프로젝트 타임라인: 1/12(금) ~ 1/15(월) : 조편성 설문 진행 1/15(월) : 조편..

데이터 모델링 워크플로워

데이터 모델링 워크플로워 1. 데이터 수집: 코퍼스: 조사나 연구 목적에 의해서 트겅 도메인으로부터 수집된 데이터 2.점검 및 탐색: 데이터를 점검하고 탐색하는 단계 탐색적 데이터 분석(EDA) 데이터의 특징과 내재하는 구조적 관계를 알아내는 과정 이 단계에서 시각화오 간단한 통계테스트 진행 3. 전처리 및 전제: 분석하기 좋게 데이터 변환 통계적인 분석: 통계적 분석은 가설 검정, 데이터 평가, 결과 또는 가설 입증 및 기각 특정 가설 검정에 적합한 통계모델 사용, 가설 검정 과정에서 p값을 계산하여 통계적 유의성을 판단한다. EDA: 주로 데이터의 특성 및 구조를 이해하고 시각적으로 보여준다. eda 자체로는 특정 가설을 입증하는데 직성 사용되지 않음 eda는 시각화 기술통계, 그래프, 히스토그램, ..

Part.2_Chapter.01_파이썬 기초 프로그래밍

▶ 파이썬 특징 Python 은 대소문자를 구분합니다 (print - O, PRINT - X) Python 은 들여쓰기(INDENT)에 민감하니 주의하세요 들여쓰기는 암묵적으로 Tab 한번 혹은 스페이스 4번을 기준으로 합니다 Python 및 대부분의 프로그래밍 언어는 첫번째 인덱스가 0 부터 시작합니다 ▶ 파이썬 자료형 Python 자료형은 숫자형(int, float), 문자열(str), 참/거짓(bool), 리스트(list), 튜플(tuple), 딕셔너리(dict), 집합(set) 이 있습니다 ▶ 변수의 이름 변수의 이름은 일반적으로 "알파벳 소문자 + 숫자(혹은 언더바 _)" 형식을 사용 변수의 이름으로 적절하지 않은 조합 알파벳 이외의 언어로 된 변수 (한글, 중국어, 일본어 등) 숫자가 맨 앞에..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_08

▶ 사각형으로 별 출력하기 for i in range(5): #세로방향 for j in range(5): #가로방향 print("*", end=" ") print() #한 줄 출력후 줄바꿈 실행결과 ↓ * * * * * * * * * * * * * * * * * * * * * * * * * ▶ 계단식으로 별찍기 for i in range(5): for j in range(5): if j 앞의 Fizz가 차이므로 i를 보지 않고 Fizz도 True로 출력되는 것이 아니라 문자열 그대로 출력 실행결과 ↓ ▶ 코드 단축하기 파이썬에서 연산자의 특성을 활용하면 코드의 길이를 짧게 줄일 수 있음 그러나 줄이면 주석을 왕창 달아야 함 코드가 읽기 어려워진다면 이해하기 쉽도록 풀어서 작성해도됨 ▶ 리스트 응용, 2차..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_07

▶ random.random import random random.random() ▶ 모듈 위치 확인 import random import inspect print(inspect.getfile(random)) ▶ random으로 얻은 숫자를 while문을 사용하여 1~6까지의 숫자로 바꾼뒤 10번 출력 ▶ 발생한 난수의 숫자 세기 i = 0 cnt_rand=[0,0,0,0,0,0] while i < 10: rData = (int(random.random()*10)%6)+1 cnt_rand[rData-1] +=1 i+=1 print(cnt_rand) #1,2,3,4번호에 비해 5,6,은 절반정도 확률로 발생함. 이유는? i = 0 cnt_rand=[0,0,0,0,0,0] while i < 100: rDat..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_06

for문과 while문 차이점 - for 시퀀스 객체 - while 조건 ▶ while 문법 초기식 while 조건식 반복할코드 변화식 i = 0 while i 0: print("hello world!",i) i -=1 ▶ while문 입력받은 숫자만큼 반복 num = int(input("반복할 횟수 입력하세요: ")) while i 0: print("hello world!",num) num -=1 ▶1부터 10까지 공백으로 출력하기 #for문 for i in range(1,11,1): print(i,end=' ') #while문 i=1 while i 0: year = int(input("연도를 입력하세요 :")) if year > 0: if year % 400 ==0: flag = True elif y..

728x90