Blair  - Soul Eater '분류 전체보기' 카테고리의 글 목록 (9 Page)
728x90

분류 전체보기 318

데이터 모델링 워크플로워

데이터 모델링 워크플로워 1. 데이터 수집: 코퍼스: 조사나 연구 목적에 의해서 트겅 도메인으로부터 수집된 데이터 2.점검 및 탐색: 데이터를 점검하고 탐색하는 단계 탐색적 데이터 분석(EDA) 데이터의 특징과 내재하는 구조적 관계를 알아내는 과정 이 단계에서 시각화오 간단한 통계테스트 진행 3. 전처리 및 전제: 분석하기 좋게 데이터 변환 통계적인 분석: 통계적 분석은 가설 검정, 데이터 평가, 결과 또는 가설 입증 및 기각 특정 가설 검정에 적합한 통계모델 사용, 가설 검정 과정에서 p값을 계산하여 통계적 유의성을 판단한다. EDA: 주로 데이터의 특성 및 구조를 이해하고 시각적으로 보여준다. eda 자체로는 특정 가설을 입증하는데 직성 사용되지 않음 eda는 시각화 기술통계, 그래프, 히스토그램, ..

[AI900][K디지털플랫폼 AI 경진대회] 본선 후기02 / 보이스캐너 프로젝트 리뷰

대회 주제: 인공지능을 활용하여 디지털 확산을 촉진하고 디지털 취약 계층의 문제 해결 및 혁신적 솔루션 탐색 보이스캐너: 보이스(Voise) + 스캐너 (Scanner)를 합친 단어로, 전화통화시 상대방의 목소리를 분석하여 보이스피싱인지 아닌지 구분하여 의심상황 발생시 경고 메세지 전송하는 어플 제작하기로 하였다. 보이스캐너를 떠올리게 된 계기: 친구와 함께 있었는데 친구가 전화를 받고 갑자기 저보고 조용히 하라면서 혼자 어디론가 가려고 했다. 하지만 근처에서 전화내용을 들어 본 결과 보이스피싱이라는 의심이 강하게 들었고 친구에게 보이스피싱이라고 말을 했으니 믿지 않음. 결국 자칭 검사(?)와 카카오톡까지 주고받고 검찰송치가 된다면서 사무실로 오라는 이야기까지 듣고 제가 옆에서 말렸고, 친구가 의심을 하..

KNU COMPASS 플랫폼 기반 의생명 데이터 분석 해커톤 후기

평소 의생명 및 바이오 데이터를 다루어 보고 싶다는 생각을 하고 있었다. 하지만 다른 데이터와는 달리 환자의 건강과 관련된 데이터는 제약이 많이 되어있고 접할 수 있는 기회도 많이 없어서 아쉬웠다. 그동안 내가 다루어 본 데이터는 케글의 신부전데이터와 같이 인터넷상에서 쉽게 접할 수 있는 데이터였다. 하지만 콤파스 플랫폼을 이용한 의생명 데이터 분석 경진대회를 통해 COPD(만성 폐쇄성 폐질환) CRC(대장암) MI(심근경색) Breast Cancer(유방암) AML(급성 골수성 백혈병) 데이터를 다루어 볼 수 있었고 컬럼이 매우 다양해서 데이터를 살펴보는데에만 시간이 많이 걸릴정도로 다양한 정보가 담겨져 있는 데이터였다. 또한 의생명 데이터이다보니까 모르는 의학용어가 많이나와서 하나하나 검색하며 이해하..

Part.2_Chapter.01_파이썬 기초 프로그래밍

▶ 파이썬 특징 Python 은 대소문자를 구분합니다 (print - O, PRINT - X) Python 은 들여쓰기(INDENT)에 민감하니 주의하세요 들여쓰기는 암묵적으로 Tab 한번 혹은 스페이스 4번을 기준으로 합니다 Python 및 대부분의 프로그래밍 언어는 첫번째 인덱스가 0 부터 시작합니다 ▶ 파이썬 자료형 Python 자료형은 숫자형(int, float), 문자열(str), 참/거짓(bool), 리스트(list), 튜플(tuple), 딕셔너리(dict), 집합(set) 이 있습니다 ▶ 변수의 이름 변수의 이름은 일반적으로 "알파벳 소문자 + 숫자(혹은 언더바 _)" 형식을 사용 변수의 이름으로 적절하지 않은 조합 알파벳 이외의 언어로 된 변수 (한글, 중국어, 일본어 등) 숫자가 맨 앞에..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_08

▶ 사각형으로 별 출력하기 for i in range(5): #세로방향 for j in range(5): #가로방향 print("*", end=" ") print() #한 줄 출력후 줄바꿈 실행결과 ↓ * * * * * * * * * * * * * * * * * * * * * * * * * ▶ 계단식으로 별찍기 for i in range(5): for j in range(5): if j 앞의 Fizz가 차이므로 i를 보지 않고 Fizz도 True로 출력되는 것이 아니라 문자열 그대로 출력 실행결과 ↓ ▶ 코드 단축하기 파이썬에서 연산자의 특성을 활용하면 코드의 길이를 짧게 줄일 수 있음 그러나 줄이면 주석을 왕창 달아야 함 코드가 읽기 어려워진다면 이해하기 쉽도록 풀어서 작성해도됨 ▶ 리스트 응용, 2차..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_07

▶ random.random import random random.random() ▶ 모듈 위치 확인 import random import inspect print(inspect.getfile(random)) ▶ random으로 얻은 숫자를 while문을 사용하여 1~6까지의 숫자로 바꾼뒤 10번 출력 ▶ 발생한 난수의 숫자 세기 i = 0 cnt_rand=[0,0,0,0,0,0] while i < 10: rData = (int(random.random()*10)%6)+1 cnt_rand[rData-1] +=1 i+=1 print(cnt_rand) #1,2,3,4번호에 비해 5,6,은 절반정도 확률로 발생함. 이유는? i = 0 cnt_rand=[0,0,0,0,0,0] while i < 100: rDat..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_06

for문과 while문 차이점 - for 시퀀스 객체 - while 조건 ▶ while 문법 초기식 while 조건식 반복할코드 변화식 i = 0 while i 0: print("hello world!",i) i -=1 ▶ while문 입력받은 숫자만큼 반복 num = int(input("반복할 횟수 입력하세요: ")) while i 0: print("hello world!",num) num -=1 ▶1부터 10까지 공백으로 출력하기 #for문 for i in range(1,11,1): print(i,end=' ') #while문 i=1 while i 0: year = int(input("연도를 입력하세요 :")) if year > 0: if year % 400 ==0: flag = True elif y..

3. 데이터 분석을 위한 핵심 Tool Python(김상모 강사님)_05

▶ 딕셔너리 사용시 'key' 가 없는 경우에 대한 처리 lux = {'health' : 490, 'mana' : 334, 'melee' : 550, 'armor' : 18.72} print("키 유무 여부를 확인 :") if 'health' in lux: print(lux['health']) # 키의 값이 없으면 에러 발생 if lux.get('health') != None: # 키의 값이 없을 경우 = None print(lux['health']) # print("key를 사용하여 value에 접근하는 경우:") # print(lux['health1']) # 키의 값이 없으면 에러 발생 print("get 메소드를 사용하는 경우:") print(lux.get('health1')) # 키의 값이 없을 ..

728x90