Blair  - Soul Eater '데이터 분석' 태그의 글 목록
728x90

데이터 분석 5

KNU COMPASS 플랫폼 기반 의생명 데이터 분석 해커톤 후기

평소 의생명 및 바이오 데이터를 다루어 보고 싶다는 생각을 하고 있었다. 하지만 다른 데이터와는 달리 환자의 건강과 관련된 데이터는 제약이 많이 되어있고 접할 수 있는 기회도 많이 없어서 아쉬웠다. 그동안 내가 다루어 본 데이터는 케글의 신부전데이터와 같이 인터넷상에서 쉽게 접할 수 있는 데이터였다. 하지만 콤파스 플랫폼을 이용한 의생명 데이터 분석 경진대회를 통해 COPD(만성 폐쇄성 폐질환) CRC(대장암) MI(심근경색) Breast Cancer(유방암) AML(급성 골수성 백혈병) 데이터를 다루어 볼 수 있었고 컬럼이 매우 다양해서 데이터를 살펴보는데에만 시간이 많이 걸릴정도로 다양한 정보가 담겨져 있는 데이터였다. 또한 의생명 데이터이다보니까 모르는 의학용어가 많이나와서 하나하나 검색하며 이해하..

[데이터_분석] 자동차 리콜 데이터 분석 (P3)

프로젝트 목표 한국교통안전공단 자동차 결함 리콜 데이터를 분석하여 유의미한 정보 도출 탐색적 데이터 분석을 수행하기 위한 데이터 정제, 특성 엔지니어링, 시각화 방법 학습 ​ 프로젝트 목차 1. 데이터 읽기 자동차 리콜 데이터를 불러오고 Daaframe 구조를 확인 1-1. 데이터 불러오기 ​ 2. 데이터 정제 결측치 확인 및 기초적인 데이터 변형 2-1. 결측치 확인 2-2. 중복값 확인 2-3. 기초적인 데이터 변형 ​ 3.데이터 시각화 각 변수 별로 추가적인 정제 또는 feature engineering 과정을 거치고 시각화를 통하여 데이터의 특성 파악 3-1. 제조사별 리콜 현황 출력 3-2. 모델별 리콜 현황 출력 3-3. 월별 리콜 현황 출력 3-4. 생산연도별 리콜 현황 출력 3-5. 4분기..

[데이터_분석] 지하철 승하차 인원 분석 (P2)

프로젝트 목표 승차 또는 하차 시 해당 시간, 해당역의 승객 수를 확인하기 위해 개찰구 통과 승객 수 데이터와 지하철 위치좌표 데이터를 활용 탐색적 데이터 분석을 수행하기 위한 데이터 정제, 특성 엔지니어링, 시각화 방법 학습 ​ 프로젝트 목차 1. 데이터 읽기: 승하차 인원 정보 데이터를 불러오고 DataFrame 구조를 확인 1-1. 데이터 불러오기 1-2. 데이터 확인하기 ​ 2. 데이터 정제: 데이터 확인 후 형 변환 및 이상치 데이터 처리 2-1. 2021년 6월 승하차 인원만 추출 ​ 3. 데이터 시각화: 각 변수별로 추가적인 정제 또는 feature engineering 괒ㅇ을 거치고 시가화를 통해 데이터 특성 파악 3-1. 호선 별 이용객 수 출력 3-2. 특정 호선에서 역별 평균 승하차 ..

[파이썬 예제] Matplotlib 13- 전국의 종합병원 정보 분석 (3)

●CSV예제 파일은 아래글에서 다운받아 주세요 **입력하는 코드가 있는 파일과 같은 폴더에 위치해 있어야 합니다** [파이썬 연습문제] Matplotlib 11- 전국의 종합병원 정보 분석 (1) ●CSV 예제 파일 입니다. **입력하는 코드가 있는 파일과 같은 폴더에 위치해 있어야 합니다** import csv f = open('doctor_2019.csv', 'r', encoding='utf-8') lines = csv.reader(f) header = next(.. oujin.tistory.com import csv import matplotlib.pyplot as plt from matplotlib import rc f = open('doctor2.csv', 'r', encoding='utf-8'..

[파이썬 예제] 데이터 분석 18- 강원지역의 한의원명, 주소, 총의사수 구하기

●CSV예제 파일은 아래글에서 다운받아 주세요 **입력하는 코드가 있는 파일과 같은 폴더에 위치해 있어야 합니다** [파이썬 예제] 데이터 분석 - csv 파일열기, csv내용 출력 ● CSV예제 파일은 아래글에서 다운받아 주세요 **입력하는 코드가 있는 파일과 같은 폴더에 위치해 있어야 합니다** ● hospital_2019.csv 파일은 건강보험 심사평가원에서 제공한(2019년 9월 기준) 7 oujin.tistory.com import csv f = open('hospital_2019.csv', 'r', encoding='utf-8') lines = csv.reader(f) header = next(lines) print('번호', '한의원명', header[4], header[6]) number ..

728x90