Blair  - Soul Eater 오우진
728x90

전체 글 307

2. 친근한 엑셀로 실무 엑셀 데이터 분석 및 기초 수학/통계 시작하기(이동훈 강사님)_05

● 조건부 서식 / 상관분석 데이터분석-상관관계 한눈에 관계를 알아보기 어렵다 조건부서식 - 규칙관리 - 새규칙 셀값을 기준으로 모든 셀의 서식 지정- 3가지 색조 상관계수 표를 보기 쉽게 만들기 하지만 음의 상관관계가 보이지 않음 따라서 더 보기 편하게 시각화 최소 0.7로 변경하여 시각화 ● 보기 편하게 시각화 ctrl 1 :셀서식 : 표기형식 : 0.00으로 변경 ● 산점도 그래프를 그릴때 x,y 순서로 되어 있어야 함! 데이터가 순서대로 되어 있지 않은 경우 빈 분산형 그래프를 기른뒤 우클릭-데이터 선택 각각 따로 선택해 주기 범례항목- 추가 ● 데이터 전(앞)처리의 개념: 1. 데이터 및 변수 형태 변환 2. 변수 선정 3. 결측치 및 이상치 처리 4. 데이터 분류 5. 데이터 분리 및 결합 6..

2. 친근한 엑셀로 실무 엑셀 데이터 분석및 기초 수학/통계 시작하기(이동훈 강사님)_04

● 모든 기술은 사람을 향해야 한다. ● 학창시절에서 나와다른 강점, 다른 가치관을 지닌 사람과 협업을 어떻게 했는지 (성과보다 협업) ● 다른 분야, 기술과의 융합 ● 강사님과 슬랙으로 1대1 의논 가능 ● 기술적 데이터 리터러시: 데이터 종류 유형 특징을 파악하고 기초 통계량 분석할 수 있는 역량 ● 해석적 데이터 리터러시: 문제해결방안, 숫자에 의미를 부여하기 ● 데이터분석의 정의: 내가 생각하는 나만의 데이터 분석에 대한 정의를 만들기 ● 데이터분석에 대한 목적: 인사이트도출(장기적인 목적에서의 교훈을 포함) ● 문제의 원인발생 시점의 이전의과거에서 왜 문제의 원인이 발생했고 어떻게 해결해야 할것인가 생각하는 시점보다 미래에서 다시 발생하지 않게하기 위해서 어떻게 해야하는지까지 고려하기 ● 시티즌..

[AI-900] AI-900 시험범위 전체 요약정리 / 문제풀이 사이트 / 합격 꿀팁!

● 시험범위(1) 책임있는 AI (responsible AI) (2) 머신러닝 (machine learning) (3) 컴퓨터비전 (computer vision) (4) NLP (natural language processing) 제가 생각하기에 주요한 내용만 정리하였습니다 해당 개념을 외운뒤, 기출문제 몇번 풀어보시면 통과기준인 700점은 쉽게 넘기실 수 있을 것 같습니다! 저는 시험 보기 전까지 아래에 있는 개념암기 + 기출 100문제 정도 풀어보았습니다. 자격증은 921점으로 취득 할 수 있었습니다. (공유하실때 출처 링크 꼭 남겨주세요) (1) 책임있는 AI (Responsible AI) * 6가지 키워드 1. 공정성(Fairness) : 대출프로그램에서 성차별, 인종차별안됨, 데이터의 편향(bi..

Part 3.ch 01. 왕초보 고등학교 기초통계

***OVER VIEW*** 1. 고등학교 기초통계 변량, 도수, 상대도수, 도수분포표, 히스토그램 평균, 분산, 표준편차 개념 (도수 있는 경우와 없는 경우) 통계에 확률변수, 확률분포가 등장하는 이유 연속형 확률분포와 이산형 확률분포 확률분포표, 확률밀도함수 정규분포, 표준정규분포, 표준화 모집단, 표본, 모평균, 표본평균, 모분산, 표본분산 추정, 신뢰도, 신뢰구간 2. 기술통계 기술통계와 추론통계의 차이점 대표값과 기초통계량 기초통계량(1) - 중심경향성 기초통계량(2) - 퍼짐정도 기초통계량(3) - 왜도,첨도 3. 회귀분석, 공분산, 상관계수 회귀분석을 공부하는 이유 공분산 기본 개념 상관계수 기본 개념 ● 변량: 자료의 수치, 즉 데이터의 값의 의미 ● 계급: 변량을 일정한 간격으로 나눈 구..

[패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_01

2023년 12월 18일부터 데이터분석 부트캠프를 진행하게 되었습니다 오늘은 12월 22일로 시작한지 5일째 되는 날이네요! 부트캠프 2일차: 1. 빅데이터 이해하기 & 데이터 리터러시_오수은 강사님 1. 데이터 드리븐이 중요한 이유 ->여러 분야에서 데이터를 이용한 의사결정이 진행되고 있음 2. 데이터 드리븐이 언제부터 중요했고 언제까지 갈것인지 ->데이터관점+ 시스템아키텍처관점+분석 및 비즈활용관점 =종합적인 이해 필요 3. 데이터 관련된 일에는 어떤것이 있는지 -> product analyst, business analyst, 퍼포먼스, crm marketer, 데이터사이언티스트 4. 데이터 분석가가 되기 위해 필요한 역량과 준비할 것 -> 프로그래밍 역량, 통계, ml, dl, 도메인지식, 커뮤니..

Part 2.ch 03. 차트로 엑셀 데이터 쉽게 탐색하기

***엑셀로 히스토그램 그리기*** 궁금증1. 성별에 따라서 생존률이 다를까? 성별에 따라 생존율을 구해야 하는데 어떻게 구해야 할까? 삽입-피벗테이블 성별과 생존 컬럼을 추가 캅-합계-값필드 설정 평균으로 설정시 궁금증2. PCLASS에 따라서 생존율이 다를까? PCALSS에 따라서 생존율을 구해야 하는데 어떻게? 궁금증3. 성별과 PCLASS에 따른 생존율 홈-일반 대신에 백분율로 선택시 깔끔하게 정돈된 숫자로 볼 수 있다. 궁금증4. 성별, PCLASS 각각에 따른 생존율 시각화 우클릭 필드 목록 표시 궁금증5. 탑승한 항수에 따라서 PCLASS가 많이 다를까? ***엑셀로 산점도 그리기*** 상관관계분석하기 ***엑셀로 박스플롯 그리기*** 데이터의 필터로 헤더에 필터 적용하 하고자 하는것: pc..

Part 2.ch 02. 데이터 탐색과 통계 필요성

● 기술통계 -요약된 정보를 담고 있는 통계량과 시각화를 바탕으로 데이터를 탐색 -관측된 데이터의 특성을 파악하는 좋은 수단 ● 추론통계 -추출한 표본의 통계량 관찰 및 분석 기법을 활용하여 모집단을 추론 -P-VALUE등을 활용하여 추론의 신뢰도 확보 ● 적절한 통계기법 활용하기 ● 데이터로부터 올바른 정보를 얻기 ● 즉 통계공부란 수치로부터 정보를 추출하기 위한 수단 ● 기술통계법: 평균, 분산,표준편차, 왜도,첨도 등 통계량 확인 ● 데이터 시각화: 차트를 통한 분포 확인 ● 상관 관계 분석: 각 변수 간의 비례관계 ● 결측치, 이상치 탐지: 관측되지 않거나 추세에서 벗어난 데이터 확인 ●데이터 탐색 과정의 목적: * 어떤 변수가 결론에 많은 영향을 미치는지 확인 1. 유의미한 변수 탐색 2. 변수..

Part 2.ch 01. 데이터 탐색 사례

***OVER VIEW*** 데이터 탐색 사례에서 어떤 대표값을 바탕으로 데이터를 탐색하는지 알기 EDA를 통한 변수의 특징 파악 다양한 통계기법을 파악해 변수가 정규성을 가지는지 파악 어떤경우에 어떤 통계기법을 사용하는지 차트로 데이터 시각화 ● 대표값을 통한 데이터 탐색 -수집된 데이터로부터 통계량을 측정 -통계량을 통해 집단의 특성을 파악 ● 기술통계 -테크니컬의 기술이 아니라 적다의 기술임 -각각의 세부항목에 대해서는 PART 3에서 자세히 다룸 ● 기술통계법을 이용한 수치 요약 ● 엑셀 내장함수를 통한 수치요약 ● 엑셀 피벗차트를 이용한 시각화 ● 파이썬에서의 기술통계 및 시각화 ●차트로 데이터 탐색 사례 -좌석, 생존에 따른 연령 분포 등 ●분포를 확인 할 때 함께 확인해야하는 수치 -분포의 ..

Part 1.ch 03. 데이터 실습을 위한 엑셀 예제 csv 파일 찾기(Kaggle)

●케글에서 타이타닉 데이터 다운받기 https://www.kaggle.com/competitions/titanic/data Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 다운받은 CSV파일을 다른이름으로 저장하기 하여 통합된 엑셀 확장자로 XLSL 변경해주면 더욱 편함! 파일 옵션 추가기능 이동 분석도구팩으로 기능을 추가해주면 데이터 탭에 데이터 분석툴이 생긴다! 데이터분석-기술통계법 들어가서 숫자만 있는 연속된 열의 데이터를 선택해주고 첫째행 이름표 사용 체크 나머지는 보고 싶은 것 체크하면 이렇게 요약 통계를 볼 수 있다 ●공분산 분석 ●상관관계 분석 데이터의 상관행렬이 더 균일해짐

Part 1.ch 02. 데이터 분석과정과 탐색적 데이터 분석(EDA)

● 데이터분석 단계 1. 분석 기획 2. 수집 및 정제 3. 모델링 4. 평가 및 결론 도출 5. 분석결과의 활용 ● 데이터 분석 기획 -비즈니스 이해 및 목표설정: 비즈니스적으로 어떤것을 이루고자 하는지 -프로젝트 정의: 어떤데이터를 바탕으로 어떤것을 예측,측정할 것인지 ●데이터 수집 및 정제 -분석에 필요한 데이터를 어떻게 수집할 것인지 -데이터 전처리,검증:수집된 데이터의 정합성,무결성 등을 검증 ● 데이터 분석 모델링 -탐색적 데이터 분석 (EDA): 통계량 확인 및 시각화를 통한 데이터의 특성을 파악 -모델링: 예측을 위한 수학적, 통계적 모델링 ● 평가 및 결론도출 -모델링을 통해 생성된 결과를 활용해 결론 도출 -성능에 대한 평가: 도메인에 따라 비즈니스적 요구에 따라 성능의 기준은 달라짐,..

728x90