Blair  - Soul Eater '분류 전체보기' 카테고리의 글 목록 (11 Page)
728x90

분류 전체보기 307

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_12

머신러닝(기계학습): 경험과 학습을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며 인공지능의 한 분야. 컴퓨터가 어떤 작업(T)을 하는데 있어서, 경험(E)으로부터 학습하여 성능(P)을 향상시키는 학문 지도학습: 지도학습은 정답이 있는 데이터를 활용해 데이터를 학습하고, 학습한 모델이 얼마나 정답을 정확하게 맞추는지 평가하는 학습이다. 분류, 회귀 문제들을 해결 가능하다 회귀: 연속형 수치의 입력값을 활용해 특정 수치를 예측 분류: 주어진 입력 값을 2개 혹은 여러 개의 결과값으로 분류 비지도학습: 비지도학습은 정답이 없는 데이터를 활용해 데이터를 학습하는 것. 데이터가 어떻게 구성되어 있는지, 혹은 어떻게 분류될 수 있는지에 대한 문제 해결 군집 문제 해결 가능하다 데이터 시각화; 데이터 분석 결과..

[패스트캠퍼스] 데이터분석 부트캠프12기 학습일지_02

2023년 12월 18일부터 데이터분석 부트캠프를 진행하게 되었습니다. 오늘은 12월 29일로 시작한지 12일째 되는 날이네요! 친근한 엑셀로 실무 엑셀 데이터 분석및 기초 수학/통계 시작하기(이동훈 강사님) 데이터 파악하는 방법 ▶ 피벗테이블: 엑셀에서 커다란 표의 데이터를 요약하는 통계표 1. 어떤 데이터를 EDA하는 제일 좋은 방법 2. 어떤 요약통계표를 만들고 싶은지, 어떤 데이터를 기준으로 테이블을 만들지 생각해야함! 3. 내가 만들어야 하는 피벗테이블을 손으로 그려보고 따라그리기! ▶ 결측치 처리 방법: 결측치의 유형 및 비율에 따라 적절한 결특치 처리 방법을 결정해야함 1. 제거 :가장단순하지만 통계적편향이 생길 수 있음. 데이터크기의 손실 발생. 2. 치환 :적당한 방법으로 대체하는것(평균..

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_11

다중 선형회귀 분석: 독립변수가 2개 이상일때 종속변수와의 관계를 설명 다중회귀분석은 조정된 결정계수로 본다. 1에 가가울 수록 회귀모델이 실제값을 잘 설명함 유의한 F값이 0.05 미만이면 이 회귀 모델이 유의미 하므로 사용가능함 p값이 0.05보다 작은 변수들이 종속 변수 y에 영향을 미칠것으로 기대되는 변수들 y = ax1 + bx2 + cx3 + Ω 0. 독립변수가 16개 이상이라면 상관분석을 실시하여 값이 높은것을 뽑아 다중회귀분석 실시 1. 모든 변수로 다중 회귀 분석 실시 (단 엑셀에서는 최대 16개까지) 2. 유의미한 변수들로 다중선형회귀 분석 돌리기 3. 각각 단순선형회귀 돌리기 시계열 데이터 분석 : 시간의 흐름에 따라 발생괸 데이터를 분석하는 것 정상성: 추세나 계절성을 가지고 있지 ..

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_10

단순 선형회귀분석 : 독립변수 x가 변할때 종속 변수 y가 어떻게 변하는지 가장 잘 설명해주는 직선을 찾아 그 직선이 x와 y의 관계를 얼마나 설명하고 있는지 분석하는 방법 -> y와 x사이의 1차 방정식 구하기 오차: 실제값 - 예측값 결정계수: (R^2 , R=상관계수) : 0~1 사이의 값을 가짐, 즉 0% ~ 100%, 높을수록 모델의 설명력을 나타냄, 유의한 F: (p-value) : 귀무가설은 우리가 만든 회귀식이 유의미하지 않다. 대립가설은 회귀식이 유의미 하다를 가지고 가설검정을 한다.따라서 이 유의한 F가 0.05보다 크면 이 모델을 기각해야함. 독립 변수를 버리거나 수정해서 다시 회귀분석을 진행해야함 E-정수 : 매우작은 수 E+정수 : 매우 큰 수 계수: y절편= b , x1 = a ..

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_09

대립가설이 맞다고 주장 할 수는 없다 단 귀무가설을 기각시킴으로써 귀무가설과 반대되는 대립가설이 맞다고 하는 것 귀무 가설이 맞다는 전제하에, 내가 뽑았던 표본이나 실험에서 일어나면 안되는 일이 일어난다면 귀무가설을 기각 할 수 있음(이때 이런 일이 발생할 확률 = 유의확률 = p-value)(귀무가설을 기각하기위한 기준) 귀무가설이 평균 무게 100키로 라고 하면, 표본의 평균 무게도 100키로여야함. 그러나 표본의 평균무게가 30키로 였다면 평균무게가 100키로라는 귀무가설을 기각 할 수 있다는 것임. 두 집단(또는 한집단의 전,후)의 평균에 유의미한 차이가 있는지 (t-test) 두 환자의 간수치는 모두 100이다, a환자는 약을 복용하지 않고 b환자는 약을 복용한다. b환자는 80으로 간수치가 줄..

* 조건에 부합하는 중고거래 댓글 조회하기

select a.TITLE, a.BOARD_ID, b.REPLY_ID, b.WRITER_ID, b.CONTENTS, DATE_FORMAT(b.CREATED_DATE,"%Y-%m-%d") as CREATED_DATE from (select * from USED_GOODS_BOARD where DATE_FORMAT(CREATED_DATE,"%Y-%m") = "2022-10") as a inner join (select * from USED_GOODS_REPLY) as b on a.BOARD_ID=b.BOARD_ID order by b.CREATED_DATE,a.TITLE; 잘 모르겠음.. 다른 솔루션 검색 필요 https://school.programmers.co.kr/learn/courses/30/less..

재구매가 일어난 상품과 회원 리스트 구하기

ONLINE_SALE 테이블에서 동일한 회원이 동일한 상품을 재매한 데이터를 구하여 재구매한 회원 ID와 재구매한 상품 ID를 출력하는 SQL문을 작성 SELECT USER_ID,PRODUCT_ID from ONLINE_SALE group by USER_ID,PRODUCT_ID having count(PRODUCT_ID)>1 order by USER_ID,PRODUCT_ID desc; USER_ID 와 PRODUCT_ID를 GROUP BY로 묶은 뒤에 그룹별 집계된 결과 중 원하는 조건의 결과만 필터링 하기위해 HAVING 절을 사용한다. ORDER BY는 정렬을 하는데 기본적으로 오름차순 ASC 이고 생략가능하다. 내림차순은 컬럼명 옆에 DESC을 작성하면 된다.

[프로그래머스_SQL] 오프라인/온라인 판매 데이터 통합하기

with sale as(select SALES_DATE,PRODUCT_ID,USER_ID,SALES_AMOUNT from ONLINE_SALE union all select SALES_DATE,PRODUCT_ID,null USER_ID,SALES_AMOUNT from OFFLINE_SALE ) select date_format(SALES_DATE,'%Y-%m-%d'),PRODUCT_ID,USER_ID,SALES_AMOUNT from sale where SALES_DATE like "2022-03%" order by SALES_DATE,PRODUCT_ID,USER_ID ▶ 임시 테이블 만들기 with 구문을 사용하여 sale 이라는 임테이블을 만든다. 이 sale 이라는 테이블은 ONLINE_SALE 테이..

728x90