Blair  - Soul Eater [패스트캠퍼스] 데이터 분석 부트캠프 12기_태블로 프로젝트 후기

• 패스트캠퍼스 데이터분석 부트캠프 12기/BDA 12기 패리포터 기자단

[패스트캠퍼스] 데이터 분석 부트캠프 12기_태블로 프로젝트 후기

oujin 2024. 3. 20. 20:12
728x90

 

 

안녕하세요 어느덧 데이터분석 부트캠프를 시작한지 94일이 되었네요:)

며칠전에는 태블로 프로젝트를 마치게 되었습니다.

24.02.06-24.03.04 까지는 태블로 교육을 받고

24.03.05-24.03.15 동안은 태블로 프로젝트를 진행하였습니다!

 

지금까지 프로젝트 후기와 비슷하게 다음과 같은 순서로 후기를 작성해 보려고 합니다~!

 

1. 데이터셋 종류 와 제가 선택한 데이터셋 설명

2. 전반적인 프로젝트 진행

3. 저희조의 프로젝트 설명 및 결론

4.프로젝트를 통해 배운점과 느낀점

 

패스트캠퍼스 데이터분석 부트캠프에서 진행하는 태블로 프로젝트에 관해서

궁금하신 분들께 도움이 될 수 있도록 최대한 자세하고 꼼꼼하게!

포스팅 하도록 하겠습니다:)


 

 

01. 데이터셋 설명

데이터는 3가지 중에서 고를수 있었습니다!

1. 항공

2. 아파트

3. 지역사회 건강조사 

항공 아파트 지역사회 건강조사 

 

 

 

 

02. 전반적인 프로젝트 진행 및 목표

프로젝트 목적
1.학습 과정에서 익혔던 태블로의 다양한 기능들을 조합하여 스토리텔링 대시보드를 제작하는 것이 목표!
2.시각화 결과에서 드러난 내용을 해석하고, 이를 효과적으로 청중에게 전달하는 법을 경험하기!

 

프로젝트 진행 방식

1.  줌 소회의실에서 온라인으로 진행

2. 지정된 날짜와 시간에 소회의실로 강사님께서 들어오셔서 피드백 진행

3. 피드백은 프로젝트 기간내 약 5회정도 시행됨 

 

발표 방식

1. PPT가 아닌 태블로 대시보드를 줌 화면공유로 발표

2. 15~20분 발표 진행

3. 팀내에서 발표자 수는 자율

 

 

 

 

03. 진행한 프로젝트 설명 및 결론

주제: 당뇨환자와 비당뇨환자의 생활습관 비교를 통해 당뇨와 생활습관과의 영향성 분석

데이터 설명: 2022년 지역사회 건강조사 데이터.
                     23만여명의 설문자를 대상으로 138문항을 통해 국민의 신체적,정신적 건강 및 생활 습관을 알아본 자료.

 

 

대시보드는 태블로 퍼블릭에 게시하여 팀원들과 공유하니 편했습니다:)

저의 태블로 프로젝트도 해당 퍼블릭에 공유가 되어있습니다~!

https://public.tableau.com/app/profile/oh.woojin/vizzes

 

oh woojin - Profile | Tableau Public

데이터 분석가 .☆.。.:.+*:゚+。.゚・*..☆.。.:*.☆.。.:.+*:゚+。.゚・*..☆.。.:*.☆.。.:.+*:゚+。.゚・*..☆.。.:*

public.tableau.com

아래의 내용을 위의 퍼블릭 사이트에서 같이 보시면서 읽으시면 더욱 이해가 잘 되실거라고 생각합니다:)

 

 

 

 

표지에는 당뇨질환자와 비질환자의 생활습관 비교 및 영향요인 분석이라고 적었습니다.

그리고 귀여운 저혈당과 고혈당 이미지를 넣었습니다. 

 

 

 

 

저희가 발표하는 내용이 작은 소주제가 다양한 갈래로 뻗어있다 보니까 발표내용을 목차로 처음에 정리하는 것이 좋다고 판단되어 나중에 추가로 넣었습니다.

대시보드는 한눈에 들어오는 것이고 이렇게 PPT처럼 만드는 것이 아니라는 생각이 있었는데 목차가 있으니 발표내용을 처음에 정리하고 들어가는 것 같아 훨씬 효과적이라고 생각했습니다.

 

 

 

 

발표 처음에는 지역사회 건강조사 데이터 내에서 어떠한 기준으로 약물당뇨인과 비당뇨인으로 그룹핑 하였는지를 말씀드렸습니다.

1. "당뇨병을 진단받은 적이 있습니까?" 라는 질문을 통해 첫번째로 당뇨인과 비당뇨인으로 구분하였습니다.

 2. 여기서 진단받은 적 있는 당뇨인들은 현재 약물치료 (당뇨병약 OR 인슐린주사)  를 하고 있는지와 약물치료 없이 관리를 하고 있는지로 나뉘게 됩니다.

저희는 완치의 가능성이 있고 경증일 확률이 높은 비약물당뇨인을 제외하고 현재 약물치료를 하고있는 당뇨병 환자에 집중하여 분석을 해보았습니다.

 

약물당뇨인의 유형기간별/나이대별 나눔 기준

저희는 이러한 약물당뇨인을 유형기간과 나이대별로 나누었습니다.

유병기간은 현재 만나이와 당뇨병을 진단받은 나이의 차로 계산하여 구하였습니다.

유병기간을 약물당뇨인의 특성이 가장 다르게 보여지는 1년이내, 2~3년, 4~9년, 10년이상이라는 총 4가지의 그룹으로 나누었습니다.

나이대별로 나눈 기준은 만나이를 기준으로 청년층, 중장년층, 노년층 3가지로 나누었습니다. 

20~30대, 40~60대, 70대 이상의 그룹으로 그룹핑 하였고 이는 약물당뇨인의 평균나이 67.43세를 기준으로 나누었습니다.

또한 위의 나이대 구분 이외에 특정 질문에는 다른 나이대 구분 기준을 사용하였습니다.

 

 

 

 

당뇨와 비만의 연관성 및 체중에 영향을 미치는 생활습관을 분석해 보았습니다.

비만을 분석하기 위해서는 BMI지수로 그룹핑 하는 것이 보다 설득력 있을것 같아 설문 내용중 키와 몸무게 답변으로 국가건강정보를 기준으로 BMI지수를 구하고 저체중, 정상, 과체중, 비만으로 나누었습니다.

 

BMI 지표 특징

1. 비당뇨인 VS 약물 당뇨인

비당뇨인 그룹: 정상 BMI수가 제일 많음 > 비만 > 과체중 > 저체중

약물당뇨인 그룹: 비만 BMI수가 제일 많음 > 정상 > 과체중 > 저체중

-> 약물 당뇨인 그룹은 비만BMI인 사람의 비율이 높고, 비당뇨인 그룹에서는 정상BMI인 사람의 비율이 더 높아 이는 비만이 당뇨병 발병과 관련이 있음을 나타냄

 

2. 유병기간별 약물당뇨인

20~30대: 당뇨인이 비당뇨인대비 비만의 비율이 매우 높음/ 유병기간이 길어질수록 비만의 비율 감소

-> 최초 진단시 비만의 비율이 높은 것을 바탕으로 당뇨와 비만의 경향성이 보임을 시사

40~60대: 과체중비율은 유병기간이 증가함에 따라 약간 증가/ 10년이상의 환자에서 가장 높은 수치/ 비만비율은 유병기간이 길어질수록 감소하는 경향

70대 이상: 당뇨인이 비당뇨인대비 비만의 비율이 높게는 나타나나, 다른 연령대에 비해 차이가 크지 않음./ 비만 비율은 유병기간이 길어질수록 감소하는 경향을 보임

 

따라서 전반적으로 유병기간이 길어질 수록 비만체중 비율은 감소하고, 정상체중 비율은 증가하는 경향성이 있음.

그러나 과체중 비율은 다양한 패턴을 보임

이는 연령대와 당뇨병 관리 방법에 따라 차이가 날 수 있기 때문이라고 판단함.

20~30대에서는 비만의 비율이 매우 높아 젊은층의 당뇨발병원인에 비만이 크게 작용했을 것이라고 보인다고 추론가능

 

체중조절경험 + 영양표시 활용

체중조절에 있어 비당뇨인과 당뇨인 그룹간의 인식차이가 있는지 확인하였습니다.

체중조절 경험의 감량경험, 유지경험, 증량경험, 관심없음의 답변을 살펴보았습니다.

 

1. 체중조절경험

20~30대 약물당뇨인의 경우에 비당뇨인보다 감량경험이 더 많고  관심없음의 응답룰이 더 낮았습니다.

40~60대와 70대 이상에서는 약물 당뇨인과 비당뇨인은 미세한 차이는 있지만 감량경험과 관심없음의 비율이 동일한 경향성을 보였습니다.

-> 이를 통해 비만 비율이 가장 높았던 20~30대가 체중조절에 가장 힘쓰고 있음을 알 수 있었음

 

2. 영양표시

식품의 영양표시를 활용하는지와 관련된 생활습관 입니다.

전체 유병기간에서 당뇨인은 비당뇨인보다 영양표시 활용비율이 적었습니다.

40~60대와 70대 이후도 거의 위와 같은 경향성을 보이지만 20~30대는 당뇨인이 비당뇨인보다 전체 유병기간에서 영양표시 활용을 잘하고 있는 것으로 보입니다.

 

왜 그런지에 대해서는 비당뇨인과 약물당뇨인의 BMI분포를 보았을때, 20~30대의 비만 비율이 40~60대와 70대 이후 그룹의 비만비율의 2배가량 높은 것을 알 수 있습니다.

비만율이 제일 높은 20~30대가 감량경험이 제일 많은것이 영향표시 활용 비율이 가장 높은것과 관련이 있는 것으로 보입니다.

 

 

 

 

체중조절경험과 '관심없음'에 응답한 당뇨병환자 분석

유병기간이 늘어날 수록 체중조절에 관심이 없는 비율이 증가합니다.

유병기간에 따라 비만 BMI비율이 감소 했던것을 연관지어 생각해 보았을때 , 당뇨를 오래 앓으면서 체중 조절 관리에 능숙해진 것을 수도 있겠다는 생각을 했습니다.

 

그래서 체중조절에 '관심없음'이라고 응답한 사람들만의 BMI를 살펴보았습니다.

그결과 전체 BMI결과와 동일하게 유병기간이 길어짐에 따라 BMI가 감소하는 것을 보아 이미 체중관리를 잘하기 때문에 관심이 낮아졌다고 해석이 가능했습니다.

 

그러나 여전히 관심없음으로 응답한 사람들가우네 비만과 과체중BMI인 사람들이 절반 이상이라는 점, 비당뇨인 그룹과 비교했을 때도 그 비율이 더 높다는 점. 을 생각해보았을때 마찬가지로 약물 당뇨인이 비당뇨인에 비해 체중조절에 대한 필요성이 더 있음에도 불구하고 더 낮은 관심을 보인다고 해석 할 수 있었습니다.

 

특히 관심없음에 응답한 비만비율은 연령대가 낮을수록 높아졌습니다.

 

즉 당뇨병환자만 살펴보았을때 , 유병기간에 따라 비민의 비율이 감소하지만 여전히 체중조절에 관심이 없는 사람중, 비만과 과체중의 비율이 높은 것을 확인 할 수 있었습니다.

이는 과체중과 비만 당뇨인들은 꾸준히 체중관리에 대한 관심이 없는 상태라는 것을 의미합니다.

 

식이문제

식이 문제란 식욕저하 및 과식과 관련된 질문입니다.

1. 나이별로 보았을 때 20~30대에서 식이문제를 겪는 비율이 가장 높고, 비당뇨인과의 차이도 14%로 가장 컸습니다.

2. 유병기간별로 보았을 떄 20~30대는 유병기간에 따라 당뇨 진단 3년 이내의 집단에서 식이 문제가 가장 높게 나타나며 유병기간이 길어짐에 따라 그 비율이 점차 감소합니다.

반면, 40~60대와 70대 이상의 그룹은 유병 기간이 길어질 수록 식이 문제를 가진 사람의 비율이 증가하다가 10년이상의 그룹에서 증가폭이 보다 커지는 것을 볼 수 있습니다.

 

따라서 BMI와 당뇨와의 관련성이 가장 높은 2-30대에서 식이문제 발생률이 가장 높은 것을 보았을 때,

특히 젊은 나이에 좋지 않은 식사습관으로 비만인 사람들이 당뇨 위험에 노출 될 가능성이 높다는 것을 생각해볼 수 있습니다.

그러나 당뇨 유병기간이 길어지면서 식이문제가 감소하는 추이를 보이고 비당뇨인보다 높은 체중감량률, 그리고 영양표시 활용률을 고려했을 때 , 다른 나이대에 비해 관리의지가 높았습니다.

다시말해 20-30대의 약물당뇨인이 비만율이 가장 높음과 동시에 관리의지가 가장 높다고 볼 수 있겠습니다.

 

 

 

 

운동시간

1. 총운동시간:

약물당뇨인과 비당뇨인모두 나이대가 높을 수록 운동량이 더 많은 경향이 있고,  약물당뇨인이 비당뇨인보다 운동을 더 많이 하거나 비슷 경향이 보였습니다.

 

2. 운동별 운동시간: 

운동을 걷기, 중강도운동, 고강도운동 이렇게 나누어 시간을 살펴보았을때, 약물당뇨인이 비당뇨인보다 하루 평균 운동시간이 10분에서 30분정도 많은 것으로 보여졌습니다.

 

따라서 해당 응답은 이미 당뇨를 진단받은 시점에서의 운동량이므로, 유병당뇨인이 운동을 통해 당뇨를 관리하고 있기 때문에 비당뇨인보다 운동량이 더 많은 것으로 보여집니다.

 

흡연

파란색 X 표시는 과거에는 담배를 피웠으나 현재 금연을 한 그룹을 의미하고,

빨간색 O 표시는 현재에도 담배를 꾸준히 피우고 있는 그룹을 의미합니다.

 

비당뇨인 그룹에서 금연 중인 비율이 가장 낮게 나왔고, 당뇨 진단 시기가 길어질 수록 금연하는 사람의 비율이 높아지는 것처럼 보여졌습니다. 그러나 연령별로 나누어 확인 해본 결과,

당뇨병의 여부, 진단 기간에 관계없이 20-30대 그룹은 흡연자의 비율이 높게 나오고 70대 이상의 노인분들은 금연 비율이 높게 나타나는 것을 확인할 수 있었습니다.

 

이를 통해 진단 기간이 길어짐에 따라 당뇨를 오래 앓으실 확률이 높은 노인분들의 비율이 높아지면서 금연한 사람의 비율또한 높아진다라고 예측해볼 수 있었습니다.

 

음주

음주도 흡연과 비슷한 양상을 보입니다.

전체 인원을 살펴보았을 때는 약물 당뇨인이 비당뇨인에 비해 옅은색의 면적, 금주 혹은 절주의 비율이 월등히 높은 것을 확인하실 수 있습니다.

 

그러나 이 또한 연령별로 살펴 보았을 때, 당뇨병의 여부, 진단시기의 길이와 관계없이 2-30대의 잦은 음주의 비율이 높은 반면 70대 이상의 노인분들의 금주 비율이 월등히 높다는 사실을 확인할 수 있습니다.

따라서 음주 여부는 흡연과 마찬가지로 연령대에 따른 경향성만을 확인했을뿐 당뇨와의 유의미한 관련성을 볼 수 없었습니다.

 

 

 

 

 

당뇨병은 치주염의 염증 반응을 촉진하고 잇몸뼈를 흡수시켜 잇몸 건강을 악화할 수 있기 때문에 당뇨병 환자들이 저작불편을 경험할 것이라고 생각되어 해당 컬럼을 보게되었습니다.

 

약물당뇨인과 비당뇨인의 저작불편 경험을 보면 매우불편하다와 불편하다는 약물당뇨인의 비율이 높고, 매우양호하다와 양호하다는 비당뇨인의 비율이 높았습니다.

 

매우불편하다와 불편하다를 빨간색 선인 불편그룹으로, 매우양호하다와 양호하다를 남색 양호그룹으로, 그리고 나머지 하늘색 보통 그룹으로 나누어 당뇨병 유병기간에 따라서 비율이 어떻게 되는지 확인하였습니다.

 

그결과 당뇨병 유병기간이 길수록 비당뇨인 그룹에 비해 불편하다의 비율은 커지고 양호하다의 비율은 감소하는 것을 볼 수 있었습니다.

하지만 저작불편의 경우 나이에 영향을 크게 받는 요인이라 생각되어 나이대별로 나누어 살펴보았습니다

 

  1. 20-30대를 보시면 비당뇨인과 당뇨인 모두 불편하다의 비율이 제일 낮고, 전체 유병기간에서도 낮음을 보입니다.
  2. 그러나 40-50대를 보시면 비당뇨그룹은 여전히 불편그룹이 제일 낮은 비율을 차지하지만 약물당뇨인의 그룹에서는 불편하다의 비율이 보통의 비율을 넘어섰습니다.
  3. 60-70대에서는 그 증가 폭이 커졌고 비당뇨그룹에서도 불편이 보통을 넘어섰습니다
  4. 80대 이후에서도 마찬가지로 불편그룹의 비중이 크게 증가한 모습을 보입니다.

이를 통해 40-50대 이후부터 약물당뇨인 그룹이 비당뇨인보다 비교적 이른 나이에 저작 불편을 겪는다는 사실을 유추해 볼 수 있었습니다.

 

당뇨병과 정신건강의 관계

당뇨병과 정신건강의 관계성을 확인해보았습니다.

왼쪽아래 그래프는 주관적 스트레스의 경우 평소 일상생활 중에 스트레스를 어느정도 느끼고 있습니까? 라는 질문에 대단히 많이 느낀다, 많이 느낀다라고 응답한 사람들의 비율을 당뇨병 진단 기간에 따라 나타낸 그래프입니다.

 

오른쪽아래 그래프가 나타내는 우울감 경험여부는, 최근 1년동안 연속적으로 2주이상 일상생활에 지장이 있을정도로 슬프거나 절망감을 느낀 적이 있습니까? 라는 질문에 예라고 응답한 사람들을 우울감을 경험한 사람들의 비율을 당뇨병 진단 기간에 따라 나타낸 그래프 입니다.

 

20-30대의 경우, 회색 비당뇨인 대비, 노란색 약물당뇨인의 스트레스와 우울감 정도가 매우 높은것을 확인할 수 있습니다. 특히 3년 이하의 유병기간을 갖는 약물당뇨인의 스트레스 높음 비율이 비당뇨인에 비해 급증하는 것으로 보아, 진단받은지 얼마 되지 않은 20-30대의 경우 스트레스가 특히나 심한 것을 확인할 수 있고, 또한 유병 기간이 길어질 수록 우울감 또한 굉장히 높아지는 것을 확인할 수 있습니다

 

다만 40-60대의 경우, 우울감과 스트레스 모두 비당뇨인과 비교했을 때 당뇨인에서 비율이 조금

 

70대이상의 경우, 비당뇨인과 당뇨인 차이가 거의 나지 않아, 당뇨가 스트레스와 우울감에 크게 관여하지 않음을 알 수 있습니다.

 

따라서 20-30대에게 당뇨병 유무가 큰 스트레스 및 우울감의 원인이라고 유추해 볼 수 있습니다.

 

 

 

 

마치며

  1. 해당 분석을 통해 생각보다 당뇨인들이 음주나 흡연, 체중조절과 같이 저희가 생각하기에 당연하다고 생각하는 요인들을 등한시하고 있다는 사실을 확인해 볼 수 있었습니다.
  2. 또한 비당뇨인보다 생활습관에 더욱 주의를 기울이고 관심을 가져야 하는 비당뇨인의 생활습관에 대해 분석한 결과를 제시함으로써 당뇨인들이 보다 더욱 적극적으로 관리하는 계기가 될 수 있다면 좋겠습니다.

 

 

 

 

04. 배운점 및 느낀점

 

하나의 데이터를 시각화 하고 설득력있게 전달하는 자료를 만든다는 것이 생각보다 어려운 것이라는 것을 다시한번 깨달았습니다.

또한 서로 어떤 그래프가 해당 자료를 통해 저희가 말하고자 하는 바를 더 명확하게 나타낼 수 있는지를 이야기를 많이 나누었고, 각자가 만든 그래프에 피드백을 정말 많이 나누었는데 다들 해당 프로젝트에 열의가 있고애정을 갖고 하시는 구나가 느껴졌습니다.

하나라도 더 우리의 프로젝트가 발전되고 개선되기를 바라는 마음에서 정규 회의시간이 끝났음에도 불구하고 자발적으로 디벨롭 하시는 모습에서 열정을 느낄 수 있었습니다.

 

저는 이번프로젝트를 통해서 태블로를 사용해서 효과적인 시각화 자료를 만드는 방법을 배우기도 했지만,

피드백을 통해 프로젝트가 더 나은 방향으로 진행되는 과정을 겪어볼 수 있었습니다.

이 경험이 매우 재미있었고 앞으로 제가 할 모든 프로젝트에서도 계속 느껴볼 수 있으면 좋겠다고 생각했습니다.

 

 

 

 

이상으로 태블로 프로젝트 후기 포스팅을 마치도록 하겠습니다:)

궁금하신 점이 있으시면 댓글로 남겨주세요~!

 

 

728x90