Blair  - Soul Eater [패스트캠퍼스] 데이터 분석 부트캠프 12기_파이썬 프로젝트 후기

• 패스트캠퍼스 데이터분석 부트캠프 12기/BDA 12기 패리포터 기자단

[패스트캠퍼스] 데이터 분석 부트캠프 12기_파이썬 프로젝트 후기

oujin 2024. 2. 9. 02:24
728x90

 

 

 

안녕하세요! 패스트 캠퍼스 데이터 분석 부트캠프  12기 기자단으로 활동하고 있는 오우진입니다 :)

이번에는 24년 01월 16일 ~ 25일 동안 진행된  '파이썬 프로젝트'에 대한 후기로 인사드립니다!

 

패스트캠퍼에스에서 총 4번의 프로젝트를 진행하는데 첫번째 프로젝트인 파이썬프로젝트 입니다!

 

패스트캠퍼스의 프로젝트에서 어떠한 것들을 하는지 궁금하신 분이 계실거라고 생각을 해서

저희 조가 진행한 프로젝트에 관해서 설명하고

파이썬 프로젝트를 진행하면서 느꼈던 점, 배운 점 등을 말해 보려고 합니다 :)

 

어떻게 진행되는지 궁금하신 분들을 위해 간단하지만 꼼꼼하게 작성하려고 노력했습니다!

수료 중인 학생들이 어떻게 진행을 하는구나를 파악하시는 데에 도움이 되셨으면 좋겠습니다! 

 


1. 분석 프로젝트 설명

 

A. 프로젝트 목적

최근 5년간 검색어 상위권에 있는 샴푸 브랜드 제품과 하위권에 있는 샴푸 브랜드 제품의
검색어 및 거래 데이터를 분석하여 하위권 샴푸 브랜드 제품의 판매량 증진에 도움이 되는
유의미한 요소 도출

 

B. 프로젝트 일정

📌 프로젝트 시작 - 주제선정 - 전처리 - 분석 - 인사이트 도출 - 정리 - 발표
프로젝트 시작, 주제 선정 : 2024년 1월 16일
데이터 리서치 : ~ 1월 17일
데이터 전처리 : ~ 1월 21일
인사이트 도출: ~ 1월 23일
결과 정리: ~ 1월 24일
발표 : 1월 25일

 

C. 데이터 리서치 및 전처리 

1. 최근 6년간 제품 검색량 순위를 통한 상, 하위권 제품 20개 선별
2. 최근 6개월간 제품 판매량 순위를 통한 상, 하위권 제품 데이터 도출
3. 상위권 제품들의 고객 반응 데이터 수집 및 공통점 분석
4. 하위권 제품들의 고객 반응 데이터 수집 및 공통점 분석
-리뷰를 통한 핵심 키워드 도출
5. 상위권 제품 공통점과 하위권 제품 공통점 간의 차이점 찾기
->상, 하위권이 나눠지는 유의미한 인사이트 도출
* 수집 예정 데이터: 6년 간의 검색량 순위, 고객반응 데이터(네이버 리뷰, 쿠팡 리뷰,
공식몰 리뷰)

 

▶ 상하위권 샴푸의 긍정/부적 키워드 추출 

선정한 샴푸들의 리뷰를 크롤링하고 리뷰 데이터에서 긍적적인 키워드와 부정적인 키워드를 추출하였습니다.

 

 

 

▶ 연도별 제품순위 그래프

 

2018년부터 2023년까지 2년별로 묶어서 탈모샴푸 상위권 제품과 하위권 제품을 선정하였습니다.

 

 

▶ 워드클라우드

 

 

각 샴푸의 긍정과 부정적인 키워드를 분석하여 워드클라우드로 확인하여 보았습니다.

 

 

▶ 네이버 스마트스토어 리뷰, 네이버 쇼핑 리뷰, 쿠팡 리뷰 크롤링

 

이렇게 탈모샴푸 상위권 제품과 하위권 제품을 선정하고, 각 제품의 판매 페이지에서 리뷰 정보를 스크랩하고,

리뷰들에서 키워드 명사를 추출하여 긍정, 부정을 나누었습니다.

이를 통해 각 샴푸에서 어떤 키워드를 마케팅적으로 사용할 수 있다거나 하는 인사이트를 도출해 내고자 하였습니다.

 

D. 결과 

▶ 흑채 시장의 크기 매우 감소하였다.

그 이유로는 탈모를 단순히 가리기보다는 근본적으로 치료하고자 하는 사람의 인식의 변화가 있었다.

그리고 치료 전에 탈모를 예방하고자 하는 사람이 증가하였다.

따라서 치료의 기능이 없는 흑채보다 기능성 탈모샴푸를 구매하는 사람이 증가하여 흑채 시장의 크기 감소가 야기되었다고 판단하였다.

 

▶ 키워드 : 용기, 케이스

상위권에 있는 샴푸들의 긍정적인 키워드를 살펴본 결과 용기라는 단어가 35.59% 등장하였다.

하위권에 있는 샴푸들의 부정적인 키워드를 살펴본 결과 용기라는 단어가 26.67% 등장하였다.

이를 통해 소비자들이  탈모완화 '기능' 만을 보고 구매하는 것이 아니라 용키와 케이스와 같은 패키지가 구매에 영향을 미친다고 판단하였다.

따라서 하위권에 있는 제품은 탈모샴푸 용기를 개선하면 매출의 증가 효과를 가져올 수도 있겠다고 생각했다.

 

▶ 탈모샴푸계의 트렌드 : 맥주효모샴푸

탈모샴푸에도 트렌드가 있음을 확인하였다. 탈모케어 관련 키워드 1950개 중에서 '맥주' 키워드가 들어간 것이 418개로 약 47%를 차지하는 것을 확인하였다. 또한 2020년, 2021년을 기준으로 검색량이 급격하게 증가하는 것을 알 수 있었다.

위를 통해 맥주 샴푸가 탈모샴푸 중에서 인기 있는 키워드라고 판단하였다.

추가적으로 분석한 결과 맥주 제품의 긍정적인 리뷰 키워드에는 '남편'이라는 단어가 등장함을 보았다.

이 남편이라는 키워드는 맥주 관련된 샴푸뿐만이 아니라 다른 샴푸에서도 고르게 나타남을 확인하였다.

 

▶ 마케팅 키워드 : 남편 

위의 표처럼 남편, 아빠, 신랑이라는 단어가 상위 제품과 하위 제품의 긍정적인 키워드에 자주 등장하는 것을 확인하였다.

따라서 여성이 중년 남성 대신 탈모 샴푸를 구매했을 것이라는 가설을 세워보았다. 위의 키워드 분석 결과와 추가로 현재 올리브영에 따르면 탈모 관련 제품 매출이 20대 여성이 1위라는 것과 G마켓의 탈모 관리 용품 구매 고객이 여성의 비중이 60%를 차지하는 것도 참고하였다. 이를 통해 여성 구매자가 남편, 아빠를 대신하여 탈모 샴푸를 구매하고 리뷰를 남겼을 것이라고 예측하였다. 또 이러한 가설을 바탕으로 남성, 아빠라는 키워드를 여성 구매자를 대상으로 한 '남편, 아빠에게 선물하는 샴푸'라는 마케팅 전략으로 활용될 수 있을 것이라고 생각하였다.

 

D. 결론

첫째 하위권 제품은 흑채의 개선이 필요하다.

둘째 전체적으로 용기 관련 불만의 개선이 필요하다

셋째 탈모샴푸의 트렌드는 맥주효모 샴푸이다.

넷째 남편 키워드 마케팅 전략에 사용가능하다.

 

 

여기까지 진행한 파이썬 프로젝트에 관해서 간단하게 설명드렸습니다!

코드를 포함한 더 많고 자세한 내용은 따로 포스팅을 통해 다루도록 하겠습니다 :)

 


 

2. 배운 점 및 느낀 점

 

 

* 파이썬 기초 실력 향상

파이썬 프로젝트를 진행하기 전에 파이썬에 대한 실시간 강의와 인터넷 강의를 학습하고 나서 프로젝트를 진행하게 되는데요. 저는 기본적인 파이썬 지식은 있었지만 전체적으로 정리가 잘 되어있지 않은 상태였습니다. 또한 막상 문제를 풀어보면 사소한 것들에서 자주 문제를 못 풀곤 했습니다. 하지만 강의를 통해 기본기를 탄탄하게 다질 수 있었고, 이때 배운 파이썬 문법들은 프로젝트를 진행하면서 구글링을 통해 다른 분들의 코드를 이해하는 것과 코드를 수정하여 원하는 결과를 보려 할 때도 유용했습니다.

 

* 이커머스 주제 설정

이번 파이썬 프로젝트는 패스트캠퍼스에서 진행하는 4번의 프로젝트 중에서 유일하게 데이터부터 팀원들끼리 수집해야 하는 프로젝트입니다. 저는 팀원들과 피어세션을 가지기 전날에 이커머스라는 주제 안에서 해보고 싶은 것들을 생각해서 정리해 갔습니다. 여러 주제를 말씀드리며 이러한 것들을 생각해 보았다고 말씀드렸습니다. 결과적으로 선택된 탈모샴푸에 관해서는, 분석을 해보지는 않았지만 현재 주위에서 탈모가 아니어도 탈모샴푸를 쓰는 사람이 늘어난 것이 느껴진다라는 내용과 함께 해당 내용으로 탈모샴푸를 쓰는 사람들은 어떤 샴푸를 어떤 기준으로 구매했을까?라는 궁금증이 들어서 이 주제를 생각해 보게 되었다고 말씀드렸습니다.

 

* 배경지식 조사

이렇게 선택된 탈모샴푸라는 주제에 관해서 시장조사를 하면서 알았던 것들에 대해서 근거를 추가할 수 있었고 몰랐던 점도 알게 되었습니다. 이 과정에서 분석에 대한 근거를 보충 가능했으며 더 설득력 있는 발표자료가 되었다고 생각합니다. 

 

* 데이터 수집 및 크롤링

또한 데이터를 직접 수집해야 하는데 이커머스라는 주제 특성상 공공데이터에서 다운로드하기가 어려웠고, 특히 탈모샴푸 주제에 맞는 공공데이터는 수집하기가 더욱 어려웠습니다. 그래서 리뷰 데이터를 크롤링하기로 결정하였고 이 크롤링이라는 것은 이번 프로젝트를 통해 처음 진행했지만, 처음 보는 페이지도 차근차근 코드를 수정해 가며 원하는 부분을 반복적으로 크롤링하는 코드도 만들 수 있게 되었습니다.

크롤링 코드를 짜본 적이 없어 막막했지만 이렇게 막상 눈앞에 해야 할 일로 닥치니 해결하고 있는 자신을 발견할 때는 솔직히 조금 놀랐습니다. 또한 코드를 수정하면서 맞닥뜨리는 무수히 많은 오류코드들을 해결하면서 파이썬 실력이 더욱 향상되었다고 느꼈습니다.

 

* 소프트스킬 향상

이번 프로젝트에서 저는 조장을 맡게 되었는데요 처음에 4명이었던 조가 시작부터 한분이 불참하시게 되면서 3명으로 프로젝트를 진행하게 되었습니다. 그 결과로 팀원들의 업무 비중이 향상되었다고 생각되어 힘들다는 얘기도 나왔습니다.

또한 데이터 분석 방향이나, 분석한 결과에 대해서 서로 의견을 공유할 때 서로 생각이 다른 상황도 발생했습니다. 이렇게 서로 지쳐있는, 잘못하면 마음이 상할 수도 있게 되어버리는 상황에서 자신의 생각을 말하되, 서로를 배려해서 말할 줄 아는 방법을 더 익히게 된 것 같습니다.

 

 

 

마지막으로 파이썬 강사님께 각 조의 팀장은 내가 생각하는 우리 조의 총평을 보내야 했습니다!

저는 5조  팀장 오우진입니다
주제: 고객반응 데이터를 통한 탈모케어 인기순위 상/하위권 제품의 탈모샴푸 키워드 분석 및 인사이트 도출 프로젝트

총평 : 샴푸 리뷰 데이터의 긍부정 키워드 도출을 통해, 탈모케어 분야에서 흑채는 감소하는 추세이고, 맥주효모 샴푸가 떠오르는 트렌드임을 보았으며 또한 남편이라는 키워들로 통한 마케팅 활용 방안 제안, 하위권 제품의 용기 관련 부정 키워드가 많았던 것으로 보아 개선이 필요한 점을 제안하였습니다. 프로젝트를 통해 위와 같은  인사이트 도출이 가능했습니다.

또한 긍부정 키워드를 로지스틱 회귀를 통해 검증하려고 했던 점도 분석 결과의 설득력을 향상하기 위한 좋은 시도였다고 생각합니다.

 

 

이렇게 보냈는데요 , 위의 내용과 마찬가지로 분석을 최대한 정확하게 하려고 노력했고 분석결과의 설득력을 향상하기 위한 시도를 하면서 데이터를 살펴보는 방법과 마음가짐, 역량 모두를 향상할 수 있는 좋은 경험이었다고 생각합니다.

 


 

이번 파이썬 프로젝트를 하면서 서로 노력한 것도 잘 알고, 같이 고생한 전우라는 느낌을 받았습니다. 또한 서로가 힘들게 시간을 투자해 가며 해당 프로젝트의 완성도를 높이려고 다양하게 아이디어를 내면서 진행한 것을 알기에 더욱 뜻깊은 프로젝트였다고 생각합니다. 이 프로젝트를 같이 한 팀원들이 정말 좋은 인연으로 앞으로도 계속 이어가고 싶습니다. 이번프로젝트를 하면서 서로 많이 힘들었다고 얘기를 했었습니다. 하지만 서로 결과적으로는 정말 이렇게 좋은 팀원을 만나고 함께했기 때문에 이틀에 한 번씩 밤을 새우는 것도 좋았고, 이렇게 밤새서 작성한 코드를 보시고 수고 많으셨다고 칭찬해 주시는 것을 듣는 것도 좋았다는 이야기도 나누었습니다 :)  프로젝트의 결과가 좋은 것도 물론 중요하지만, 그 과정에서 함께하는 팀원도 굉장히 중요하다는 것을 다시 한번 느낄 수 있는 시간이었다고 생각합니다! 탈모샴푸 분석팀 너무 좋아요~!

 


~파이썬 프로젝트 후기 끝~

 

 

728x90