개요
캐글의 commerce 데이터를 활용한 개인 프로젝트입니다.
-
목표
- 기간(전체, 월, 요일, 시간) 및 카테고리별 매출을 파악하여 매출 개선 계획에 도움이 될만한 인사이트를 찾습니다.
- 프로모션을 진행한다면 언제, 어떤 카테고리에서 진행하는 것이 매출 상승에 영향을 줄 수 있을지 분석합니다.
-
가설
-
월별로는 5월, 12월, 1월 매출이 높을 것이다.
- 이유: 다른 사람에게 선물을 해주는 달이면서, 연말 성과금을 받을 수 있는 달로 추가 지출이 늘어나면서 자연스럽게 매출도 오를 것이라고 생각합니다.
-
요일별로는 월요일부터 목요일까지 매출이 금요일부터 일요일까지 매출보다 높을 것이다.
- 이유: 주말에 주문해도 평일인 월요일에 배송이 시작되기 때문에, 주말에 상품 비교를 한 뒤 월요일에 구매하는 사람이 더 많을 것이라고 생각합니다.
-
시간별로는 12시~1시 매출이 가장 높을 것이다.
-
이유: 국내 자료이긴 하지만 월요일 점심시간 전후로 온라인 쇼핑을 가장 많이 이용한다는 연구 결과가 있습니다. 월요일 외에 평일에도 점심시간 즈음에 남는 시간을 이용해서 온라인 구매를 하는 사람이 많을 것이라고 생각합니다.
월요일 점심시간 전후, 온라인 쇼핑 가장 많이 이용
-
카테고리는 생필품 관련 매출이 가장 높을 것이다.
- 이유: 휴지, 치약 등은 매일 사용하는 필수품이기 때문에 매출이 가장 높을 것이라고 생각합니다.
깃허브에서 코드 보기
https://github.com/HAMJiyoung/Brazilian-Commerce-EDA
데이터 설명
- 2016~2018년도에 Olist store의 주문으로 만들어진 브라질 이커머스 퍼블릭 데이터입니다.
- 출처: Brazilian E-Commerce Public Dataset by Olist
- 총 9개의 파일 중 아래 4개의 파일을 사용했습니다.
- olist_order_items_dataset.csv
- 주문 1건 당 해당 주문 id, 물건 개수, 상품 id, 판매자 id, 배송 기한, 상품 가격, 배송비
- 상품 가격과 배송비의 단위는 R$(브라질 헤알)로, 1브라질 헤알 = 0.19달러이다.
- olist_orders_dataset.csv
- 주문 1건 당 해당 주문 id, 고객 id, 주문 상태 정보와 해당 상태가 된 날짜
- olist_products_dataset.csv
- 판매 중인 상품들의 카테고리, 이름 및 설명 길이, 제품 사진, 크기 정보
- product_category_name_translation.csv
- 각 카테고리 이름 ‘포르투갈어 → 영어’ 번역본
<aside>
💡 각 데이터는 전처리를 거쳐 하나의 데이터테이블로 통합하여 분석했습니다.
</aside>
⏮ 첫 페이지 ’🛠 Skills’로 돌아가기
⏮ 첫 페이지 ‘📂 Portfolio’로 돌아가기