🚧진행중
#FFF6B3 살구
#FFE2E2 연핑크
분석 목표 (목차)
1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기
- 음수(-) 마진 발생 원인 분석 및 해결책 제시
- 지역별 수익성 분석
- 제품별 수익성 분석
2. 매출 KPI: 시간 흐름별 매출 추이를 추적해 시기에 맞는 매출 향상 전략 세우기
3. 배송 KPI: 현재 배송 등급의 문제점을 찾고, 최적의 배송 등급제 만들기
1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기
< 음수 마진 발생 가능성을 줄이기 위한 주요 원인 분석>
a. 문제 상황 및 데이터 설명
<데이터셋 분석에서 발견한 특징>
- Profit 컬럼의 표준편차가 매우 크고 최솟값이 -3839라는극단적인 값을 보였다.
- 이는 수익성 분석에 있어 중요한 이상치 또는 특정 거래의 손실 발생 가능성을 나타내며, 이에 대한 원인 분석이 필요하다고 판단하였다.
<이상치 검토>
- 데이터 검증 결과, 잘못된 데이터 입력은 발견되지 않았다. 수익성 분석을 위해 Profit 컬럼 외 Margin 컬럼을 제작.
- Margin 컬럼 제작 = (Profit / Sales) * 100 (* 이 데이터 셋에서 Sales는 이 데이터 셋에서 할인 후 금액이다. )
<Margin 분포 분석>
결과:
- Margin 값은 대부분 양수로 나타나 기업 수익성이 전반적으로 안정적인 수준임을 보여준다.
- 그러나, 음수 값이 전체의 약 11%를 차지하며, 이는 특정 거래에서 손실이 발생했음을 시사한다.
해석:
💡 Margin의 평균을 보면 11%로 기업 수익성에서 나쁜 수준은 아니다. 그러나 수익성 강화라는 전체 목표를 위해 Margin의 원인을 분석하고자 했다.
b. 가설 설정 및 탐색적 데이터 분석 (EDA)
"음수 마진의 주요 원인은 할인율 때문일 것이다."
"할인율이 높아질수록 Margin에 부정적인 영향을 미칠 것이다."
<추가 컬럼 생성>
- 할인 전 판매금액 (Original Sales) = Sales / (1-discount)
- 할인 액 (discount cost) = Original Sales * discount
- 할인 외 비용( other cost) = Sales - Profit
<할인율에 따른 비용 변화와 마진>
결과:
- 할인율이 올라갈 수록 Margin은 감소한다.
- Margin의 임계점 (Margin = 0) 은 Discount = 0.2일때 발생한다.
- Discount가 0.6보다 높아지면 할인액(discount Cost)이 할인외비용(Other cost) 을 초과한다.
<Margin과 Cost의 상관관계>
결과:
- 할인액(Discount_Cost)의 기울기(-0.04)가 할인 외 비용(Other_Cost)의 기울기(-0.01)보다 4배 더 크며, 이는 Margin에 더 강한 부정적 영향을 미친다는 것을 보여준다.
해석:
- 할인 외 비용(Other_cost)은 여전히 큰 비용 항목으로 작용하지만, 특정 거래에서는 과도한 할인으로 인해 할인 액이 주요 손실 요인이 되는 경우가 확인되었다.
- 💡 할인율 관리가 기업의 음수 마진을 방지하기 위한 수익성 관리의 핵심 과제임을 알 수 있다.
" 그렇다면 할인은 언제 발생할까? "
- 기업의 할인 정책은 일반적으로 고가 제품에 고객을 유인하기 위한 전략적 수단으로 활용된다. 이를 검증하기 위해 판매가와 원가, 원가와 할인율, 판매가와 할인율의 상관관계를 분석해보았다.
- 또한, 판매가 범위와 지역 및 제품 카테고리별 할인율의 패턴도 추가로 분석해보았다.
<판매가와 원가(할인외 비용)의 상관관계>
결과:
- 상관계수: 0.9769
- 판매가와 원가는 강한 양의 상관관계를 보였습니다.
해석:
💡 판매가와 원가는 비례 관계에 있다.
이는 원가를 기반으로 제품 가격을 책정한다는 기본적인 비즈니스 원칙을 반영한 결과로, 예상과 일치한다.
< 원가(할인 외 비용)과 할인율의 상관관계>
결과:
- 상관계수: 0.0646
- 원가와 할인율 간의 상관관계는 거의 없는 것으로 나타났다.
해석:
💡 원가와 할인율 간의 관계가 약하다.
이는 일반적으로 고가 제품에 더 높은 할인율을 적용하는 비즈니스 규칙에 어긋나는 현상이다.
기업이 할인 정책을 설계할 때 원가와의 비례 관계를 고려하지 않는 것으로 보인다.
< 판매가와 할인율 상관관계>
결과:
- 상관계수: 0.0729
- 판매가와 할인율 간의 상관관계 또한 미미한 수준이다.
<판매가 범위에 따른 평균 할인율>
결과(패턴):
- $0~$50 구간에서 할인율이 가장 높게 나타나는 것을 확인할 수 있다.
- $50~$500 구간에서는 할인율이 상대적으로 낮아지는 경향이 있다.
- 다시 $1000~$5000 이상의 구간에서는 할인율이 상승하는 패턴이 관찰된다.
<지역과 제품 카테고리에 따른 할인율 관계>
결과:
- 특정 지역과 제품 카테고리 조합에서 할인율이 높거나 낮은 패턴이 확인 되었다.
- 특히, Office Supplies 카테고리의 할인율이 상대적으로 높았다.
즉,
- 기업의 할인율은 원가나 판매가와 직접적인 연관성이 낮으며, 할인 정책은 독립적으로 설계되는 것으로 보인다.
- 이는 전통적으로 고가 제품에 높은 할인율을 제공하는 전략과는 다르며, 기업의 할인 정책이 고유한 의사 결정에 기반한다고 볼 수 있다.
추가해서 분석해보면 좋을 데이터
- 지역별 매출과 지역 정보
이를 통해 지역별 구매 패턴과 경제성, 프로모션 효과성을 평가할 수 있다.
c. 💲 비즈니스 인사이트 및 액션플랜
분석 결과 요약 |
|
비즈니스 액션 플랜 |
|
느낀점 🧐
- 데이터 속에서 할인율과 판매 간에 일정한 규칙이 있을 것이라고 짐작했다. (예를 들어, 특정 할인 시즌이나 특정 제품 카테고리의 할인 이벤트가 존재할 것이라고 가정했다.)
- 그러나 도무지 규칙은 보이지 않았고, 그 불규칙성을 이해하지 못한채 굉장히 많은 시간을 소비했다.
- 규칙과 패턴을 발견하려는 목적에만 집중한 나머지, 데이터를 있는 그대로 받아들이지 못했다는 것을 깨달았다.
결론
데이터를 좀 더 편견없는 눈으로 바라보고 해석하자. 데이터가 주는 무작위성 그 자체가 데이터의 특징이 될 수 있다.⭐
'데이터 분석 프로젝트' 카테고리의 다른 글
[kaggle] Netflix Movies and TV Shows EDA 및 비즈니스 인사이트 전략 (3) | 2025.01.07 |
---|