본문 바로가기
데이터 분석 프로젝트

Superstore: 커머스 데이터 EDA를 통한 수익성 강화 액션 플랜 🚧진행중

by 꾸꾸집사 2025. 1. 13.

🚧진행중

#FFF6B3 살구
#FFE2E2 연핑크

 

 

분석 목표 (목차)

1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기 

  • 음수(-) 마진 발생 원인 분석 및 해결책 제시 
  • 지역별 수익성 분석 
  • 제품별 수익성 분석 

2. 매출 KPI: 시간 흐름별 매출 추이를 추적해 시기에 맞는 매출 향상 전략 세우기

3. 배송 KPI: 현재 배송 등급의 문제점을 찾고, 최적의 배송 등급제 만들기

 

 


1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기 

< 음수 마진 발생 가능성을 줄이기 위한 주요 원인 분석>

 

a. 문제 상황 및 데이터 설명

데이터셋 dsecribe

 

 <데이터셋 분석에서 발견한 특징>

  • Profit 컬럼의 표준편차가 매우 크고 최솟값이 -3839라는극단적인 값을 보였다.
  • 이는 수익성 분석에 있어 중요한 이상치 또는 특정 거래의 손실 발생 가능성을 나타내며, 이에 대한 원인 분석이 필요하다고 판단하였다.

 

<이상치 검토>

  • 데이터 검증 결과, 잘못된 데이터 입력은 발견되지 않았다. 수익성 분석을 위해 Profit 컬럼 외 Margin 컬럼을 제작.
  • Margin 컬럼 제작 = (Profit / Sales) * 100  (* 이 데이터 셋에서 Sales는 이 데이터 셋에서 할인 후 금액이다. )

 

 

<Margin 분포 분석>

Margin 분포

결과:

  • Margin 값은 대부분 양수로 나타나 기업 수익성이 전반적으로 안정적인 수준임을 보여준다.
  • 그러나, 음수 값이 전체의 약 11%를 차지하며, 이는 특정 거래에서 손실이 발생했음을 시사한다.

해석:

💡 Margin의 평균을 보면 11%로 기업 수익성에서 나쁜 수준은 아니다. 그러나 수익성 강화라는 전체 목표를 위해 Margin의 원인을 분석하고자 했다. 

 

 

 

b. 가설 설정 및 탐색적 데이터 분석 (EDA)

   

    "음수 마진의 주요 원인은 할인율 때문일 것이다."

    "할인율이 높아질수록 Margin에 부정적인 영향을 미칠 것이다."

 

 

<추가 컬럼 생성>

  1. 할인 전 판매금액 (Original Sales) = Sales / (1-discount)
  2. 할인 액 (discount cost) = Original Sales * discount
  3. 할인 외 비용( other cost) = Sales - Profit

 

<할인율에 따른 비용 변화와 마진>

 

 

결과:

  • 할인율이 올라갈 수록 Margin은 감소한다.
  • Margin의 임계점 (Margin = 0)Discount = 0.2일때 발생한다.
  • Discount가 0.6보다 높아지면 할인액(discount Cost)이 할인외비용(Other cost) 을 초과한다.

 

 

<Margin과 Cost의 상관관계>

 

 

결과:

  • 할인액(Discount_Cost)의 기울기(-0.04)가 할인 외 비용(Other_Cost)의 기울기(-0.01)보다 4배 더 크며, 이는 Margin에강한 부정적 영향을 미친다는 것을 보여준다.

해석:

  • 할인 외 비용(Other_cost)은 여전히 큰 비용 항목으로 작용하지만, 특정 거래에서는 과도한 할인으로 인해 할인 액이 주요 손실 요인이 되는 경우가 확인되었다.
  • 💡 할인율 관리가 기업의 음수 마진을 방지하기 위한 수익성 관리의 핵심 과제임을 알 수 있다.

 

 

    " 그렇다면 할인은 언제 발생할까? "

 

 - 기업의 할인 정책은 일반적으로 고가 제품에 고객을 유인하기 위한 전략적 수단으로 활용된다. 이를 검증하기 위해 판매가와 원가, 원가와 할인율, 판매가와 할인율의 상관관계를 분석해보았다.

- 또한, 판매가 범위와 지역 및 제품 카테고리별 할인율의 패턴도 추가로 분석해보았다.

 

 

<판매가와 원가(할인외 비용)의 상관관계>

판매가와 원가 상관관계

결과:

  • 상관계수: 0.9769
  • 판매가와 원가는 강한 양의 상관관계를 보였습니다.

해석:

💡 판매가와 원가는 비례 관계에 있다.
이는 원가를 기반으로 제품 가격을 책정한다는 기본적인 비즈니스 원칙을 반영한 결과로, 예상과 일치한다.

 

 

 

< 원가(할인 외 비용)과 할인율의 상관관계>

원가와 할인율 상관관계

 

결과:

  • 상관계수: 0.0646
  • 원가와 할인율 간의 상관관계는 거의 없는 것으로 나타났다.

해석:

💡 원가와 할인율 간의 관계가 약하다.
이는 일반적으로 고가 제품에 더 높은 할인율을 적용하는 비즈니스 규칙에 어긋나는 현상이다.
기업이 할인 정책을 설계할 때 원가와의 비례 관계를 고려하지 않는 것으로 보인다.

 

 

 

< 판매가와 할인율 상관관계>

판매가와 할인율 상관관계

 

결과:

  • 상관계수: 0.0729
  • 판매가와 할인율 간의 상관관계 또한 미미한 수준이다.

 

 

<판매가 범위에 따른 평균 할인율>

 

결과(패턴):

  • $0~$50 구간에서 할인율이 가장 높게 나타나는 것을 확인할 수 있다.
  • $50~$500 구간에서는 할인율이 상대적으로 낮아지는 경향이 있다.
  • 다시 $1000~$5000 이상의 구간에서는 할인율이 상승하는 패턴이 관찰된다. 

 

 

 

<지역과 제품 카테고리에 따른 할인율 관계>

 

결과:

  • 특정 지역과 제품 카테고리 조합에서 할인율이 높거나 낮은 패턴이 확인 되었다.
  • 특히, Office Supplies 카테고리의 할인율이 상대적으로 높았다.

 

즉, 

  • 기업의 할인율은 원가나 판매가와 직접적인 연관성이 낮으며, 할인 정책은 독립적으로 설계되는 것으로 보인다.
  • 이는 전통적으로 고가 제품에 높은 할인율을 제공하는 전략과는 다르며, 기업의 할인 정책이 고유한 의사 결정에 기반한다고 볼 수 있다. 

 

 

 

추가해서 분석해보면 좋을 데이터

 

  • 지역별 매출과 지역 정보
    이를 통해 지역별 구매 패턴과 경제성, 프로모션 효과성을 평가할 수 있다.

 

 

 

c. 💲 비즈니스 인사이트 및 액션플랜 

분석 결과 요약
  • 할인율 증가 → 수익성 감소:
    • 할인율이 높아질수록 마진(Margin)이 감소하며, Discount = 0.2 이상부터 음수 마진 발생 가능성이 급격히 증가.
  • 과도한 할인율의 부정적 효과:
    • 할인율이 0.6 이상인 경우, 할인 액(Discount Cost)이 할인 외 비용(Other Cost)을 초과.
    • 이는 특정 거래에서 과도한 할인율이 음수 마진 발생의 주요 원인임을 시사
  • 할인액의 영향
    • 할인액(Discount Cost)은 마진에 대해 할인 외 비용(Other Cost)보다 4배 더 큰 부정적 영향을 미침.
  • 이 기업의 할인율은 원가나 판매가와 비례하지 않고, 일반적인 고가 제품 유인 전략과 무관하게 적용되고 있음
비즈니스 액션 플랜
  • 원가 비율에 따른 할인율 상한선 설정
    • 제품별 원가 비율을 기반으로 할인율 상한선을 설정하여, 과도한 할인으로 인한 음수 마진 발생을 방지.
    • ex) 원가 비율이 높은 제품군(예: 원가 비율 > 50%): 할인율 상한선을 20% 이하로 설정.
  • 할인율 임계점 관리 
    • 분석 결과에 기반한 할인율 임계점(Discount = 0.2) 이상인 경우의 거래를 모니터링 및 제한
    • 임계 할인율을 초과하는 거래의 비율을 정한뒤 그 비율 안에서 초과 거래들을 관리 
  • 대체 혜택 제공
    • 직접적인 가격 할인 대신, 비금전적 혜택을 마련할 필요가 있음

 

 

 


 

느낀점 🧐

  • 데이터 속에서 할인율과 판매 간에 일정한 규칙이 있을 것이라고 짐작했다. (예를 들어, 특정 할인 시즌이나 특정 제품 카테고리의 할인 이벤트가 존재할 것이라고 가정했다.)
  • 그러나 도무지 규칙은 보이지 않았고, 그 불규칙성을 이해하지 못한채 굉장히 많은 시간을 소비했다.
  • 규칙과 패턴을 발견하려는 목적에만 집중한 나머지, 데이터를 있는 그대로 받아들이지 못했다는 것을 깨달았다.

 

결론

데이터를 좀 더 편견없는 눈으로 바라보고 해석하자. 데이터가 주는 무작위성 그 자체가 데이터의 특징이 될 수 있다.


TOP

Designed by 티스토리