본문 바로가기

데이터분석23

Superstore: 커머스 데이터 EDA를 통한 수익성 강화 액션 플랜 🚧진행중 🚧진행중#FFF6B3 살구 #FFE2E2 연핑크  분석 목표 (목차)1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기 음수(-) 마진 발생 원인 분석 및 해결책 제시 지역별 수익성 분석 제품별 수익성 분석 2. 매출 KPI: 시간 흐름별 매출 추이를 추적해 시기에 맞는 매출 향상 전략 세우기3. 배송 KPI: 현재 배송 등급의 문제점을 찾고, 최적의 배송 등급제 만들기  1. 수익성 KPI: 수익 발생 가능성을 높이고, 수익 저해 요인을 방지하기   a. 문제 상황 및 데이터 설명  Profit 컬럼의 표준편차가 매우 크고 최솟값이 -3839라는극단적인 값을 보였다.이는 수익성 분석에 있어 중요한 이상치 또는 특정 거래의 손실 발생 가능성을 나타내며, 이에 대한 원인 분석이 .. 2025. 1. 13.
[MYSQL] 문자열 함수 SUBSTRING_INDEX / 여러개의 값이 있는 행 분리 문자열 함수 substring_index를 공부해보자!   1. 내가 하고자 한 것   2. 시도해 본 쿼리 - 재귀함수(Recursive)를 이용해 장르 분리를 시도했다. - (쿼리 설명) anchor 부분 쿼리를 짜기 위해 1번째 장르와 남은(remaining) 장르를 구분하였다.  - case when이 지저분하고 가독성이 떨어지는 듯 하다.    3. 개선된 쿼리  - substring_index를 이용해 개선해 보았다. - 훨씬 가독성이 좋아지고 쿼리가 간결해졌다! 굿 ❤🌞   substring_index 함수 - 구분자를 기준으로, 왼쪽부터 지정된 구분자까지의 문자열을 반환한다. - 문법 구조: SUBSTRING_INDEX(string, delimiter, count)string: 처리할 문.. 2025. 1. 8.
[kaggle] Netflix Movies and TV Shows EDA 및 비즈니스 인사이트 전략 목차1. 분석 목표2. EDA 개요3. EDA 탐구 및 인사이트   1. 분석 목표 콘텐츠 추가 패턴 분석목표: 콘텐츠 업데이트 주기 분석으로 주기적 변화 파악.KPI: 월별 및 분기별 콘텐츠 추가 빈도, 주기적 변화율.장르 선호도 분석목표: 시즌별 인기 장르 변화 분석.KPI: 분기별 장르 점유율, 인기 장르 변화 트렌드.   2. EDA  개요 - date_added 컬럼을 이용해 넷플릭스 콘텐츠 추가 추이를 살펴보았다. (시계열 분석) - 시간의 흐름에 따라 콘텐츠가 추가되는 추세이나, 콘텐츠가 많이 늘리거나 적게 늘리는 주기가 반복되는거 같아 그 주기를 탐구해보기로 하였다.   2. EDA 탐구 및 인사이트   가설 1. 특정 시즌(연말, 분기,요일)에 집중될 것이다 -  주기 분석     i) .. 2025. 1. 7.
[SQL 공부] WINDOW_FUNCTION 윈도우 함수 OVER 완벽 이해 정리 윈도우 함수에 항상 쓰이는 OVER의 용도는 무엇인가 ❓❔❓❔❓ 윈도우 함수 형태 ()  OVER ([PARTITION BY ] [ORDER BY ] )  :집계 함수(Aggregate Function): SUM, AVG, COUNT, MAX, MIN 등순위 함수(Ranking Function): ROW_NUMBER, RANK, DENSE_RANK 등행 관련 함수(Value Function): LAG, LEAD, FIRST_VALUE, LAST_VALUE 등차례대로 이해해보자!  1. OVER 없이 집계함수를 사용할 때 SELECT SUM(weight) AS total_weightFROM Queue; OUTPUT total_weight500 - 테이블의 모든 weight 값 합산- 1개의 값으로 반환  .. 2024. 11. 29.

TOP

Designed by 티스토리