문제풀이/SQL

GROUP BY 년, 월, 성별 별 상품 구매 회원 수 구하기

monawa 2023. 2. 21.
728x90

https://school.programmers.co.kr/learn/courses/30/lessons/131532

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다.USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_ID, GENDER, AGE, JOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

Column nameTypeNullable
USER_ID INTEGER FALSE
GENDER TINYINT(1) TRUE
AGE INTEGER TRUE
JOINED DATE FALSE

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며, ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

Column nameTypeNullable
ONLINE_SALE_ID INTEGER FALSE
USER_ID INTEGER FALSE
PRODUCT_ID INTEGER FALSE
SALES_AMOUNT INTEGER FALSE
SALES_DATE DATE FALSE

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.


문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 년, 월, 성별 별로 상품을 구매한 회원수를 집계하는 SQL문을 작성해주세요. 결과는 년, 월, 성별을 기준으로 오름차순 정렬해주세요. 이때, 성별 정보가 없는 경우 결과에서 제외해주세요.


예시

예를 들어 USER_INFO 테이블이 다음과 같고

USER_IDGENDERAGEJOINED
1 1 26 2021-06-01
2 NULL NULL 2021-06-25
3 0 NULL 2021-06-30
4 0 31 2021-07-03
5 1 25 2021-07-09
6 1 33 2021-07-14

ONLINE_SALE 테이블이 다음과 같다면

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
1 1 54 1 2022-01-01
2 1 3 2 2022-01-25
3 4 34 1 2022-01-30
4 6 253 3 2022-02-03
5 2 31 2 2022-02-09
6 5 35 1 2022-02-14
7 5 57 1 2022-02-18

2022년 1월에 상품을 구매한 회원은 USER_ID 가 1(GENDER=1), 4(GENDER=0)인 회원들이고,
2022년 2월에 상품을 구매한 회원은 USER_ID 가 2(GENDER=NULL), 5(GENDER=1), 6(GENDER=1)인 회원들 이므로,

년, 월, 성별 별로 상품을 구매한 회원수를 집계하고, 년, 월, 성별을 기준으로 오름차순 정렬하면 다음과 같은 결과가 나와야 합니다.

YEARMONTHGENDERUSERS
2022 1 0 1
2022 1 1 1
2022 2 1 2

나의풀이 

SELECT YEAR(sales_date) AS YEAR ,  
    MONTH(sales_date) MONTH, 
    gender, 
    COUNT(DISTINCT U.USER_ID) USERS

FROM USER_INFO U , ONLINE_SALE O
WHERE U.USER_ID = O.USER_ID
AND gender IS NOT NULL

GROUP BY YEAR,MONTH,gender

ORDER BY YEAR,MONTH,gender

회원정보가 있는 USER_INFO 테이블과 판매정보가 있는 ONLINE_SALE 테이블을 합치고

년,월, 성별 별로 상품의 회원수를 집계하기위해

YEAR 과 ,MONTH 함수를 이용하여 년 ,월을 추출하여  그룹화해준다

이떄 성별정보가 없는 결과는 제외하기 위해서 WHERE문에 IS NOT NULL을 활용하여 NULL인 행을 제거한다 

마지막으로 회원수 집계를 위해 COUNT 를 사용하는데 

이떄 DISTINCT 을 이용하여 중복을 제거한다 이는 sales테이블은 하나의 판매데이터만 존재한다고 하지만 

(year, month, gender, user_id)로 쿼리를 뽑아냈을떄 동일한 행이 나온다는 보장이 없기떄문에 이다 

 

728x90

댓글