[프로그래머스]Lv4. 우유와 요거트가 담긴 장바구니
https://school.programmers.co.kr/learn/courses/30/lessons/62284
1. Problem
하나의 장바구니(CART_ID) 안에 'Milk'와 'Yogurt'가 모두 포함된 사례를 찾아야 한다. 단순히 두 품목 중 하나라도 들어있는 장바구니를 찾는 것이 아니라, 두 종류의 아이템이 '동시에' 존재하는 집합을 찾아내는 것이 핵심이다.
2. Solution: GROUP BY와 중복 제거 집계
WHERE 절로 후보군을 좁힌 뒤, 장바구니별로 묶어 종류(NAME)의 개수를 세어 검증한다.
3. Takeaway: 왜 COUNT(*)는 위험한가? (객관적 분석)
- COUNT(*)의 함정: 만약 장바구니에 '우유만 2개' 담겨 있다면 COUNT(*) 결과는 2가 되지만, 문제의 의도인 '우유와 요거트 조합'에는 부합하지 않는다. 즉, 행의 개수가 아닌 항목의 다양성을 체크해야 한다.
- DISTINCT의 역할: COUNT(DISTINCT NAME)을 사용하면 장바구니 안에 우유가 10개 있더라도 'Milk'라는 종류 1개로 계산된다. 따라서 결과가 2라면 반드시 서로 다른 'Milk'와 'Yogurt'가 각각 최소 하나 이상 존재함을 보장한다.
- 다양한 접근 방식:
- INTERSECT (교집합): 우유를 산 ID 리스트와 요거트를 산 ID 리스트의 교집합을 구하는 방식 (가독성이 좋으나 DB 엔진에 따라 지원 여부 확인 필요).
- Self Join: 우유 행과 요거트 행을 같은 CART_ID로 조인하는 방식.
CART_PRODUCTS 테이블은 장바구니에 담긴 상품 정보를 담은 테이블입니다. CART_PRODUCTS 테이블의 구조는 다음과 같으며, ID, CART_ID, NAME, PRICE는 각각 테이블의 아이디, 장바구니의 아이디, 상품 종류, 가격을 나타냅니다.
| NAME | TYPE |
| ID | INT |
| CART_ID | INT |
| NAME | VARCHAR |
| PRICE | INT |
데이터 분석 팀에서는 우유(Milk)와 요거트(Yogurt)를 동시에 구입한 장바구니가 있는지 알아보려 합니다. 우유와 요거트를 동시에 구입한 장바구니의 아이디를 조회하는 SQL 문을 작성해주세요. 이때 결과는 장바구니의 아이디 순으로 나와야 합니다.
예시
예를 들어 CART_PRODUCTS 테이블이 다음과 같다면
CART_PRODUCTS 테이블
| ID | CART_ID | NAME | PRICE |
| 1630 | 83 | Cereal | 3980 |
| 1631 | 83 | Multipurpose Supply | 3900 |
| 5491 | 286 | Yogurt | 2980 |
| 5504 | 286 | Milk | 1880 |
| 8435 | 448 | Milk | 1880 |
| 8437 | 448 | Yogurt | 2980 |
| 8438 | 448 | Tea | 11000 |
| 20236 | 1034 | Yogurt | 2980 |
| 20237 | 1034 | Butter | 4890 |
- 83번 장바구니에는 Milk와 Yogurt가 모두 없습니다.
- 286번 장바구니에는 Milk와 Yogurt가 모두 있습니다.
- 448번 장바구니에는 Milk와 Yogurt가 모두 있습니다.
- 1034번 장바구니에는 Milk는 없고 Yogurt만 있습니다.
따라서 SQL 문을 실행하면 다음과 같이 나와야 합니다.
| CART_ID |
| 286 |
| 448 |
1. 정답 쿼리
SELECT CART_ID
FROM CART_PRODUCTS
WHERE NAME IN ('Milk', 'Yogurt')
GROUP BY CART_ID
HAVING COUNT(DISTINCT NAME) = 2
ORDER BY CART_ID;
동작 순서
FROM/JOIN → WHERE → GROUP BY → HAVING → SELECT → ORDER BY
- WHERE NAME IN ('Milk', 'Yogurt'): 먼저 장바구니에서 우유와 요거트가 아닌 다른 상품들을 다 걸러냅니다.
- GROUP BY CART_ID: 장바구니 번호별로 묶습니다.
- HAVING COUNT(DISTINCT NAME) = 2:
- 만약 우유 2개만 있다면? DISTINCT NAME은 'Milk' 하나뿐이라 개수는 1이 됩니다.
- 만약 우유 1개, 요거트 1개(또는 여러 개)가 있다면? DISTINCT NAME은 'Milk'와 'Yogurt' 두 개가 되어 개수는 2가 됩니다.
- ORDER BY CART_ID: 문제 조건에 맞게 정렬합니다.
2. 나의 오답
SELECT CART_ID
FROM CART_PRODUCTS
WHERE NAME IN ('Milk', 'Yogurt')
GROUP BY CART_ID
HAVING COUNT(*) = 2
ORDER BY CART_ID;
- 현재 쿼리의 잠재적 문제점
HAVING COUNT(*) = 2는 만약 어떤 장바구니에 우유만 2개 담겨 있거나, 요거트만 2개 담겨 있는 경우에도 "2"라는 결과가 나와서 '우유+요거트' 조합으로 오해받을 수 있다.
- 수정된 정답 쿼리
중복을 제거하고 서로 다른 이름의 상품 종류가 몇 개인지를 세는 것이 핵심이다.
3. 다른 풀이 (INTERSECT 느낌)
가끔은 각 상품이 존재하는 장바구니 리스트를 따로 뽑아 교집합을 구하는 방식으로 풀기도 합니다
SELECT DISTINCT CART_ID
FROM CART_PRODUCTS
WHERE NAME = 'Milk'
AND CART_ID IN (SELECT CART_ID FROM CART_PRODUCTS WHERE NAME = 'Yogurt')
ORDER BY CART_ID;
'Data Science > SQL' 카테고리의 다른 글
| [SQL/오답] 트리 구조: 부모 노드의 조건으로 자식 노드 데이터 추출하기; 중첩 서브쿼리 (프로그래머스 Lv2) (0) | 2026.02.14 |
|---|---|
| [SQL/오답] 날짜 그룹화와 특수문자 별칭 (프로그래머스 Lv2) (0) | 2026.02.14 |
| [SQL/오답] GROUP BY의 한계와 중첩 서브쿼리: 특정 조건을 만족하는 '전체 행' 조회하기 (프로그래머스 Lv3) (0) | 2026.02.12 |
| [SQL/오답] 문자열 결합(CONCAT)과 서브쿼리를 이용한 조건부 경로 추출 (프로그래머스 Lv3) (0) | 2026.02.12 |
| [SQL/오답] WITH RECURSIVE: 존재하지 않는 시간대 0으로 채우기 (프로그래머스 Lv4) (1) | 2026.02.12 |