온라인 셀러가 상품 선택에 실패하는 데이터 구조적 이유

상품 선택 실패는 개인의 판단력이 아니라 단편적 데이터 수집과 비교 불가능한 지표 혼용에서 발생한다.

검색량이 높은 상품은 잘 팔릴 것이라는 가정은 매우 자연스럽다. 실제로 많은 셀러가 상품 소싱의 첫 단계에서 검색량을 기준으로 후보를 걸러낸다. 그러나 동일한 검색량을 가진 상품들 사이에서도 매출 성과는 극단적으로 갈린다. 이 차이는 검색량이라는 지표 자체의 한계에서 발생한다.

구글에서 "잘 팔리는 상품 찾는 법"을 검색하는 셀러들은 대부분 비슷한 조언을 접한다. 검색량 확인하기, 리뷰 많은 상품 참고하기, 트렌드 따라가기. 하지만 이 조언들을 실천해도 실패율이 높다. 문제는 방법론이 아니라 데이터 수집과 해석의 구조적 한계에 있다.

1. 왜 상품 선택이 반복적으로 실패하는가

1-1. 단일 출처 데이터의 편향성

대부분의 셀러는 하나의 플랫폼 데이터만 본다. 네이버에서 판매할 예정이라면 네이버 쇼핑 검색량과 광고 도구 데이터만 확인한다. 하지만 소비자의 구매 여정은 멀티 플랫폼에 걸쳐 있다.

소비자는 네이버에서 정보를 탐색하고, 유튜브에서 리뷰를 보고, 쿠팡에서 가격을 비교한 후, 최종적으로 가장 편한 플랫폼에서 구매한다. 네이버 검색량이 높아도 실제 구매는 쿠팡에서 일어날 수 있다. 단일 플랫폼 데이터만 보면 이 흐름을 놓친다.

더 큰 문제는 플랫폼마다 제공하는 데이터 형식이 다르다는 점이다. 네이버는 월간 검색량, 쿠팡은 판매 순위, 11번가는 인기도 점수를 제공한다. 이 서로 다른 지표를 직접 비교할 방법이 없다. 결국 감으로 판단하게 된다.

1-2. 시점 데이터와 추세의 혼동

"검색량 1만 건"이라는 숫자는 특정 시점의 스냅샷이다. 하지만 셀러가 알아야 할 건 지금 시점의 숫자가 아니라 앞으로의 추세다. 검색량이 상승 중인지, 하락 중인지, 계절성이 있는지를 구분해야 한다.

대부분의 도구는 현재 시점 데이터만 보여준다. 과거 데이터를 확인하려면 별도로 구글 트렌드, 네이버 데이터랩을 찾아가야 하고, 이 데이터를 엑셀로 정리해서 그래프를 그려야 한다. 이 과정에서 대부분 포기하고 "지금 검색량"만 보고 판단한다.

검색량이 3개월 전 5만 건에서 지금 1만 건으로 줄었다면 하락 중인 시장이다. 반대로 3개월 전 2천 건에서 1만 건으로 올랐다면 상승 중인 시장이다. 같은 1만 건이어도 의미가 정반대인데, 시점 데이터만 보면 구분이 안 된다.

1-3. 경쟁 강도 측정의 부재

검색량은 쉽게 확인할 수 있다. 하지만 경쟁 강도는 측정 방법 자체가 명확하지 않다. 같은 키워드로 검색한 상품이 몇 개인지 세는 것? 상위 10개 상품의 평균 리뷰 개수를 확인하는 것? 광고 단가를 확인하는 것?

각 방법마다 장단점이 있고, 어느 것이 정답인지 알 수 없다. 더 큰 문제는 이 측정을 키워드마다 반복해야 한다는 점이다. 10개 키워드를 비교하려면 각 키워드별로 경쟁 상품을 세고, 리뷰를 확인하고, 광고 단가를 기록해야 한다.

이 작업을 수작업으로 하면 하루 종일 걸린다. 그래서 대부분 "대충 경쟁이 많아 보이네" 수준에서 판단하고 넘어간다. 정량화되지 않은 판단은 일관성이 없고, 나중에 왜 실패했는지 분석할 수도 없다.

2. 데이터 관점에서 필요한 판단 기준

2-1. 크로스 플랫폼 지표 정규화

서로 다른 플랫폼의 데이터를 비교하려면 정규화(Normalization) 과정이 필요하다. 예를 들어 네이버 검색량, 쿠팡 판매 순위, 구글 검색량을 각각 0~100 척도로 변환하면 비교 가능한 지표가 된다.

정규화 방법은 간단하다. (해당 키워드 값 - 카테고리 최솟값) / (카테고리 최댓값 - 카테고리 최솟값) × 100으로 계산하면 된다. 이렇게 하면 "무선 이어폰"의 네이버 점수 85, 쿠팡 점수 60, 구글 점수 70 같은 식으로 표현할 수 있다.

하지만 이 계산을 수작업으로 하려면 카테고리별 최댓값, 최솟값을 먼저 조사해야 한다. 키워드가 10개면 계산이 100번 이상 필요하다. 현실적으로 불가능하다.

2-2. 경쟁 밀도의 수치화

경쟁 밀도는 (검색량 / 경쟁 상품 수) 비율로 정의할 수 있다. 이 값이 높을수록 검색하는 사람 대비 공급이 적다는 뜻이고, 노출 기회가 크다는 의미다.

예를 들어:

키워드 A: 검색량 10,000 / 경쟁 상품 1,000개 = 밀도 10
키워드 B: 검색량 50,000 / 경쟁 상품 10,000개 = 밀도 5

절대 검색량은 B가 5배 크지만, 경쟁 밀도는 A가 2배 낮다. 신규 셀러에게는 A가 더 기회가 크다. 이런 비교를 하려면 모든 키워드의 경쟁 상품 수를 일일이 세야 한다.

네이버 쇼핑에서 검색했을 때 나오는 전체 상품 수를 기록하고, 엑셀에 정리하고, 검색량과 나눠서 비율을 계산한다. 키워드 10개만 해도 30분 이상 걸린다. 이 과정을 매주 반복하려면 전담 인력이 필요하다.

2-3. 시계열 데이터의 트렌드 분석

검색량의 변화 패턴을 파악하려면 최소 3~6개월 데이터가 필요하다. 매주 또는 매월 데이터를 수집해서 그래프를 그리고, 상승/하락/횡보를 구분해야 한다.

구글 트렌드는 상대적 인기도만 보여주고, 절대 검색량은 네이버 광고 시스템에서 확인해야 한다. 이 둘을 합쳐서 엑셀로 정리하고, 선형 회귀나 이동 평균을 계산해서 추세를 파악한다.

통계적 분석 없이 눈으로만 보면 "요즘 좀 올라가는 것 같은데?" 수준에서 끝난다. 정량적 기준 없이는 상승 "속도"를 비교할 수 없고, 언제 진입해야 할지 타이밍을 잡을 수 없다.

3. 이런 경우 자동화된 도구가 필요해진다

3-1. 수작업이 한계에 도달하는 지점

다음 조건 중 하나라도 해당되면 수작업 분석은 한계에 도달한 것이다:

비교해야 할 키워드가 10개 이상이다
여러 플랫폼(네이버, 쿠팡, 11번가 등)을 동시에 봐야 한다
검색량 추이를 주기적으로 추적해야 한다
경쟁 상품의 리뷰 증가 속도를 확인해야 한다
여러 지표를 조합해서 우선순위를 매겨야 한다

이 조건들을 모두 충족하는 분석을 수작업으로 하면 하루 8시간 작업해도 키워드 510개가 한계다. 제대로 된 상품 선택을 하려면 최소 50100개 키워드를 비교해야 하는데, 시간이 절대적으로 부족하다.

3-2. 자동화가 의미를 갖는 조건

데이터 수집 자동화는 단순히 시간을 줄이는 게 목적이 아니다. 더 중요한 건 일관성과 재현성이다.

수작업으로 데이터를 모으면 매번 기준이 달라진다. 어제는 상위 10개 상품만 확인했는데, 오늘은 20개를 확인한다. 이번 주는 리뷰 개수를 세었는데, 다음 주는 깜빡하고 안 센다. 이렇게 되면 키워드 간 비교가 불가능하다.

자동화된 시스템은 동일한 기준을 모든 키워드에 동일하게 적용한다. 상위 10개 상품, 리뷰 개수, 평점, 가격, 판매자 수를 매번 동일한 방식으로 수집한다. 이렇게 쌓인 데이터는 비교 가능하고, 패턴 분석이 가능하다.

또한 자동화는 정기 업데이트를 가능하게 한다. 수작업으로는 한 번 조사하고 끝이다. 하지만 시장은 계속 변한다. 3개월 전 데이터로 오늘 판단하면 틀릴 확률이 높다. 자동화 시스템은 매주, 매일 데이터를 업데이트하고, 변화를 추적한다.

3-3. 도구 선택 시 확인해야 할 기능

상품 분석 도구를 선택할 때 다음 기능이 있는지 확인해야 한다:

필수 기능:

멀티 플랫폼 데이터 수집 (네이버, 쿠팡, 11번가 등)
검색량 시계열 데이터 제공
경쟁 밀도 자동 계산
여러 지표 조합한 점수화 시스템

선택 기능:

리뷰 증가 속도 추적
광고 단가 예측
카테고리별 벤치마크 데이터
유사 키워드 자동 추천

이 기능들이 없다면 결국 수작업으로 보완해야 한다. 도구를 쓰는 의미가 반감된다.

4. 마무리

핵심 요약

상품 선택 실패는 개인 역량이 아니라 데이터 수집·분석의 구조적 한계에서 발생한다
단일 플랫폼, 단일 시점, 비정량화된 판단은 일관성 없는 결과를 만든다
크로스 플랫폼 정규화, 경쟁 밀도 수치화, 시계열 분석이 필수 요소다
수작업 한계에 도달했을 때 자동화 도구의 도입을 고려해야 한다

데이터 기반 상품 선택은 복잡하지만, 체계화하면 반복 가능한 프로세스가 된다. 이런 구조적 접근을 실제로 구현한 서비스로는 셀링부스터가 있다. 멀티 플랫폼 데이터 수집, 경쟁 분석 자동화, 키워드 우선순위 점수화 등 이 글에서 다룬 요소들을 통합 제공한다.