위어드섹터 공식 블로그

GA4에서 사용자 수 정확도 높이는 법 본문

Growth Hacking

GA4에서 사용자 수 정확도 높이는 법

위어드섹터 2023. 10. 10. 10:05

안녕하세요. 위어드섹터의 이상한 연구소 래빗입니다.

래빗은 데이터 분석을 시작하고자 하는 여러 기업들의 환경 설정부터 실제 분석까지 함께하고 있습니다:)

 

오늘은 가장 많이 궁금해하시는 우리 웹사이트에 유입된 ‘사용자 수’의 정확도를 높이는 방법에 대해 알려드리겠습니다. 

 

Google에서 집계하는 사용자 수는 과연 정확할까요? 

 

1. GA4의 여러 가지 사용자 수

탐색보고서의 활성 사용자 수

탐색보고서의 ‘기기 카테고리’ 측정기준과 함께 본 활성 사용자 수

 

같은 기간( 7일) 동안 ‘기기 카테고리’ 측정기준을 넣어서 본 사용자와 그렇지 않은 사용자 수를 비교했을 때 약 82000명과 85000명이라는 3000명 정도의 차이가 났습니다. 이 이유는 무엇일까요?

2. 사용자 수가 서로 차이 났던 이유

사용자 1명이 2개 이상의 기기로 웹사이트를 방문했기 때문입니다. 그래서 각 기기 카테고리로만 보면 사용자 수가 훨씬 많아지는데 GA4에서 Google 신호 데이터로 어느 정도 다른 기기 사용자 중복 집계를 걸러내기 때문에 전체 활성 사용자 수는 적어지는 것입니다.

 

하지만 Google 신호 데이터도 ‘광고 최적화’ 기능을 사용하는 사용자만 적용되기 때문에 완벽한 방법은 아닙니다. 추가로  ‘활성 사용자’가 무엇인지, 그리고 GA4는 사용자 수를 어떻게 집계하는지에 대해 설명드리도록 하겠습니다. 

 

3. 활성 사용자 vs 총 사용자

GA4에서는 ‘활성 사용자’ 와 ‘총 사용자’라는 항목이 있습니다. 

그냥 ‘사용자’가 아니라 왜 헷갈리게 두 항목으로 나누어 놓았을까요?

쉽게 말하면 활성 사용자 수< 총 사용자 수이며, 이 이유는 

활성 사용자 수를 집계하는 기준이 아래 3가지 중 한 가지를 만족하는 사용자이기 때문입니다. 

(활성 사용자 수를 집계하는 기준이 조금 더 까다롭다라고 이해하시면 될 것 같아요.)

  1. 페이지 조회가 10초 넘게 지속되었거나,
  2. 전환 이벤트가 1회 이상 발생(보통 구매, 회원가입 등)하거나
  3. 페이지 또는 화면 조회를 2회 이상한 사용자입니다.

*활성 사용자에 대한 자세한 콘텐츠는 https://weirdsector.tistory.com/72 에서 확인해 주세요!

3. GA4가 사용자 수를 집계하는 방법

GA4에서는 사용자 수를 3가지 방법으로 식별하고 있기 때문입니다. 각 식별자마다 장/단점이 있어 완벽한 방법은 없습니다. 그래서 ‘정확한 1가지 기준’이 있는 게 아니라 장/단점이 있는 3가지 기준을 쓰기 때문에 사용자 수가 정확히 맞지 않는 것입니다. 

  1. 쿠키 식별자 
  2. 기기 ID
  3. Google 신호 데이터

 

  1. 쿠키 식별자

사용자가 사이트에 최초 방문하면 브라우저 저장소인 쿠키에 식별자가 저장됩니다. 우리가 일반적으로 사이트를 이용하면 자동로그인 상태가 유지되는 편리함이 있죠? 쿠키가 남아있기 때문입니다. 

비전공자인 저는 임시 기억 장소라는 생각이 드는데요. 말 그대로 임시로 사용자의 정보를 기억하다가 ‘쿠키 삭제' 같은 것으로 기억을 지우기도 하고… (너무 의인화를 해서 쿠키를 지울 때 저만 슬픈가요..?)

 

쿠키로 식별하는 방법은 좋은 방법이지만 단점도 있습니다.

기기의 브라우저에 저장되기 때문에 브라우저가 바뀌면, 같은 사용자라도 다른 사용자로 인식하는 것이죠.

 

예를들어, 래빗이라는 사람이 크롬에서 사이트 A에 접속했다가 사파리에서 사이트 A에 접속하면, 래빗이라는 한 사람을 컴퓨터는 2명의 사람이 접속했다고 인식하는 것입니다.

 

그 외에도 브라우저의 쿠키를 삭제하거나 하면 쿠키 수집이 안되니 완벽한 방법이라고 할 수 없습니다.

그래서 구글은 추가적인 수집방법을 사용합니다.

 

2. 기기 ID 

기기 ID는 사용자의 개인정보 보호나 익명성을 고려하면서 만든 방법인데요. 웹과 앱에서의 수집기준이 조금 다릅니다.

웹사이트의 기기 ID : 웹사이트에서 사용자를 식별하기 위해 사용하며, ga의 쿠키에서 가져옵니다. 이미지에 표기한 cid=clientID가 고유한 식별값이에요. 아마 GA를 사용하신다면 익숙하시겠죠?

 

IOS, Android 앱의 기기 ID : 앱은 설치 시 고유한 앱 설치를 나타내는 앱 인스턴스 ID에서 값을 가져옵니다. (요즘은 보안이 중요하고 특히 IOS의 경우 보안이 철저해서 제 모바일로 확인하는 것은 실패했지만, 이런 게 있구나~ 정도로 알아두시면 될 것 같아요.)

 

이렇게 기기 ID도 사용자 데이터를 수집하기에 좋은 방법이지만, 앞서 말씀드린 것처럼 개인정보 보호의 규정에 준수해야 하며, 쿠키와 마찬가지로 기기나 브라우저 변경 시에는 같은 사용자로 인식하기가 어렵습니다. 

 

3. 구글 신호 데이터

교차 기기에 대한 수집을 위해 사용자 개인 정보를 보호하는 조건에서 할 수 있는 것이 구글 신호 데이터입니다. 구글에 로그인하고 ‘광고 개인 최적화’를 사용 설정한 사용자만 식별할 수 있습니다. 

(실제 구글이 사용할 수 있는 데이터만 사용하겠다는 뜻이지만 구글 계정의 사용자가 많기 때문에 구글이 수집하는 데이터가 강력하다고 볼 수 있겠죠?)



*구글 신호 데이터에 대한 자세한 설명은 https://weirdsector.tistory.com/64 글을 참고해 주세요! 

 

결국 사용자 수의 정확도를 높이기 위해, 즉 내가 오늘 웹사이트에서 옷을 찾다가 마음에 드는 옷을 모바일로 보내서 한번 더 생각해 보는 시간을 갖는다고 했을 때, 두 명의 사용자가 옷을 찾고 있다고 인식하지 않도록 장치를 만든 것이죠. 하지만, 보안 등의 이슈로 이렇게 세 가지 방법으로 완벽하게 잡아낼 수 없는 것이 현실입니다.

 

4. 그렇다면 사용자 수 정확도를 높이는 방법은?

-> User ID를 부여해 줍니다. 

원리는 ‘로그인한’ 사용자의 회원 정보를 식별 값으로 사용하기 때문에 기기나 브라우저가 바뀌어도 한 명의 사용자로 식별이 가능합니다. 

 

*다만, 로그인하지 않은 회원은 기기나 브라우저가 바뀌었을 때 1명의 사용자로 연결하지 못한다는 단점이 있습니다.

 

Q. User ID를 부여하면 어떤 일이 생기나요?

 

A. 기기를 바꿔가며 사이트에 접속해도 1명의 사용자로 인식됩니다. 

 

PC로 웹사이트를 방문했다가 모바일로 회원가입 후 아이패드로 구매를 했다고 해도, 같은 ID로 로그인하기 때문에 쿠키를 기준으로 했다면 3명의 사용자로 인식했을 텐데 1명의 사용자로 인식하게 됩니다. 

 

측정기준에 ‘사용자 ID로 로그인함’이라는 기준이 생기며 ‘yes’인 사용자가 ‘로그인한 사용자’인 것을 알 수 있습니다. 

User ID 기능을 활성화하면 전용 보기가 생성됩니다. 

 

*부록

사용자 식별 방법을 선택할 수 있어요!






  1. 혼합됨

 User-ID->Google 신호 데이터->기기 ID->모델링 순서입니다. 

  • User-ID가 수집되면 User-ID 사용
  • User-ID가 수집되지 않으면-> Google 신호 데이터 정보를 사용
  • User-ID와 Google 신호 데이터 정보를 모두 사용할 수 없으면

-> 기기 ID를 사용하는 방식입니다. 

 

만약 식별자를 사용할 수 없으면 애널리틱스에서 모델링을 사용합니다.

 

*모델링이란?

 

만약 사용자가 쿠키와 같은 애널리틱스 식별자를 거부하면 해당 사용자의 행동 데이터를 사용할 수 없습니다. 애널리틱스는 비슷한 행동을 보이고, 쿠키를 수락한 사용자 행동모습을 기반으로 쿠키에 비동의한 사용자의 행동을 모델링(예측)해서 최대한 공백을 줄입니다. 

 

2. 관찰됨

User-ID-> Google 신호 데이터->기기 ID  순서입니다.

 

3. 기기 기반 

기기 ID 만 사용하며 User ID 나 Google 신호 데이터는 식별자로 사용하지 않습니다. 

 

결론

GA4의 사용자 수 파악 방법의 한계를 극복하기 위해서는 User_ID를 꼭 추가해 두시는 게 좋습니다. 

 

*참고 

User ID를 GA4에 전송하기 위해서는 이를 위한 코드를 datalayer를 활용하여 사이트에 추가하는 개발작업이 필요합니다.