国内Webアナリストの第一人者である小川卓さんが執筆する、Google Analytics 4(以下GA4)連載の第10回。今回は、GA4になることで以前のGA(以下旧GA)と定義が異なり、かつ基本的な指標である「ユーザー」と「セッション」について解説します。
※Google アナリティクスは随時、機能追加やレポート画面のレイアウト変更などが行われます。本内容は2022年11月末時点に基づきます。
再確認! 同じ用語でも意味が違う?
GA4では、今までのGAと同じ用語名でも意味が変わった指標が存在します。第9回で紹介した「直帰率」もそうでした。
“小川卓さんのGA4連載 第9回「直帰率」を正しく理解する | パソコン工房 NEXMAG”.パソコン工房 NEXMAG.2022.
https://www.pc-koubou.jp/magazine/71194
他にも、旧GAと新たなGA4では定義が異なる指標が複数で存在します。改めてそのことを頭に入れておくとともに、定義の違いを正しく理解しておくと、旧GAとGA4を見比べた時に「同じ指標なのに、数値がズレている」という理由もわかるようになるでしょう。
今回は、その中でも基本的な指標「ユーザー」と「セッション」を取り上げます。
「ユーザー」はどのように定義されるのか?
そもそも、アクセス解析ツールで「ユーザー」はどのように定義されているのでしょうか?
旧GAとGA4(および大半のタグ形式で導入されるアクセス解析ツール)は、Cookie(クッキー)を利用して、「このアクセスは同じユーザー」だと判定しています。
簡略化して説明すると、あるユーザーがWebサイトを訪れた時、その人のパソコン(以下PC)やスマートフォン(以下スマホ)に小さなファイルを置いていきます。その中にランダムで番号が付与されていて、その番号でユーザーを識別しています。
Cookieは「デバイス × ブラウザ」の組み合わせで別々に発行されるため、例えば私がPCとスマホで同じWebサイトにアクセスした場合は別人、同じPCでも違うブラウザの場合は別人、という扱いです。
また、旧GAとGA4で共通しているのが、「会員ID」の利用が可能なことです。会員IDを発行しているWebサイトの場合、この会員IDをGAで取得して、IDを元に同一ユーザーであることを判別します。これを利用した場合は、異なるデバイスやブラウザ経由でも同じIDでログインしていれば、同一ユーザーだとわかります(=別人扱いになりません)。
ここまでが旧GAとGA4の共通項です。
GA4だけで利用できるユーザー識別方法
GA4では、新たに2種類のユーザー識別方法が増えました。1つが「Google シグナル」、もう1つが「モデリング」です。それぞれ見ていきましょう。
「Google シグナル」は、Webサイトを訪れたユーザーがGoogleアカウントにログインしていた場合、そのIDを元にユーザーを特定するという機能です。ただし、そのユーザーはGoogle広告のカスタム配信をONにしていなければなりません(デフォルトではONになっています)。
さらに、GA4の管理画面で「Googleシグナルのデータ収集」をONにする必要があります。手順は、画面左下の「管理」(歯車アイコン)をクリック。「管理」→「プロパティ」→「データ設定」→「データ収集」とクリックします。
「データ収集」選択後の画面で、「Googleシグナルのデータ収集」をONにしましょう。
またGA4には、どの識別子を利用してユーザーを特定するかを選ぶ画面があります。同じ「プロパティ」の「レポート用識別子」をクリック。
こちらでは3種類のオプションがあり、以下の識別子を利用します。
※番号は利用する優先順位です
利用識別子 | ハイブリッド | 計測データ | デバイスベース |
---|---|---|---|
ユーザーID | 1 | 1 | × |
Google シグナル | 2 | 2 | × |
デバイスID(Cookie) | 3 | 3 | 1 |
モデリング | 4 | × | × |
「モデリング」とは、ユーザー側のCookieの送信などを拒否している人が一定量以上いる場合、機械学習を用いて、同じユーザーであることを推定する機能のことです。
※詳細はGoogleのヘルプページを参照してください。
“[GA4] 同意モードの行動モデリング – アナリティクス ヘルプ”.Google アナリティクス.
https://support.google.com/analytics/answer/11161109?hl=ja&utm_id=ad
特に問題なければ、通常は「ハイブリッド」を選択しておけば大丈夫です。「Google シグナル」と「モデリング」は、GA4だけでしか利用できない識別方法となります。
GA4には2種類のユーザーの数え方がある
GA4では、「アクティブユーザー」と「総ユーザー」という2種類のユーザーのカウント方法があります。通常、「ユーザー」という指標名がGA4のレポートに出てくる場合、「アクティブユーザー」を指すので、両者の違いや意味を理解した上で見るようにしましょう。
前述の通り、GA4の直帰率はエンゲージメント率を元に計算されています。従って、エンゲージメント率と直帰率を同じ表に入れると以下のとおりです。
「アクティブユーザー」について
トップ画面の左から「レポート」をクリック。
次に「集客」→「トラフィック獲得」を選ぶと、下の画面が表示されます。ここで、ユーザーの部分をマウスオーバーすると、「アクティブユーザーの合計数です。」と表示されます。
アクティブユーザーの定義は「前面にページが1秒以上表示されていたユーザー数」です。前面とは、PCでもスマホでも「ユーザーが視認できる状態」を指します。
例えば、任意のワードを検索した結果、検索結果画面から気になったWebサイトAとWebサイトBを「別タブ」で開いたとしましょう。
この時、実際にはタブを切り替えず、各ページを見ないままタブを閉じれば、GA4ではアクティブユーザーとしてカウントされません。
※旧GAだとカウントされます。
「総ユーザー」について
GA4の「探索」機能には、さまざまな種類のレポートが用意されています。レポートを設定する際、画面左側の「変数」エリアの「指標」をクリックすると、「指標の選択」が表示。ここで「ユーザー」→「総ユーザー数」にチェックを入れると、アクティブユーザーの定義(1秒以上前面で表示するユーザー、という条件)を無視して、旧GAと同じ形でユーザーをカウントした数値を確認可能です。
2つの数値を並べて、比較してみましょう。
すると、このサンプルではアクティブユーザーの方が11%ほど低いことが確認できます。
“小川卓さんのGA4連載 第3回 「探索」機能について | パソコン工房 NEXMAG”.パソコン工房 NEXMAG.2021.
https://www.pc-koubou.jp/magazine/57185
「セッション」の定義について
アクセス解析ツールにおけるセッションは、もっともシンプルに言うと「Webサイトを訪れてから離脱するまでの一連の流れ」となります。店舗で言うと「来店回数」に近く、セッションは「訪問回数」と言うことも可能です。
前述のCookieなどを使ってユーザーを特定し、そのユーザーのページ間(あるいは、GAにデータが送られる間隔)が30分以内であれば、同一セッションとして定義されます。30分がデフォルト設定であることは旧GAとGA4ともに共通で、管理画面で時間を変えられます。
このように訪問回数を数えて、流入元やデバイスごとのセッション数、そこからのコンバージョン数などを確認できます。ここまで旧GAとGA4で考え方は一緒です。
GA4は「セッション」が切れにくい
旧GAとGA4では、別セッションの扱いになる条件が主に2つ変わりました。1つ目は、「日をまたいだ時」です。以下のユーザーの動きを考えてみます。
23時58分 → ページA閲覧
23時59分 → ページB閲覧
0時4分 → ページC閲覧
旧GAでは、ツール側の都合で日をまたいだタイミングでセッションが強制的に切れていました。つまり、この期間のセッション数は「2」でした。しかし、GA4ではこの仕様が廃止され、日をまたいでもセッションは切れません。GA4だと同一期間のセッション数が「1」になります。
もう1つの変化は「Webサイト外に出た時の挙動」です。
例えば、
11時15分 → 検索から流入してWebサイトのページAを閲覧
11時18分 → 同サイトのページBを閲覧
11時23分 → Webサイト外に出て、他サイトなどを閲覧
11時30分 → 広告から再度Webサイトに流入し、同サイトのページCを閲覧
このような場合、旧GAではWebサイト外に出たタイミングでセッションが切れていました。つまり、この期間のセッションは、以下のカウントになりました。
検索からの流入セッション 1回
広告からの流入セッション 1回
合計セッション数 2回
しかしGA4では、1回目の訪問の最後の時間と2回目の訪問の最初の時間が30分以内(※30分はデフォルトの場合。設定で時間を変えた場合はその時間)だと、別セッション扱いになりません(同じセッションの扱いになります)。
今回は11時18分が1回目の訪問の最後、2回目の訪問の最初が11時30分です。その間が12分なので、合計のセッション数は「1」のままです(離脱後30分以上経過していないので2になりません)。つまり、レポートは以下になります。
検索からの流入セッション 1回
広告からの流入セッション 1回
合計セッション数 1回
ここでの肝を整理します。
1 それぞれの流入元ごとの流入セッション数はカウントされる
2 ただし、期間の合計数値は1回と表示される(※足して2にならない)
実際のレポートもご覧ください。
流入元ごとのセッションを足すと4,240ですが、セッションの合計は「4,130」となっています。この差分こそ、先ほどまでに説明してきた例に該当します。合計セッション数を見る際には、流入元ごとの単純な足し算を使わないように注意しましょう。
第11回の予告
今回は旧GAとGA4の両方で使われている基本的な指標「ユーザー」と「セッション」の違いを見てきました。
次回(第11回)は、さらに指標の定義の違いを確認していきます。取り上げる指標は、「滞在時間」と「コンバージョン」です。お楽しみに!
Webアナリストとしてリクルート、サイバーエージェント、アマゾンジャパンなどで勤務後、独立。複数社の社外取締役、大学院の客員教授などを通じてWeb解析の啓発・浸透に従事。株式会社HAPPY ANALYTICS代表取締役。主な著書に『ウェブ分析論』『ウェブ分析レポーティング講座』『マンガでわかるウェブ分析』『Webサイト分析・改善の教科書』『あなたのアクセスはいつも誰かに見られている』『「やりたいこと」からパッと引ける Google アナリティクス 分析・改善のすべてがわかる本』など。
https://www.takuogawa.com/