ここでは参照元やメディア、デフォルトチャネルグループについてまとめていこうと思います!
UAが7月1日から廃止されました。
UAとは違ってGA4ではデフォルトチャネルグループによる分類は増えており、よりGA4では細かく分析をすることができるようになりました。
参照元・メディア
参照元というとどうしてもセッションのイメージが強いです。
でも参照元にはユーザー、セッション、イベント全てにあります。
変に書かず、ここではそれぞれの参照元・メディアはどういう意味なのか、BigQueryではどこにそれが当たるのか?など細かに分析をしていきたいと思います。
説明をしていくにあたり、以下のようなあるユーザーさんのサイト内の動きを仮定してみたいと思います!
Aユーザーさんは、まずtwitterに貼られたリンクから、サイトに流入して、サイト内を回遊しました。
そして30分後に今度は直接URLを叩いてサイトに流入して、またサイト内を回遊しました。(いきなりブックマークする人いないと思うけどw)
最後にまた30分後に今度はあるサイトから流入して、サイト内を回遊しました。
図にすると以下のようなイメージです。
これを仮定した上で、ユーザー、セッション、イベントがそれぞれ参照元やメディアがどうなるのかについて説明していこうと思います。
ユーザーの参照元・メディア
通常参照元やメディアというと、サイトに流入した際どこから来たかを示すものというイメージがついているかと思いますが、
ユーザーの参照元・メディアはどういう意味でしょうか。
それは、「ユーザーが初めて最初に流入した際の参照元・メディア」になります。
なので、これは簡単ですね!
今回の例で言えば、Twitterからの流入がcliendIdが12345のユーザーにとっては初訪問となるので、
ユーザーの参照元・メディアはそれぞれ以下となります。
参照元:t.co
メディア:Referral
これらの情報は以下で確認できます!
ユーザー獲得レポート
ここではサイトやアプリに初めて訪問したユーザーの流入だったりを分析します。つまりユーザーを獲得したということです。
探索レポート
探索レポートでは以下のようなディメンションでその値が取得できます。
・ユーザーの
・
ローデータでの
BigQueryだと、traffic_sourceというもので取得できます。
traffic_sourceがそれぞれユーザの最初の参照元、メディア、キャンペーンとなります。
項目 | カラム |
---|---|
参照元 | traffic_source.name |
メディア | traffic_source.medium |
キャンペーン | traffic_source.source |
実際にローデータを見てみます。
SELECT event_name, FORMAT_TIMESTAMP('%Y-%m-%d %H:%M:%S', TIMESTAMP_TRUNC(timestamp_micros(event_timestamp), SECOND), "Asia/Tokyo"), event.key, event.value.string_value, event.value.int_value, event.value.float_value, event.value.double_value, traffic_source.source, -- 参照元 traffic_source.medium, -- メディア traffic_source.name -- キャンペーン FROM `.analytics_ .events_20230628`, unnest(event_params) as event WHERE user_pseudo_id = "*********" and key = "source" ORDER BY event_timestamp ASC
上と同様の行動をした(多少違いますw)ユーザーのローデータを以下のようにアンネストした結果です。
ユーザは最初にtwitterから流入して、その後直接入力してサイトに入り、そして最後はyosshiblog.jpから流入しました。
traffic_sourceのカラムを見ると、sourceがyosshiblog.jpになってるところのtraffic系カラムに注視すると、source、medium、campaignともに最初のtwitterからの流入情報が入っているのがわかります。
※ 2回目の流入がないのは、source、mediumがそもそもnullになりイベントパラメータとして計測されないため、ローデータにも出てこないという理由で表示されません。
このように、BigQueryで新規ユーザーの獲得経路を集計したい場合は、traffic_source系カラムを見れば良いということがわかりました。
まとめると、
ユーザーが初めて最初に流入した際の参照元・メディア
セッションの参照元・メディア
セッションの参照元・メディアはそのままのイメージで、サイトへはどこから流入したかを示すものです。
ただGA4ではセッションが切れる条件がUAとは違う点がありましたが、セッションの参照元・メディアはUAの時よりは複雑ではなくわかりやすいです。
理由としては、セッションが切れる条件がUAの時とは違い緩和され、セッションが続きやすくなったからです。
セッションの参照元・メディアは、「セッションが開始されて、session_startとfirst_visitイベントを除いた初めてのイベントの参照元・メディア」となります。
上の例で言えば、session_startとfirst_visitイベントを除いて、page_viewイベントが最初に発火しているので、
その最初のpage_viewイベントに紐づく参照元・メディアがセッションの参照元・メディアになります。
なので、
まず初回訪問でのセッションの参照元はt.co、メディアはreferral、
次の訪問でのセッションの参照元はdirect、メディアはnone、
最後の訪問でのセッションの参照元はyosshiblog.jp、メディアはreferral
となります。
もちろん、page_view計測していなければ、最初はもしかするとscrollイベントになるかもしれませんし、user_engagementイベントになるかもしれませんので、全てpage_viewイベントがセッションの参照元・メディアになるわけではないことにご注意ください。
ここで1つ以下のような例②を考えてみます。
この場合のセッションの参照元・メディアはどうなるでしょうか。
セッションの参照元はt.co
セッションのメディアはreferral
だけです。
2回目の訪問で別のセッションが開始されたわけではありません。
ポイントとしては初訪問してから20分経って再訪問しています。
つまり最初の訪問はまだセッションがつながっている状態です。
セッションが切れる条件として、UAでは参照元が変わったらとありました。しかしGA4では参照元が変わったらという条件はなくなり、30分経過したらという条件だけが残ってます。(データストリームなどの要件もあるけど)
なので、まだセッションが残っている状態であるので、その中でsession_start、first_visit以外で最初に発火したイベントであるpage_viewの参照元とメディアはそれぞれ、t.co、referralであるので、例②でのセッションの参照元とメディアは上記になるということになります。
探索レポート
まとめると、
セッションが開始されて、session_startとfirst_visitイベントを除いた初めてのイベントの参照元・メディア
イベントの参照元・メディア
イベントの参照元・メディアはちょっとイメージがつきづらいかもしれません。
通常参照元・メディアはサイト内に流入した際の経路を示すもので、その中でサイト内回遊をしたり、アクションしたりしたものに対して参照元・メディアの情報が取れるのかと思いそうです。
このイベントの参照元・メディアは、上で説明したセッションの参照元・メディアを構成するものに使われますが、
さらにいうとアトリビューションモデル分析に使われるという点で重要です。
例①での各イベントの参照元・メディアは、
初回訪問の2つのpage_viewイベントは、参照元がt.co、メディアがreferral
2回目の訪問の2つのpage_viewイベントは、参照元がdirect、メディアがnone
3回目の訪問の2つのpage_viewイベントは、参照元がyosshiblog.jp、メディアがreferral
となります。
例②での各イベントの参照元・メディアは、
1つのセッション内にて、
twitterからの流入で発生した2つのpage_viewイベントは参照元がt.co、メディアがreferral、
yosshiblog.jpからの流入で発生した2つのpage_viewイベントは参照元がyosshiblog.jp、メディアがreferral
となります。
探索レポート
この場合、セッションとイベントの参照元・メディア