En bref
Tips:
Passez à l’interface en anglais pour mieux identifier les notions GA mentionnées ici dans leur langue d’origine, en anglais ! C’est par ici.
La consommation de café est recommandée pendant la lecture
Dans l’épisode précédent, nous essayions de comprendre ce qu’était le traffic de type “Unassigned” dans GA4. Depuis, j’ai non seulement trouvé une nouvelle origine de ce traffic, mais surtout, j’ai compris beaucoup de choses sur les source/medium, traffic_source.source de BigQuery, First user source / medium & co.
Cet article vous explique en détail :
- la différence entre une session UA et une session GA4
- les dimensions liées à l’acquisition
- le traffic unassigned lié à l’absence du “session_start”
Bon, je commence par enfoncer une première porte ouverte:
Vous allez retrouver dans Big Query et dans Google Analytics des dimensions différentes et des dimensions similaires. Voici un tableau récapitulatif des notions que nous allons voir.
Attention : les dimensions GA4 seront les mêmes dans LookerStudio donc il est important de comprendre ces notions pour bien paramétrer vos dashboards.
Nom de la dimension GA4 | Nom de la dimension BigQuery | Définition | Scope |
First user source | traffic_source.source | Source d’acquisition enregistrée pour un utilisateur unique lors de sa toute première visite. Elle n’est pas modifiée par la suite. | User |
First user medium | traffic_source.medium | Medium d’acquisition enregistrée pour un utilisateur unique lors de sa toute première visite. Elle n’est pas modifiée par la suite. | User |
Session source | pas de dimension native | Source d’acquisition d’une visite | Session |
Session medium | pas de dimension native | Medium d’acquisition d’une visite | Session |
pas de dimension native | event_params → source* | Source d’un hit particulier (peut être différent de celui de la session) | Event |
pas de dimension native | event_params → medium* | Medium d’un hit particulier (peut être différent de celui de la session) | Event |
Source | pas de dimension native | Dispo pour les évènements de conversion uniquement: donne la source attribuée à cette conversion | Event |
Medium | pas de dimension native | Dispo pour les évènements de conversion uniquement: donne le medium attribué à cette conversion | Event |
*les éléments sont nestés, voir tout en bas de l’article comment requêter ces élements
Session source/medium
Définition d’une session
Il y a une différence entre Universal Analytics et GA4, anodine au premier abord, mais qui a ici toute son importance.
Dans Universal, lorsque de nouveaux paramètres utm étaient collectés en milieu de session, s’ils étaient différents de ceux de départ, alors, la session était cassée. Vous vous retrouviez alors avec deux sessions au lieu d’une. Dans GA4, la session ne se casse plus.
Comment cela se fait-il que la session ne soit pas cassée me demandez-vous?
La fonction de l’évent “session_start”
Une session GA4 est calculée à partir de l’évènement “session_start”. Il n’est pas visible dans le network, uniquement dans Big Query ou dans l’interface de GA4 mais il est particulièrement important.
Cet évènement se déclenche de manière autonome à chaque début de session. Donc, par exemple si un utilisateur arrive sur le site pour la première fois de la journée, l’évent se déclenche et est associé à la première page vue. Puis, si le même utilisateur revient sur le site depuis une autre source seulement quelques minutes après l’avoir quitté, alors l’évent “session_start” ne part pas: c’est la même session. La règle des 30 minutes d’inactivité (par défaut) entre deux visites pour déclencher deux sessions est toujours valable dans GA4. On considère donc ici que toutes les actions sont à moins de 30 minutes d’intervalles les unes des autres.
Ainsi la dimension GA4 Session Source / Medium portera la valeur de la source et du medium du premier hit de pageview associé au session_start.
Cela s’illustre très bien dans BigQuery lorsque l’on requête les sessions d’un utilisateur.
Voici 3 sessions d’un même user_id.
→ Cet utilisateur est arrivé la première fois sur le site via le canal direct. Cette session là n’apparaît pas ici, elle est antérieure à la plage de temps investiguée.
→ On peut voir que tous les évènements des divers sessions ont une source organique, l’utilisateur n’a pas changé de source durant sa visite dans ce cas précis.
→ Qu’en est-il de la source de la session?
Pour ce dernier point, la dimension n’était pas disponible dans BigQuery, il faut aller voir dans GA4. Il est possible de faire une recherche les user_id mais pas sur les session id. il faudra donc être un peu astucieux. Voici comment j’ai fait étape par étape:
- ouvrir un User Explorer report dans GA4
- on ne peut pas faire de recherche sur le User ID (qui se nomme App Instance Id dans l’interface) donc on va réduire notre périmètre au maximum: sur la date, l’heure mais aussi le nombre d’évènements dans la session (par exemple, trois pour la première session)
- une fois que vous avez trouvé le user ID correspondant, cliquez dessus pour ouvrir le report de user activity. On y retrouve bien les sessions de BiqQuery.
Et si l’on ajoute un filtre, on peut voir que les 3 sessions avec le session_start appartiennent à l’organic tandis que la visite sans session_start, bien que les events aient le paramètre source= organic, remonte en unassigned.
Vous avez trop de traffic Unassigned ? Son origine provient probablement du fait que l’événement “session_start” ne part pas.
First User Source / Medium
Les utilisateurs sont identifiés avec le user_pseudo_id enregistré dans les cookies. Tant que la durée de vie du cookie n’as pas atteint sa limite, que l’utilisateur (au sens GA du terme) ne supprime pas ses cookies, etc.. alors toutes ses sessions lui seront associées.
La valeur de Session Source / Medium de la toute première session enregistrée pour un utilisateur sera donnée à la dimension First User Source / Medium grâce à l’évènement “first_visit” qui a la même utilisation que “session_start” mais au scope utilisateur.
Source / medium
Dans GA4, cette dimension se retrouve dans la catégorie Attribution et non dans Traffic source.
Vous remarquerez aussi que cette dimension ne peut être croisée avec toutes les métriques.
Seules les métriques disponibles pour les évents de conversions sont utilisables ici.
Source / Medium, ce n’est pas votre source de trafic, mais la source attribuée à votre conversion.
Reprenons la visite décrite plus haut. Si l’on résume de manière très simplificatrice, la visite a été générée par de l’organique. Mais qu’en est-il de l’achat, défini ici comme un évènement de conversion ? Cette conversion provient-elle de l’organique ou de la newsletter?
La source et le medium d’une conversion (dimension Source / Medium dans l’interface) sont définis par GA4 suivant un modèle d’attribution dans le but de mieux répartir le “succès” d’une conversion. On peut imaginer dans ce cas de manière très simpliste que la conversion vient à la fois de l’organique et de la newsletter. Ainsi, on retrouverait dans l’interface GA4 les informations suivantes :
Source/ Medium | Conversions |
google / organic | 0.5 |
newsletter / email | 0.5 |
Cela explique pourquoi vous les valeurs de la métrique Conversions sont des nombres décimaux et non des entiers.
Pour avoir plus d’informations sur le modèle d’attribution qui est actif sur votre GA4, vous pouvez aller dans Admin > Attribution Settings :
Les requêtes de cet article
L’auteur : Lucie Lafarge
Consultante tracking & analytics chez UnNest, je travaille sur les sujets liés à la collecte et l’analyse de vos données de navigation.
Après 3 années au sein d’une agence dédiée à l'équipe data & analytics de Royal Canin, j’ai pu aiguiser mon sens de l'analyse pour transformer la donnée en action concrètes.
✉️ Me contacter : lucie.lafarge@unnest.co