Looker Studio (ex-Data Studio) : utiliser un "waterfall chart" pour comparer les données vs année précédente

Article publié par Nicolas Chollet
Le "waterfall chart" est le type de graphique le plus sous-estimé dans le monde de la DataViz. Il permet d'expliquer de manière très intuitive les facteurs d'évolution d'une période à une autre. Dans cet article, nous allons voir comment représenter les évolutions vs l'année précédente dans Google Data Studio.

L'objectif

Lorsque l'on souhaite montrer l'évolution de performance d'indicateurs (par exemple, ici, la source des visites Google Analytics), on utilise souvent cette représentation :
Image without caption
Elle permet de voir en un coup d’œil :
  • Les chiffres de chacun des canaux
  • Leur part relative
  • Ceux qui montent, et ceux qui baissent
En revanche, cette visualisation ne rend pas bien compte de la contribution de chacun des canaux à la hausse ou à la baisse globale.
C’est pourquoi il est pertinent de générer un "waterfall chart" qui représente les hausses (en vert), les baisses (en rouge), et finalement le total des hausses et des baisses (en gris).
Image without caption

Version 1 : calcul de dates et “blended data source"

Dans ce tutoriel, nous allons plus précisément aborder 3 points intéressants :
  • L'utilisation des nouvelles fonctions de calcul sur les dates, disponibles dans Google Data Studio
  • Comment joindre une source de donnée avec elle-même pour générer une comparaison vs année précédente
  • L'utilisation de la visualisation "waterfall chart" dans Google Data Studio
Pour cela, nous partons d'une source de donnée Google Analytics classique.

Étape 1 : calcul de la date de l'année dernière

Dans ma source de donnée principale, je vais créer 2 champs calculés :
  • La date de cette année (en format simplifié)
  • La même date, l'année précédente
Calculated date : TODATE(Date,'DEFAULT_DECIMAL','%Y%m%d')
Image without caption
La date moins 1 an : pour cela, nous utiliserons la toute nouvelle et très pratique fonction "DATETIME_SUB" TODATE(DATETIME_SUB(Date, INTERVAL 1 YEAR), 'DEFAULT_DECIMAL', '%Y%m%d')
Image without caption
J'ai donc simplement créé 2 nouvelles dimensions :
Image without caption

Étape 2 : comparer les données avec l'année précédente

Nous allons réaliser une jointure de cette table avec elle-même, afin d'ajouter la colonne "Sessions last year".
Je crée donc une nouvelle source de type "blended data" et j’effectue les réglages exactement comme ci-dessous. Attention en particulier à bien choisir le "date range" approprié !
Image without caption
J'ai donc généré le tableau suivant :
Image without caption
Je vais maintenant y ajouter le calcul de la différence : "sessions this year - sessions last year". On ne peut pas créer de champ calculé dans une source de type "blended". Nous allons donc faire un champ calculé directement dans le graphique :
Image without caption
Maintenant, je vais ajouter le "Default channel grouping" à ma nouvelle source de donnée. Car c'est cela que je souhaite calculer. J'édite donc ma source. Et j'en profite pour ajouter les métriques dont je vais avoir besoin (par exemple, les sessions + les conversions).
Attention à ne pas confondre "Default Channel Grouping" (ce que nous souhaitons mesurer ici) et "Acquisition channel" ! Ce n'est pas la même chose, et l’"Acquisition channel" vous causera une erreur.
Image without caption
Voilà ! J'ai à présent à ma disposition la source de donnée que je vais utiliser pour mon "waterfall chart".

Étape 3 : construire le "waterfall chart"

Nous allons maintenant dans "Community visualisations" → “Waterfall”
Image without caption
Par défaut, il va vous montrer la contribution de chaque segment au total :
Image without caption
Mais ce n'est pas ce que nous voulons, puisque nous souhaitons visualiser la contribution de chaque segment à la variation par rapport à l'année précédente.
Je vais donc à nouveau créer un champ calculé "Delta". Et voici le résultat !
Image without caption

Version 2 : “Extract data” + "blended data source"

Il existe une seconde version, plus simple et plus robuste que la première, et qui provient de cet article : https://michaelhoweely.com/2020/09/30/how-to-map-growth-in-google-analytics-sessions-by-country-in-data-studio/
Elle consiste à créer 2 sources de données : une pour cette année, une pour l'année précédente. Et à les joindre (sous forme de “blended data source”).
On perd la granularité à la journée, mais pour une comparaison d'une année sur l'autre, c'est parfait.

Étape 1 : créer les "extracted data sources"

Nous allons utiliser le connecteur "Extract data". Nous choisissons les métriques et dimensions que nous allons vouloir comparer (dans mon cas, je veux que la comparaison porte sur les "channels" et sur les pays). En ce qui concerne la date, nous choisissons "This year to date".
Image without caption
Puis nous créons une copie, en changeant simplement (pour plus de clarté) le nom des métriques et la date d'extraction :
Image without caption

Étape 2 : créer la jointure

Nous allons maintenant créer une "blended data source" comme ceci :
Image without caption
Et voilà ! Ensuite, on utilise les données de la même manière que précédemment.

Libérez le potentiel de vos données avec Looker Studio : explorez, analysez, décidez. Si toi aussi tu souhaites maîtriser tous les aspects de Looker Studio, tu peux t’inscrire à la formation :