📖

Les REGEXP sur Data Studio

Twitter LinkedIn Nos services

Les REGEXP sur Data Studio

A l'issue de ce tutoriel vous saurez comment utiliser les fonctions basées sur des Expressions Régulières (REGEXP) permettant de transformer vos données ou créer de nouveaux champs calculés.

Les 4 fonctions REGEXP

  • REGEXP_MATCH
  • REGEXP_REPLACE
  • REGEXP_EXTRACT
  • 🆕 REGEXP_CONTAINS

Syntaxe

REGEXP_MATCH

REGEXP_MATCH(Query,".*text.*")

Output : toutes les valeurs de la dimension Query de la forme "caracteres+text+caracteres"

REGEXP_REPLACE

REGEXP_REPLACE(Query,".*(text).*","new_text")

Output : toutes les valeurs de la dimension Query mais celles qui respectent la forme "caracteres+text+caracteres" sont remplacées par "caracteres+new_text+caracteres"

REGEXP_EXTRACT

REGEXP_EXTRACT(Query,".*(text).*")

Output : "text" pour toutes les valeurs de la dimension Query qui respectent la forme "caracteres+text+caracteres"

🆕 REGEXP_CONTAINS

REGEXP_CONTAINS(Query,"text")

Output : toutes les valeurs de la dimension Query contenant "text"

Applications

Catégoriser des URLs avec la fonction REGEXP_MATCH

Champs calculé :

CASE
    WHEN REGEXP_MATCH(URL,".*/tag/.*" THEN "Pages tags"
    WHEN REGEXP_MATCH(URL,"(.*/product/.*|.*\\.html$)") THEN "Pages produits"
    ELSE "Autre pages"
END

Utile avec les sources de données :

  • Google Analytics – Dimension “Pages”
  • Search Console URLs – Dimension “Landing page”
  • Google Ads – Dimension “Landing page”

Anonymiser les données de votre dashboard

Grâce à REGEXP_REPLACE, nou spouvons anonymiser les données de notre dashboard en remplaçant la dimension URL qui contient le nom de la marque Unnest par exemple par cette nouvelle dimension qui remplace le nom de la marque par brand

REGEXP_REPLACE(URL,"unnest","brand")

Il suffit ensuite d'utiliser cette nouvelle dimension URL_anonyme à la place de la dimension URL