Fivetran est un outil Saas qui permet de créer des pipelines de données de manière très simple et robuste. Pour faire simple, c'est un connecteur déjà pré-configuré à plus de 150 sources de données.
Tous les articles concernant Fivetran
Qu'est-ce que Fivetran ?
Certains appellent cela un "ETL" (Extract / Transform / Load). D'autres un outil de "data pipeline". En réalité, je vois cela plutôt comme un "connecteur universel".
D'un côté les sources de donnée. De l'autre un "Cloud data warehouse". En général Google Big Query, Amazon Redshift ou Snowflake.
Pour résumer cela en un graphique :
Connecteurs disponibles
Les "sources"
Le mieux est d'aller voir directement sur la page de Fivetran : https://fivetran.com/connectors
Mais citons quelques connecteurs très utilisés dans le monde du marketing digital :
Principaux connecteurs Fivetran
Catégorie
Exemples
Cas d'usage
Analytics
Google Analytics et GA 360, Adobe Analytics, Mixpanel, Amplitude
- Analyser en profondeur les analytics
- Croiser avec d'autres sources
Publicité
Adroll, FB Ads, Google Ads, LinkedIN Ads, Microsoft Ads, Criteo, Apple search ads, taboola,...
- Faire le lien entre les campagnes (coûts) et les performances (CRM)
- Faire le lien entre les campagnes et le web analytics
Autres sources utiles
Google Search console, FB Page insights, Youtube Analytics..
Ajouter des données analytics externes
CRM
Microsoft Dynamics, Hubspot, SAP, Salesforce
Faire le lien entre les actions de marketing digital et les résultats offline
Emailing et marketing automation
Mailchimp, Marketo, Hubspot, Sendgrid...
Relier le marketing automation et les autres leviers
Customer service
Zendesk, Front, ServiceNow
Faire le lien entre les données de support client et les données CRM
eCommerce
Woocommerce, Magento, Prestashop, Shopify
Analyser toutes ses données e-commerce de manière centralisée.
Bien entendu, on peut ajouter d'autres sources internes en se connectant directement aux bases de données.
Les "destinations"
Il s'agit de Data Warehouse dans le Cloud. Chez Unnest, nous utilisons généralement Google Big Query (au sein de Google Cloud Platform), ou Snowflake.
Pourquoi utiliser ce type d'outils ?
Pour réaliser un "data pipeline", il est tout à fait possible de se connecter directement aux APIs. Par exemple, pour se connecter à de la donnée Google Search Console, on peut suivre les deux tutoriels ci-dessous :
Mais utiliser Fivetran donne un certain nombre d'avantages :
- Gain de temps : imaginez que la création d'un pipe de data branché sur une source prend 3 jours à un data ingénieur. Il est assez rapide d'en calculer le coût.
- Accessible pour un data analyst : plus important encore que les coûts, de nombreuses équipes ne disposent pas de ressources de data ingénieurs. Avec Fivetran, un data analyst peut en quelques clics déployer un pipeline data fonctionnel et robuste.
- Maintenance, gestion des erreurs, déploiement : plus besoin de faire de DevOps, de gérer les erreurs ou les évolutions des APIs. Fivetran s'en occupe.
- Connaissance des APIs : étudier les APIs de chacune des sources peut vite devenir un véritable enfer, et une perte de temps importante. L'une des forces de Fivetran est de maintenir la connaissance des modèles de donnée
Prenons un exemple, avec le modèle de donnée de Hubspot : https://docs.google.com/presentation/d/1KABQnt8WmtZe7u5l7WFUoPIsWzv63P9gsWF79XGLoZE/edit#slide=id.g244d368397_0_1
Autant dire que l'on est bien content de ne pas avoir à se plonger dans la documentation des APIs de Hubspot.
Concurrents de Fivetran
Les alternatives les plus courantes sont :
- Stitch pour les plus gros projets data, et Segment dans une moindre mesure
- Supermetrics et Funnel.io dans le monde du marketing digital
A noter que Supermetrics propose aussi des connecteurs pour Google Sheet, et pour Google Data Studio, ce qui en fait un outil intéressant dans certains cas d'usage.
Pricing de Fivetran
Le pricing de Fivetran est au volume. Il s'agit un modèle basé sur le nombre de lignes ajoutées ou mises à jour chaque mois (active rows).
Le mieux est de tester avec l'essai gratuit de 14 jours, ce qui permet d'avoir une estimation basée sur ses données.
De notre expérience, l'ordre de grandeur des coûts pour la plupart des projets est entre 500 euros / mois (le minimum), et 3 000 euros / mois pour les plus gros projets.
Démo / tutoriel
Voir l'article ci-dessous pour suivre un tutoriel pas à pas montrant comment créer un premier pipeline de donnée :
Dans cet exemple, nous utilisons Fivetran pour charger :
- Des données issues de Google Analytics
- Des données issues de Hubspot (nous avons préalablement créé un identifiant qui permet de faire le lien entre les deux, dans cet article :
- Des données issues de Google Search Console