🧑‍💻
TL;DR : un.e Data Engineer (ou Data Platform Engineer / ingénieur data) construit et opère la plateforme data et les pipelines de données (ETL/ELT) qui rendent la donnée fiable et disponible pour la BI et l’IA. Selon les organisations, la modélisation et la couche “prête dashboard” sont souvent prises en charge côté Analytics Engineer / BI.

Qu’est-ce qu’un data engineer ?

Le/la data engineer (ou Data Platform Engineer / ingénieur data) est le profil qui s’assure que la donnée circule du monde réel vers les usages sans se casser en route. C’est la personne qui conçoit, construit et opère les pipelines de données et la plateforme data qui permettent à l’entreprise de collecter, transformer, fiabiliser et exposer des données dans un format exploitable.
On ne le voit pas toujours, mais c’est une fonction essentielle : sans fondations solides, les dashboards se fragilisent, les projets IA ralentissent, et surtout, la confiance dans les chiffres s’érode. Et au-delà du technique, c’est aussi un rôle d’accompagnement : la capacité à vulgariser et à être pédagogue (pour aider les équipes à comprendre et utiliser la donnée) fait partie des vrais marqueurs d’un bon data engineer.

Pourquoi ce rôle est devenu incontournable ?

Parce que la donnée est partout… Mais elle n'est utile que si elle est :
  • Accessibilité des données (au bon endroit, au bon format, avec les bons droits)
  • Qualité des données (fiabilité, fraîcheur, cohérence)
  • Traçabilité / data lineage (provenance, transformations, impacts)
  • Industrialisation / dataops (monitoring, reprise sur incident, coûts maîtrisés)
Autrement dit : souvent, ce n’est pas un problème d’analyse mais un problème de production — la donnée n’a tout simplement pas été industrialisée de bout en bout.

Les missions clés d’un data engineer

Selon le contexte (startup, scale-up, grand groupe, cabinet de conseil), le périmètre varie. Mais on retrouve généralement :
1. Cadrage & architecture data
Qualifier les sources, comprendre les besoins, choisir les patterns (batch, event-driven, CDC, APIs) et définir une architecture cible (warehouse, lakehouse, datalake). C'est la phase stratégique, souvent sous-estimée, qui conditionne tout le reste.
2. Ingestion & orchestration (ETL/ELT)
Mettre en place l’ingestion depuis les différentes sources, orchestrer les jobs, gérer les dépendances, les reprises sur erreur, et optimiser la performance et les coûts. En pratique : Fivetran, Airbyte, APIs maison, streaming… Le/la data engineer sait jongler avec tout ça.
3. Transformation & préparation de la donnée
Nettoyer, standardiser, historiser, consolider. L’objectif est de produire une base de données robuste et cohérente, sur laquelle les usages peuvent s’appuyer.
À noter : la modélisation orientée usage (datamarts, couche sémantique, définitions de KPI) est parfois prise en charge par le data engineer, mais pas systématiquement. Dans beaucoup d’équipes, elle est plutôt portée par un Analytics Engineer (ou par des profils BI/analytics), au plus près des besoins métier.
4. Qualité, observabilité & fiabilité
Mettre des tests, du monitoring, de l’alerting, du lineage, et des engagements de service (SLA/SLO). Un pipeline cassé, c’est une décision business prise sur une information erronée.
5. Mise à disposition (plateforme) & collaboration
Rendre la donnée disponible via la plateforme (tables, vues, accès, performance, sécurité), et travailler en continu avec les équipes data et métiers.
Cela implique aussi de vulgariser (contraintes, choix d’architecture, impacts) et d’être pédagogue pour faciliter l’appropriation de la donnée par des profils non techniques.
La mise à disposition finale des données consommées dans les dashboards (datasets BI, couche sémantique) est, selon les organisations, souvent construite côté Analytics / BI, en lien étroit avec les équipes métier.

Les compétences attendues

Le socle technique :
SQL (souvent avancé), Python, cloud et data warehouse (BigQuery, Snowflake…), transformation (dbt), orchestration (Airflow, Dagster…), CI/CD (Git, tests, déploiement).
Ce qui fait la différence :
La rigueur et le sens du détail, une vraie culture software engineering, et surtout la capacité à vulgariser et être pédagogue : expliquer une anomalie, une contrainte de plateforme ou un choix d’architecture à des profils non techniques.

Data Engineer, Data Platform Engineer, Analytics Engineer : comment s’y retrouver ?

Les intitulés varient, mais une distinction aide à clarifier :
  • Le Data Engineer / Data Platform Engineer porte la plateforme et la production (fiabilité, pipelines, exploitation).
  • L’Analytics Engineer porte davantage la couche orientée usage (modélisation sémantique, métriques, datasets BI).
Dans certaines équipes, ces rôles se recouvrent. L’essentiel est que la responsabilité de chaque couche soit claire.

En quoi c'est différent d'un data analyst ou d'un data scientist ?

Le data analyst utilise des données (souvent déjà préparées) pour produire des analyses et des dashboards. Il ne les produit pas. Le data scientist construit des modèles statistiques ou ML — il a besoin de datasets propres, versionnés, traçables pour travailler. Le data engineer, lui, construit et opère la chaîne qui amène la donnée au bon niveau de qualité pour rendre ces usages possibles.
Pour faire le parallèle avec nos articles sur le Data Product Owner et le Data Owner : là où le Data Owner définit qui est responsable des données et quelles règles s'appliquent, et là où le Data Product Owner orchestre le delivery de produits data — le data engineer, lui, est celui qui construit l'infrastructure qui rend tout ça possible. Ces trois rôles sont complémentaires et se renforcent mutuellement dans une organisation data mature.

Avec qui travaille-t-il / elle au quotidien ?

Un data engineer collabore en permanence avec : les Data Analysts pour alimenter les besoins de reporting, les Analytics Engineers pour la transformation et la couche sémantique (parfois c'est le même rôle), les Data Scientists pour fournir des datasets fiables pour l'IA, et les équipes produit et métier pour clarifier les définitions et les usages.

Quel profil devient data engineer ?

Les parcours sont plus variés qu'on ne le croit. On retrouve des développeurs logiciels avec une forte appétence pour la donnée, des analystes ou profils BI qui ont monté en compétences sur l'ingénierie et l'industrialisation, et des profils infra / cloud qui se sont spécialisés sur les workloads data.
Le vrai point commun ? Un goût prononcé pour construire des choses qui tiennent dans le temps. Automatiser ce qui peut l'être. Fiabiliser ce qui ne l'est pas encore. Et rendre maintenable ce que les autres ont construit vite. C'est un profil d'artisan autant que d'ingénieur.

Rejoindre Unnest : Data Engineer (H/F) Modern Data Stack

Si vous vous reconnaissez dans ce rôle — et que vous avez envie de le pratiquer en environnement conseil, sur des missions variées et exigeantes — Unnest recrute ! L’annonce ici :