Table des matières

BigQuery vs GA4 : pourquoi les agences repensent-elles leur pile de données ?

An abstract transition scene: a fragmented data flow entering a dark, opaque box on the left (symbolizing Google Analytics 4) and emerging on the right as a clean, structured stream flowing into a transparent, geometric container representing BigQuery.

Pendant des années, Google Analytics a été la couche d'analyse par défaut des agences : facile à déployer, tableaux de bord familiers et réponses rapides. Mais aujourd'hui, les agences de marketing sont confrontées à des clients qui remettent en question les performances annoncées, à un désalignement entre les plateformes publicitaires et les revenus de base, à une pression toujours plus forte en matière de protection de la vie privée et à des marges sous pression.

Nous avons rencontré Jos Ijntema, spécialiste des données chez Grain, pour comprendre pourquoi de plus en plus d'agences réévaluent GA4 et pourquoi posséder votre pile de données avec BigQuery devient une décision stratégique.

Les performances sont plus difficiles à atteindre. Les coûts sont plus élevés. Les décisions sont donc plus importantes - et les équipes se rendent soudain compte que les données ne sont pas tout à fait exactes.

Cet article explique ce que cela signifie pour les propriétaires d'agences qui souhaitent se développer, se différencier et rester crédibles.

Les problèmes ne sont pas nouveaux (mais ils sont de plus en plus coûteux)

Les problèmes ont toujours existé. La situation n'a pas beaucoup empiré. Mais la prise de conscience que nous devons faire quelque chose, voilà ce qui a changé.

D'une part, la pression sur les performances s'intensifie avec des CPA et des CPC qui continuent de grimper et une concurrence de plus en plus féroce. D'autre part, l'application de la législation sur la protection de la vie privée s'intensifie et les entreprises placent enfin les outils Google derrière des murs de consentement... mais cela crée ses propres lacunes en matière de données.

Dans ce scénario, la marge d'erreur dans les décisions d'allocation budgétaire a disparu.

Les rapports sont le meilleur outil des agences pour représenter leur expertise, orienter les conversations stratégiques et déterminer si les clients vous font confiance. Si les chiffres ne correspondent pas, l'effet de halo est brutal : la qualité de la campagne est remise en question, la crédibilité de la stratégie diminue et les relations s'affaiblissent.

Des données propres, cohérentes et explicables inversent complètement cette dynamique. La conversation passe de la défense de vos données à "Comment pouvons-nous les améliorer ensemble ?". C'est la différence entre être interrogé et être un partenaire stratégique.

Trois limites cruciales de l'AG4

GA4 joue encore un rôle important dans la comparaison des canaux, l'analyse des entonnoirs et la compréhension du comportement des sites web. Mais ses limites deviennent visibles dès que les agences vont au-delà de l'optimisation de surface.

En collaboration avec des agences de marketing, Jos remarque 3 limitations GA4 de manière répétée :

1. Données manquantes à l'échelle

Les bloqueurs de suivi, les restrictions imposées par les navigateurs (comme l'ITP de Safari) et les exigences en matière de consentement peuvent bloquer 40 à 50 % de vos données avant qu'elles n'atteignent le GA4. Un pourcentage structurel de données est manquant.

2. Perspective Web uniquement

GA4 suit fondamentalement le comportement des sites web. Mais les clients ne s'intéressent pas aux mesures des sites web de manière isolée: ils s'intéressent au chiffre d'affaires, à la marge, à la valeur de la durée de vie des clients et aux taux de retour.

Très souvent, votre client demande à avoir le plus de chiffre d'affaires possible. Je lui demande alors : "D'accord, mais que se passera-t-il si je vous livre un chiffre d'affaires qui remonte jusqu'en arrière, ou si je vous livre un chiffre d'affaires avec de faibles marges, ou si je vous livre un chiffre d'affaires avec des clients qui ne commandent qu'une seule fois ?

Pour répondre à ces questions, vous devez combiner les données web avec les systèmes dorsaux, les données CRM et les mesures financières. GA4 peut importer certaines de ces données, mais qu'en est-il des ventes hors ligne ou de la qualité des revenus ? Ces paramètres sont rarement intégrés de manière native dans GA4.

3. Plate-forme et biais d'interprétation

Pour les agences qui gèrent des stratégies multicanal, le fait de s'appuyer sur une plateforme d'analyse appartenant à Google pour attribuer équitablement la valeur entre Google Ads, Meta, TikTok et d'autres canaux crée un conflit d'intérêts inhérent. "Étant donné qu'il s'agit du canal le plus important pour un grand nombre d'entreprises, je trouve personnellement que c'est très désagréable d'un point de vue stratégique.

Mais le problème de la transparence va plus loin que le biais de la plateforme. La logique d'attribution de GA4 repose sur des modèles et des hypothèses qui ne sont pas toujours visibles pour les utilisateurs.

Quelque chose se présente sous la forme d'un chiffre, mais derrière ce chiffre se cache une interprétation. C'est dangereux si vous fondez votre stratégie sur ce chiffre.

Prenez les tests A/B, par exemple. GA4 utilise HyperLogLog++ pour estimer le nombre d'utilisateurs, ce qui semble technique et précis. Mais comme le souligne Jos, "même si vous voyez les chiffres... derrière, il y a une interprétation, une collection de modèles", ce qui signifie que ces données sont fondamentalement inadaptées à une analyse expérimentale rigoureuse. Si vous menez des programmes de CRO, d'optimisation des médias à grande échelle ou toute autre forme d'expérimentation structurée, il s'agit d'une contrainte sérieuse : vous prenez des décisions stratégiques basées sur des chiffres qui semblent définitifs mais qui sont en fait des estimations statistiques optimisées pour différents cas d'utilisation.

Pourquoi BigQuery, et pourquoi maintenant ?

L'autorité française de protection des données a déjà statué que le GA4 n'est pas conforme sans consentement. D'autres régulateurs européens sont susceptibles de suivre. Vous pouvez d'ores et déjà voir venir. Allez-vous prendre ce risque ?

Ce changement de réglementation s'inscrit dans le cadre d'un mouvement européen plus large en faveur d'une application plus stricte et d'un contrôle technique, que nous analysons en détail dans notre guide des exigences européennes en matière de suivi côté serveur.

Grain a délibérément choisi de tout construire sur BigQuery tout en utilisant GA4 comme l'une des sources. Leur raisonnement révèle une vision stratégique à laquelle les agences tournées vers l'avenir devraient prêter attention :

1. Transparence totale des données brutes

BigQuery combine les données marketing, les données backend, les données CRM et les données financières, ce qui vous permet d'avoir une vue d'ensemble.

2. Le respect de la vie privée dès la conception

"Les bloqueurs de suivi, pourquoi sont-ils là ? Parce qu'ils pensent que c'est terrible que Meta, TikTok, Pinterest, Google soient présents sur tous les sites web." La collecte de données de première partie pour vos propres analyses, au contraire, est une opération commerciale normale qui ne porte pas atteinte à la vie privée. C'est exactement le principe qui sous-tend le marketing de données de première partie axé sur la protection de la vie privée: collecter des données pour vos propres analyses et prises de décision, plutôt que d'alimenter des écosystèmes tiers opaques.

3. Préparation à l'avenir

Les données feront bientôt partie de votre avantage concurrentiel. Ou peut-être même l'hygiène, que vous ne pouvez plus exister sans une bonne gestion des données.

4. Souveraineté des données

Votre entrepôt de données vous appartient. Vous contrôlez les données qui y circulent, les personnes qui peuvent y accéder et la durée de leur conservation. Sans dépendre d'outils tiers, vous avez la liberté de développer votre base de données au fil du temps, plutôt que de la reconstruire chaque fois qu'une plateforme modifie ses priorités. C'est important parce que le paysage concurrentiel évolue. L'accès aux données ne vous différenciera pas: toutes les agences disposent d'outils d'analyse. Ce qui distinguera les agences stratégiques des fournisseurs d'exécution, c'est la propriété des données.

Le contraste est évident :

  • Les agences qui s'appuient sur des plateformes tierces transmettent les données de leurs clients, dépendent de la logique de la plateforme et acceptent comme "normales" les zones d'ombre. Elles louent leur infrastructure et espèrent que le propriétaire ne changera pas les conditions.
  • Les agences qui possèdent leurs données contrôlent la qualité, l'interprétation et la flexibilité à long terme. Elles développent une connaissance institutionnelle qui s'enrichit au fil du temps au lieu de s'évaporer lorsqu'une plateforme modifie son API.

GA4 vs BigQuery : des rôles différents dans une pile de données moderne

Comparaison entre Google Analytics et BigQuery

BigQuery est-il vraiment trop complexe ?

Lorsque Jos parle de BigQuery aux agences, la réponse la plus fréquente est qu'il semble très technique. Ce qui est vrai, en effet, mais c'est là que la conversation doit changer : les gens comparent BigQuery au statu quo, qui est coûteux à un point qu'ils ne soupçonnent pas.

Le véritable risque n'est pas le coût de la mise en œuvre : ce sont les mauvaises décisions basées sur des données erronées.

Considérez un budget de campagne de 10 000 euros. "Vous décidez que la campagne A est meilleure que la B. Vous allez donc concevoir de nouvelles pages d'atterrissage, de nouvelles créations, vous allez envoyer votre agence de marketing. Vous allez tout mettre en place. Cela vous coûte quelques milliers d'euros, puis votre budget. Et puis il s'avère que ce n'est pas la bonne campagne".

Prenons l'exemple d'une campagne du vendredi noir qui semble réussie dans l'AG4 : "Vous pensez que cela se passe très bien. Nous en tirons beaucoup de revenus. Mais il s'avère que tout ce chiffre d'affaires a été réalisé sur des articles à très faible marge. De plus, ces clients renvoyaient tout."

Dans ces scénarios, les mauvaises données sont bien plus coûteuses qu'une pile de données.

Voici donc la réalité : la complexité existe, que vous le reconnaissiez ou non. GA4 avec une perte de données de 40 à 50 %, une mauvaise attribution et les algorithmes de boîte noire de Google... c'est complexe aussi. Vous vous y êtes simplement habitué.

L'apport du suivi côté serveur

Le suivi côté serveur n'est pas à lui seul une solution miracle, et Jos est clair à ce sujet. Mais lorsqu'il est associé à une propriété claire des données, à un entrepôt (comme BigQuery) et à une proposition d'agence structurée, il devient le fondement d'une pile de données évolutive.

Le suivi côté serveur permet aux agences de

  • Normaliser les configurations côté serveur
  • Maintenir des pipelines respectueux de la vie privée
  • Alimenter en données fiables les plateformes d'analyse et de publicité
  • Activez plusieurs clients avec une approche évolutive

C'est exactement ce qui définit une agence stratégique.

Prêt à découvrir ce que le suivi côté serveur pourrait apporter à votre agence ?

Feuille de route des agences pour améliorer leur pile de données

Étapes de l'amélioration de la stratégie de qualité des données

Étape 1 : Vérifier la présence de "Maximizer Vision".

Jos Ijntema insiste sur la nécessité de commencer par une vision, en particulier pour les clients du commerce électronique. Tous les clients ne sont pas prêts. Filtrez pour ceux qui ont ce qu'il appelle une "vision Maximizer" : ils sont prêts à utiliser les données dans tous les départements (marketing, achats, finances, etc.) pour stimuler l'optimisation sur trois piliers clés :

  • alimentation en produits
  • valeur de conversion
  • les audiences.

Étape 2 : Commencer par l'analyse de rentabilité

Avant d'investir du temps dans la formation ou la mise en œuvre, parlez à votre client et comprenez ses problèmes. Vous saurez ainsi si vous pouvez réellement monétiser l'amélioration.

Passez à un modèle de tarification fondé sur la valeur, en vous demandant "quelle est la valeur que nous apportons" au lieu de "combien cela me coûte-t-il". Demandez à votre client quelles sont les pertes de revenus, les facteurs de coûts ou les opportunités de croissance que les données fragmentées entraînent. Des questions cruciales pour vos clients :

  • Qu'est-ce qui vous coûte des revenus en ce moment ?
  • Qu'est-ce qui génère des coûts inutiles ?
  • Où voyez-vous des possibilités de croissance ?

Il s'agit généralement de données fragmentées : le service de gestion des commandes voit les stocks se démoder, mais le service marketing ne peut pas agir sans ces données. Les entrepôts de données, ou Server-side Tracking, combinent les données départementales pour débloquer des opportunités. Voici le processus recommandé par Jos :

  1. Définir les cas d'utilisation et la valeur
  2. Évaluer les options telles que les entrepôts ou les SST
  3. Établissez un ordre de priorité en fonction du retour sur investissement ou de l'effort pour choisir votre meilleur client.

Étape 3 : Faire des estimations réalistes des ressources

Il ne faut pas tout miser sur l'enthousiasme d'une seule personne. "C'est aussi ce qui se passe souvent. Il y a alors une personne dans l'agence qui est super enthousiaste et qui tire la charrette. Toutes sortes de projets clients tournent autour de sa solution. Lorsque cette personne s'en va, vous vous retrouvez avec un énorme problème.

Vous avez besoin de :

  • Au moins deux personnes compétentes
  • Des estimations réalistes du temps nécessaire à la mise en place et à la maintenance
  • Une compréhension claire du niveau de complexité que vous pouvez réellement prendre en charge : commencez simplement avant de passer à des entrepôts.

Étape 4 : Définir la construction ou le partenariat

Jos est catégorique sur ce point : "Chez Grain, nous en sommes à 7. Oui, nous ne pouvons pas supporter à la fois Azure, AWS et Google Cloud. Nous avons donc fait un choix que nous maîtrisons bien." La même logique s'applique aux agences. Vous excellez dans les publicités Google, les campagnes Meta, le développement créatif ou la planification stratégique. L'infrastructure de données est une autre spécialité.

"D'après ma propre expérience... Si vous êtes très bon avec Google Ads, pourquoi voudriez-vous ajouter toutes ces données ? Cela prend du temps. De l'énergie. Vous devez répondre à toutes sortes de questions d'assistance. Vous courez des risques.

La question n'est pas de savoir si les données sont importantes (elles le sont). La question est de savoir si la construction et la maintenance de l'infrastructure par vous-même est l'utilisation la plus rentable du temps de votre équipe.

Étape 5 : Élaborer la proposition

Ce n'est qu'après avoir validé les besoins du client, estimé les ressources et décidé de votre modèle de prestation que vous devez présenter cette offre au client.

Positionnez vos capacités en matière de données comme

  • La base d'un partenariat plus stratégique, et non un ajout technique.
  • Correction des écarts de confiance (par exemple, "un rapport correspond à la réalité du backend").
  • Faciliter les discussions proactives : "Éliminons ce stock vieillissant avant qu'il n'atteigne les démarques".

La liste de contrôle de l'agence stratégique

Si l'on examine les agences partenaires les plus performantes de TAGGRS, un schéma se dessine. Agences stratégiques :

  • Intégrer l'infrastructure de données en tant que norme. Il ne s'agit pas d'un produit d'appel ou d'une fonction supplémentaire. Des données propres, complètes et transparentes sont à la base de tout ce qu'ils font.
  • Concentrez-vous sur la vitesse d'activation. Ils peuvent intégrer de nouveaux clients dans leur pile de données en 90 jours, car ils ont normalisé leur approche.
  • L'échelle grâce à la répétabilité. La mise en œuvre de chaque nouveau client devient plus rapide et plus fiable, car ils réutilisent une infrastructure éprouvée au lieu de repartir de zéro à chaque fois.
  • Positionner les données comme un avantage stratégique. Ils parlent des capacités des données dans les résultats commerciaux : prise de décision plus rapide, allocation de budget plus sûre, vision intégrée du parcours du client.

Il ne s'agit pas d'agences qui essaient de tout faire elles-mêmes. Ce sont celles qui ont reconnu que l'infrastructure de données - comme la gestion des serveurs avant elle - est essentielle mais pas différenciatrice. Elles s'associent à des spécialistes qui mangent, dorment et respirent l'entreposage de données, afin de pouvoir se concentrer sur ce qui les rend exceptionnelles.

FAQ

Que signifie l'expression "source unique de vérité" ?

Selon Jos, il existe trois piliers essentiels :

Achever la collecte des données. Vous devez obtenir une image complète avant que les bloqueurs de suivi, les restrictions de navigation et les murs de consentement ne la suppriment.

Transparence. Lorsque l'attribution semble erronée ou que les canaux ne s'additionnent pas, vous devez examiner les données sous-jacentes, et pas seulement le tableau de bord. "En fait, vous voulez simplement pouvoir consulter les données qui se cachent derrière les rapports pour savoir exactement ce qui se passe. Et cela est protégé" dans l'AG4- La véritable propriété des données. Vos données doivent être le moteur de votre avantage concurrentiel, et non pas enrichir les capacités de ciblage publicitaire de Google. "En tant qu'entreprise, vous devriez collecter vos propres données... collecter vos propres données, les garder pour vous et les partager le moins possible.

À propos de l'auteur

Récemment publié

magnifiercrossmenu linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram