La first-party data en publicité digitale : pourquoi et comment ?

Par Vincent B. et Guilhem B. le 15/01/2025

Temps de lecture : 23 min

Session de rattrapage #4, première partie !

Dans l’univers du marketing digital, les innovations ne manquent pas. Pourtant, derrière cette effervescence, parfois jargonneuse, se cache des bouleversements profonds qu’il est important pour tout professionnel de maîtriser.

C’est là qu’intervient la session de rattrapage. Cette rubrique de la Réclame .mark&tech s’attaque à chaque sujet complexe adtech / média dans une forme à la fois experte et pédagogique. Sur le pupitre, pour mener ce grand travail d’enquête et de restitution : Vincent Balusseau, professeur de marketing à Audencia Business School, et Guilhem Bodin, partner chez Converteo.

La data first-party, nouvelle panacée des marketeurs confrontés à la raréfaction des cookies tiers ?

La nouvelle « silver bullet » d’une publicité digitale plus respectueuse de la vie privée des utilisateurs ? 

C’est ce que qu’affirmait, en substance, le BCG en 2024 : « Les données 1P – les informations que les entreprises collectent auprès de leurs propres publics et sur leurs propres canaux – ne sont pas simplement un substitut aux données third-party. Elles sont un meilleur « produit », et elles représentent une opportunité massive pour les dirigeants marketing ».

« Une opportunité massive » que Google, épaulé par le BCG, avait tenté de chiffrer dès 2021 : « Nous avons constaté que les entreprises qui pariaient sur la donnée 1P en Marketing-Communication étaient parvenues à multiplier par 2,9 leur chiffre d’affaires, tout en réduisant de manière très significative leurs investissements ».

Même son de cloche chez Deloitte Digital : « Votre propre écosystème de données 1P est un élément central de la réussite. Elles permettent de renforcer la relation avec les clients via les médias Owned, et peuvent aussi servir et peuvent servir d’identifiant pour les activations publicitaires ».

Les « anciens » du marketing digital ne seront ni surpris par les discours hyperboliques des grands cabinets de conseil, ni étonnés par les promesses mirobolantes de Google. Ils ont l’habitude.

Mais ceux qui regardent tout cela d’un peu plus loin finissent probablement par s’y perdre. 

Se dirige-t-on, comme on nous le répète depuis quelque temps, vers un futur moins « data-driven » en publicité digitale (donc vers une publicité digitale moins efficiente et moins efficace) ? 

Ou doit-on, au contraire, parier sur la personnalisation omnicanal (en Paid ET en Owned) – promesse enfin atteignable via le combo Data 1P/CDP/GenAI, comme l’assurent M. Abraham et D. Edelman du BCG, et tous les éditeurs MarTech spécialisés.

À défaut d’apporter une réponse définitive à cette question (il faudrait un livre), cette nouvelle session de rattrapage, en deux parties, s’intéresse aux rôles joués par la Data 1P en publicité digitale. Historiquement utilisées en marketing relationnel, ces données propriétaires sont maintenant largement mobilisées en médias, pour enrichir la connaissance client, affiner les stratégies de ciblage (et adapter les messages aux cibles visées) et améliorer la mesure des campagnes (et leurs performances). 

Le tout, dans un contexte effectivement plus protecteur de la vie privée des utilisateurs…

Les différents types de données 1P

Commençons par les bases. Les données first-party, ou Data 1P, recouvrent l’ensemble des données directement collectées par l’entreprise auprès des visiteurs de ses assets digitaux, de ses prospects et de clients. Ces données, qui appartiennent à l’entreprise et dont la collecte et l’utilisation à des fins marketing doivent systématiquement être soumises, en Europe, au consentement explicite de l’utilisateur, peuvent être décomposées en plusieurs types. Nous nous en tiendrons, dans cet article, aux types de données 1P le plus souvent utilisées dans le cadre d’activations en média.

Les données CRM, en premier lieu. 

Celles-ci regroupent les données attachées aux prospects et clients identifiés de l’entreprise, qu’il s’agisse d’abonnés à une newsletter, de leads ou de clients, et peuvent inclure :

– Des données socio-démographiques (p.ex., le genre et l’âge),
– Des données de contact (téléphone, adresse physique, email…),
– Des données transactionnelles (des références des produits achetés au montant dépensé depuis la première commande),
– Des données relatives aux moments de vie (p.ex., l’arrivée d’un enfant dans un foyer),
– Des informations qui permettent de qualifier les individus : par exemple, l’appartenance au programme de fidélité, le niveau atteint dans ce programme de fidélité, des données d’opt-in et d’opt-out pour des sollicitations marketing,
– Des données d’interaction avec les campagnes marketing menées par l’entreprises auprès de ces mêmes individus, via des canaux adressables de type emailing, sms, envois postal, etc., 
– Des données collectées en magasin (via les applications de clienteling, dans le luxe notamment),
– Un ensemble de scores ou calculs effectués sur ces mêmes données, et qui permettent d’aller plus loin dans la qualification de ces individus, et dans le choix des canaux, des contenus et des actions marketing à privilégier pour ces derniers (d’un scoring RFM à des calculs d’appétence pour certaines catégories produits),
– Les données issues du customer service/SAV (et des interactions avec le call center, en particulier).

Ces données sont le plus souvent collectées via différents outils, propres à chaque point de contact, et stockées dans différentes bases de données CRM : une base de données transactionnelle liée au site internet de l’entreprise, une autre attachée à un système de caisse pour les transactions dans les points de vente physiques, une autre utilisée par le service client/le call center, une autre associée à l’outil de gestion de campagnes d’email… Un des enjeux réside alors dans la centralisation de l’ensemble de ces données disparates dans un référentiel client unique, ou RCU, autour d’un identifiant unique, comme une adresse email ou d’un numéro de téléphone.

Les données comportementales capturées par les traceurs posés sur les assets digitaux de l’entreprise par différents outils, en second lieu. 

Ces données comportementales, à la volumétrie souvent bien plus importante que celle des données CRM, correspondent aux interactions des visiteurs/utilisateurs/clients avec le site, l’application ou le produit digital de l’entreprise (voire avec des outils digitaux proposés au point de vente). Elles peuvent être recueillies par les catégories d’outils suivantes (liste est non exhaustive) : 

– Les outils de Web Analyse (p.ex. GA4, Piano, etc.),
– Les outils de Product Analytics (p.ex. Amplitude, Mixpanel, etc.),
– Les outils d’attribution (p.ex. Wizaly, Eulerian, etc.),
– Les plateformes publicitaires (Google ads, Meta ads, DV 360, la DSP de The Trade Desk ou de Xandr, etc.). Les données comportementales captées par les plateformes publicitaires sur les assets digitaux de l’annonceur (comme son site eCommerce) se limitent généralement à des actions clés effectuées par les utilisateurs. Les données collectées par un outil de Web Analyse, par exemple, sont nettement plus exhaustives, offrant la possibilité de retracer l’ensemble du parcours d’un individu sur un site.
– Les Customer Data Platform (CDP, comme Mediarithmics, Imagino, etc.), sur lesquelles nous reviendrons dans la deuxième partie, à paraître, de cet article.

En collectant passivement de la donnée sur l’ensemble des visiteurs (d’un site, par exemple), ces outils créent et alimentent des profils comportementaux attachés à des identifiants anonymes, quand ces visiteurs ne se sont pas créé de compte, ou attachés à des identifiants personnels (de type email, quand ces visiteurs se sont créé un compte et sont donc logués). Précisons que ces outils présentent généralement, via leurs interfaces, des données agrégées : des moyennes de comportements par cohortes de visiteurs (p.ex., des parcours clients typiques sur un site de eCommerce). Mais il est possible d’accéder à de la donnée granulaire. Dans le cas de GA4 par exemple, des instances Cloud de Google permettent d’extraire les données de l’outil de Web analyse pour offrir une vision au hit et à l’évènement, avec des possibilités de regroupement au niveau session ou utilisateur. Ces données sont attachées à un identifiant GA, et incluent des informations relatives au parcours de l’individu sur un site (p.ex. les 5 derniers produits consultés par un individu x sur le site eCommerce de l’annonceur).

Les données d’exposition et d’engagement avec les publicités digitales constituent le troisième grand type de données 1P potentiellement utilisées par les annonceurs pour construire (ou enrichir) des segments activables en média. Google ads, Meta ads, The Trade Desk et autres offrent la possibilité de créer des audiences d’individus exposés à, ou s’étant engagés avec des messages publicitaires : par exemple, on pourra recibler en Display des individus ayant vu tout ou partie d’une vidéo publicitaire sur YouTube, ou retoucher des gens ayant seulement commencé à remplir leurs coordonnées dans une publicité à formulaire sur Meta. Comme les données comportementales, ces données d’exposition/d’engagement avec les publicités digitales peuvent être rattachées à d’autres données relatives à des individus embasés, et ce afin d’enrichir leur profil. On peut ainsi imaginer que des profils prospects ou clients présents au sein d’une instance Cloud (du type Google Cloud Platform), ou présents dans une CDP incorporent ces données d’exposition publicitaire, en plus d’autres données 1P les concernant. 

Notons enfin qu’une partie de la profession a introduit une nouvelle séparation, en distinguant les first-party data des zéro-party data. Ces dernières renvoient aux données que les visiteurs, prospects ou clients choisissent de communiquer à l’entreprise, via des formulaires, des enquêtes de satisfaction, des processus d’onboarding ou encore des jeux-concours (tandis que la data 1P, elle, est collectée de manière passive). Nous n’utiliserons pas cette distinction dans le cadre du présent papier.

Des types de données aux audiences

Les annonceurs ont donc à leur disposition différents types de données 1P, collectées par différents outils, qui peuvent être mises à profit pour un ensemble de cas d’usage en publicité digitale : ceux relevant de la connaissance clients, ceux relevant du ciblage, et ceux, enfin, relevant de la mesure.

Mais avant de détailler les cas d’usages liés au ciblage d’audiences 1P, qui font l’objet de la première partie de cet article, il convient d’aborder les questions relatives à la création de ces audiences, et à l’envoi de celles-ci dans les outils d’achat médias (les plateformes publicitaires).

Chaque type de données 1P présenté dans la section précédente peut être utilisé, indépendamment des autres types de données, pour créer des audiences (activables en média). 

Concrètement :

– Un annonceur peut créer des audiences à partir d’une base de données CRM, et les envoyer dans une plateforme publicitaire (p.ex. les clients ayant acheté un produit il y a moins de 3 mois).

– Il peut aussi créer des audiences à partir des données Analytics (des données comportementales), par exemple dans GA4, et les envoyer dans une plateforme publicitaire (p.ex. les internautes ayant visité trois fois une section du site mais n’ayant pas encore mis de produit au panier).

– Il peut enfin créer des audiences composées d’individus s’étant engagés avec ses publicités ou encore des audiences composées d’individus ayant effectué telle ou telle action (une micro ou une macro-conversion) à partir de la plateforme publicitaire elle-même (p.ex. un internaute ayant vu une publicité vidéo de l’entreprise). 

(Les choses se compliquent un peu puisque certains outils, et notamment une plateforme publicitaire comme Google ads, offrent la possibilité de créer des audiences à partir de différents types de données. La solution publicitaire peut en effet être alimentée par des données comportementales sur le site de l’annonceur, captées par son pixel. Elle peut aussi recevoir des données CRM depuis une base de données CRM ou une CDP. Elle peut enfin accueillir des données comportementales captées par son cousin GA4, avec lequel la solution publicitaire bénéficie d’une connexion directe).

Ajoutons que les solutions publicitaires permettent aux opérateurs d’inclure des filtres supplémentaires aux audiences 1P qu’elles ingèrent, et donc de créer des « segments dans le segment » (p.ex. l’annonceur demande à Meta de ne cibler que les femmes sur la base d’une audience CRM qui lui a été fournie, composée des clients à plus forte valeur des deux dernières années).

D’autres annonceurs, généralement plus matures sur les sujets data, centralisent l’ensemble de leurs données 1P au sein d’un RCU (Référentiel Client Unique, qui peut reposer sur une CDP) : là, les différentes données relatives à un même individu sont regroupées autour d’une adresse email ou d’un autre identifiant personnel (voire un identifiant au niveau du foyer, comme une adresse postale). Ces organisations sont alors en mesure de créer des audiences à partir de l’ensemble des signaux disponibles sur les visiteurs, prospects, utilisateurs, clients présents dans ce RCU (des données CRM, des données comportementales, voire même, dans les configurations les plus évoluées, des données d’engagement avec les publicités digitales), pour les envoyer vers les outils médias (p.ex. les visiteurs d’un site eCommerce sur les deux dernières semaines qui n’ont pas converti, mais qui sont présents dans la base de données CRM, puisqu’ils ont déjà acheté des produits par le passé).

Les audiences personnalisées et le Customer match

a. Le fonctionnement 

Puisqu’il n’existe pas de dénomination « officielle » ou unique pour ce type d’activation, nous avons choisi d’utiliser des termes connus des annonceurs utilisant les plateformes publicitaires de Meta et/ou de Google.

En activant des « audiences personnalisées » ou Custom audiences, un annonceur cherche à retrouver (ou à exclure d’une activation) des audiences issues de sa data 1P parmi les utilisateurs des grandes plateformes, ou parmi les visiteurs de l’Open web, pour les cibler sur ces mêmes environnements.

Ces audiences peuvent être bâties à partir des données CRM, et n’inclure que des individus embasés (p.ex. des clients actuels ou inactifs). Elles peuvent aussi être élaborées à partir des données comportementales (p.ex. des visiteurs du site ou des utilisateurs de l’application), des données d’exposition à la publicité digitale, ou à partir d’un croisement de ces différents types de données (p.ex. des clients embasés ayant effectué telle ou telle action sur le site de l’annonceur). On utilise régulièrement le terme de « Customer match » pour qualifier les audiences issues d’une base de données CRM, qui sont un sous-ensemble de la famille plus large des « audiences personnalisées ». 

Ces audiences sont définies à partir de règles simples, notamment quand elles prennent appui sur un seul type de données : tous les détenteurs d’une carte liberté dont la date d’expiration approche (chez SNCF Connect), tous les visiteurs d’un site eCommerce ayant mis un produit au panier mais n’ayant pas converti (le retargeting chez un ecommercant). Ces audiences peuvent aussi être mises à jour via des approches plus complexes mobilisant la data science : des algorithmes travaillant sur un ou plusieurs types de données (données CRM et données comportementales), et donc sur une multitude de signaux relatifs aux individus, assignent des scores à ces mêmes individus :  appétence pour certains types de produits, intérêt pour tel ou tel type de contenus, probabilité de résilier un contrat, probabilité de devenir un client à forte valeur, etc…

Ces audiences peuvent être relativement étroites (p.ex. les 5% des clients « à plus forte valeur » d’une petite marque DTC) ou plus larges (tous ceux qui ont téléchargé l’application d’un grand développeur de jeu mobile mais qui n’y ont pas joué pendant la dernière semaine ; tous les individus ayant regardé au moins la moitié d’une publicité YouTube d’un constructeur automobile). 

Une remarque s’impose ici : la plupart des grandes solutions publicitaires des walled gardens (de Google à Amazon) permettent aux annonceurs d’envoyer tout type d’audience 1P, dont celles issues de BDD CRM (en vue de faire du Customer match, donc de toucher des individus embasés). Ceci est faisable simplement, et nativement dans leurs solutions publicitaires. Par exemple, Meta peut facilement retrouver, au sein de la base de données de l’annonceur et à partir des adresses email, les individus qui disposent d’un compte Meta. Ces adresses email seront alors transformées en ID publicitaires Meta. Les DSP hors GAFA, et qui ne disposent pas d’emails de consommateurs (comme The Trade Desk), doivent, elles, s’adosser à des solutions tierces qui visent à transformer les adresses email des individus en cookies ou, de plus en plus, en ID alternatives plus respectueuses de la vie privée des utilisateurs.

Ces audiences doivent ensuite être transmises à des solutions d’achat média. 

Les audiences construites à partir d’une base de données CRM (Customer match) peuvent être envoyées de deux manières : soit manuellement (sous la forme d’un fichier Excel encrypté), soit de manière automatique, via une connexion API entre, d’un côté, la base de données CRM de l’annonceur (ou une instance cloud voire une CDP), et la plateforme publicitaire, de l’autre côté (une autre option implique de passer par une solution de CRM onboarding, qui vise à transformer l’adresse email en cookie ou ID fonctionnelle pour l’univers publicitaire).

Les custom audiences, comme celles construites par l’outil de Web analyse, sont, elles, envoyées via une connexion native avec la plateforme publicitaire (comme c’est le cas entre GA4 et Google ads) ou via une connexion API. 

b. Les objectifs

Les objectifs poursuivis au travers des activations d’audiences personnalisées sont nombreux. 

L’objectif principal reste la génération d’une conversion (ou d’un lead), via le retargeting des visiteurs d’un site ayant vu une page produit, ou placé un produit au panier, ou effectué telle ou telle action sur un site. Dans ce cas, l’audience personnalisée est constituée à partir des seuls signaux comportementaux, et peut être construire via la plateforme publicitaire (comme Critéo ou RTB House) ou l’outil de Web analyse. Ces stratégies de retargeting peuvent être assez basiques, en présentant (par exemple) à des visiteurs d’un site le ou les derniers produit consultés. Elles peuvent aussi être plus sophistiquées, notamment dans le contenu des messages adressés en fonction des parcours des individus sur un site, mais cela reste plus rare.

Si l’on s’en tient plus précisément, aux activations de type « Customer match » (utilisant les bases de données CRM), on distinguera les objectifs suivants :

– le recrutement de nouveaux clients, pour commencer. Pour Laure Géry, Global SVP of Digital Media chez Numberly, l’embasement ne reste souvent qu’une première étape dans le recrutement d’un nouveau client, en particulier pour des marques qui vendent des produits coûteux. Le véritable travail de conquête commence alors, et peut certes se faire par email, mais aussi via une surpression exercée en publicité digitale, dans une logique de PRM omnicanal (PRM pour Prospect Relationship Management, donc des campagnes visant à transformer les prospects en clients). Et c’est cette logique, toujours selon Laure Gery, qui explique, au moins en partie, les efforts déployés par un certain nombre de clients de Numberly pour embaser davantage de prospects.

– la fidélisation représente l’objectif classique en Customer match, et recouvre différents sous-objectifs : du développement de la valeur client (LTV) à la prévention de l’attrition jusqu’à la réactivation de clients inactifs. Le développement de la valeur client passe par l’exposition à des publicités ciblées et personnalisées, qui mettront en avant les produits que telle ou telle audience est le plus susceptible d’acheter. A titre d’exemple : dans la division Grand Public de L’Oréal France, on travaille sur l’objectif de ré-achat et, en particulier, de déclenchement du « geste +1 ». Il s’agit d’amener les acheteurs d’une marque donnée à acheter un produit complémentaire, dans le cadre de l’adoption d’une routine beauté, nous explique Giulia Hamard, Directrice Data activation, eCommerce et CRM de la division Grand Public chez L’Oréal France.

– avec l’exclusion d’audiences, pour finir, un annonceur choisit d’exclure des individus embasés, afin de concentrer les investissements médias sur de la pure conquête, et d’éviter de (sur)solliciter des clients acquis. A la clé, des économies potentiellement significatives pour des marques jouissant d’une pénétration forte sur la population (p.ex. un opérateur des télécommunications aux dizaines de millions de clients sur la population française). L’exclusion d’audiences permet aussi de réduire le risque d’adresser des messages promotionnels, à vocation de recrutement, à des clients déjà acquis, et payant un prix plus élevé…

Mais au fond : pourquoi acheter du média alors que le coût marginal d’un envoi d’email est lui pratiquement nul ? 

À cela plusieurs raisons. Une marque peut vouloir toucher :

– les opt-out à la newsletter, 
– les non-ouvreurs de celle-ci (le taux d’ouverture moyen d’un email marketing se situe entre 15 et 25%),
– ceux qui ne cliquent pas sur les notifications in-app, 
– ceux qui ouvrent les newsletters, mais qu’on veut en plus toucher en média pour accroitre la probabilité de conversion (une logique de surpression média assez classique, où l’exposition à la publicité vient s’ajouter aux envois de newsletters, ainsi que nous le dit Giulia Hamard).

c. Les points de vigilance

Pour que les stratégies Customer match fonctionnent, le lecteur aura compris que les plateformes doivent « retrouver » les audiences 1P de l’annonceur sur leurs propres environnements. C’est là qu’intervient ce qu’on appelle « le taux de matching », qui correspond simplement au pourcentage des audiences de l’annonceur que la plateforme retrouve, et identifie – sur la base, le plus souvent, d’un email commun ou d’un numéro de téléphone. Ces taux de matching varient beaucoup d’une plateforme à une autre, pour un ensemble de raisons : de +/- 20% sur l’open web aux alentours de 50% sur les walled-gardens. L’annonceur a un retour sur le taux de match effectif, mais n’a pas de visibilité sur l’identité des individus qui ont effectivement été retrouvés…et donc ciblés. Dans le cas de l’exclusion d’audience, cela signifie par exemple qu’une partie seulement des clients sera effectivement exclue d’une activation… et que l’annonceur n’aura pas de visibilité sur l’identité des « exclus ». Il est donc important de comprendre que les activations médias d’audiences 1P sont par nature moins précises que celles effectuées via les canaux relevant du marketing relationnel. Les possibilités d’orchestration des sollicitations en omnicanal sont donc aussi limitées: les annonceurs savent qui, au sein d’un segment donné ,est adressé via email, sms ou push-notifications, mais ne savent pas qui l’est via le média.

Attention, donc, à la taille des audiences effectivement activées via les plateformes, et à la capacité de ces activations à avoir un vrai impact business – et ce, aussi, relativement au temps passé à construire/paramétrer dans les outils publicitaires ces multiples campagnes. Une solution consiste à pouvoir activer, en parallèle, et en continu, de multiples audiences personnalisées, avec des outils, comme des CDP, permettant d’industrialiser ce type d’approches, comme le fait remarquer Florian Combres, Head of Media Performance & Data, groupe AXA).

Attention, aussi, à l’inflation des coûts médias induite par le ciblage d’audiences de taille restreinte. 

Les algorithmes des plateformes auront plus de difficulté à toucher des cibles étroites, en particulier sur des périodes de campagne courte, et le feront donc « payer à l’annonceur ». Prenons l’exemple de Meta. Il faut que les membres d’une audience personnalisée se connectent sur des assets Meta pendant la période de la campagne pour que Meta ait effectivement la possibilité de leur adresser une publicité. Et, pour s’assurer que ce soit la publicité de l’annonceur qui leur soit affichée, Meta devra accroître les CPM afin de remporter les enchères. Pour David Nedzela, Directeur Marketing & Clients de SNCF Connect : « Si tu n’as pas au départ une audience de 200 000 client c’est compliqué. Et même là, la plateforme vous fait payer des CPM qui sont complètement délirants… dur à justifier sauf à avoir des coefficients de marge proches de ceux de l’industrie du luxe ! Ça devient très compliqué pour les acteurs du Retail… ». Le constat est plus mesuré chez Xavier Meunier, Global Media Director chez L’Oréal, qui rappelle « qu’il faut avoir des audiences de taille suffisante pour maîtriser les coûts médias sans dégrader la qualité de celles-ci ».

Mais il faut surtout que le surcoût média induit par ces audiences de taille plus réduite soit compensé par des performances supérieures (en termes de taux de clic et de taux de conversion pour les audiences activées). Selon Laure Gery, les stratégies en Customer Match, reposant sur des audiences présentes dans des BDD CRM, continuent à très bien performer, comme l’indiquent les ROAS supérieurs à ceux atteints via d’autres stratégies, malgré les coûts médias. (On pourra arguer des limites du ROAS comme indicateur de performance – versus un ROAS incrémental – sur des audiences embasées, mais le sujet de l’incrémentalité des actions marketing sur des audiences plus ou moins captives dépasse le cadre de cet article).

Les stratégies d’activation média d’audiences personnalisées, et encore plus celles reposant sur des BDD CRM posent, pour finir, des défis spécifiques en matière de protection des données personnelles – et ce au- delà des problématiques de recueil de consentement. Même si le secteur de la Banque-Assurance, très régulé, constitue probablement un cas spécifique, Florian Combres insiste sur le fait que toute stratégie amenant à partager des données clients avec des plateformes publicitaires nécessite l’implication des équipes DPO et sécurité. « Il faut obtenir des garanties suffisantes sur les méthodes de chiffrement permettant de pseudonymiser la donnée avant de la partager ». Les solutions Data Clean Room disponibles chez Google et Amazon, comme les Data Clean Room « indépendantes » pour les activations auprès d’un broadcaster ou d’un éditeur de presse représentent certainement une solution (nous creuserons le sujet des Data Clean Rooms dans la deuxième partie de cet article). Mais, comme il le précise « sur l’ensemble de ces sujets, le diable est véritablement dans les détails, encore plus pour des assureurs dont le métier est d’évaluer les risques ! ».  Au-delà de la Banque-Assurance, Laure Gery constate elle aussi, de plus en plus, une certaine « frilosité » des DPO autour de l’utilisation de la data 1P à des fins de ciblage, logiquement exacerbée sur les approches « Customer match ».  

Les audiences look-alike

Piliers des stratégies de ciblage en 1P pour beaucoup d’annonceurs, les stratégies reposant sur des audiences dites « look-alike » (ou « audiences similaires », LAL, etc.) s’inscrivent dans des logiques de conquête, ou de recrutement. Le principe est le suivant : l’annonceur transmet à une plateforme une audience personnalisée, et les algorithmes de cette même plateforme iront chercher, parmi leurs utilisateurs, des individus ayant les mêmes caractéristiques, centres d’intérêts et comportements (des interactions avec les publicités jusqu’aux comportements d’achats) donc les jumeaux statistiques des membres composant cette audience personnalisée. L’intérêt majeur du LAL réside dans la capacité à toucher des populations de taille plus importante, plus susceptible, en théorie, de répondre aux sollicitations marketing de l’annonceur que les audiences nativement offertes par les plateformes. A l’annonceur de choisir le niveau de proximité avec l’audience de départ, pour élargir plus ou moins le reach de sa campagne. 

Le LAL est, chez L’Oréal, « un des plus gros leviers en média digital », nous confie Giulia Hamard. A cela une raison simple : la performance supérieure de ce type d’activation. Grâce aux tests effectués depuis plusieurs années « on a démontré que cette prospection, tirée par la 1st-party data, performe généralement mieux que les audiences natives des plateformes (dans une efficacité omnicanal, offline et online). Pour autant, nos données first-party et les audiences similaires qui en découlent ne sont pas destinées à remplacer les audiences des plateformes, mais plutôt à les compléter et à fonctionner en synergie avec elles », précise de son coté Xavier Meunier, Global Media Director chez L’Oréal. 

David Nedzela est lui plus nuancé. Pour le directeur marketing & clients de SNCF Connect, les résultats varient beaucoup d’une activation à l’autre. Le look-alike « a un peu perdu de sa superbe au fil des années…peut-être est-ce dû à la logique « cash-machine » des plateformes qui les a obligées à ratisser encore plus large, faisant baisser la performance des look-alike ».

Si le LAL est une des options classiquement offertes chez un Meta, il peut impliquer, chez les grands éditeurs de presse ou les broadcasters, le recours à des Data Clean Rooms. Comme nous l’explique Florian Combres, Axa pourrait, en théorie, mobiliser des Data Clean Rooms pour identifier, au sein de l’audience de TF1.fr ou celle du Monde, des jumeaux statistiques d’une audience 1P constituée d’individus considérés comme appétents pour un produit d’assurance donné.

La 1P dans les campagnes automatisées

Nous avons détaillé les avantages de stratégies publicitaires reposant sur des approches assez granulaires, où un annonceur active, en parallèle, de multiples audiences bâties avec sa donnée 1P (et ce en complément du travail effectué via des audiences 2P et 3P). Reste alors à aborder un dernier sujet : Quid des campagnes automatisées, dopées au Machine Learning qui, comme nous l’avons expliqué dans une précédente « session de rattrapage », invitent l’annonceur à laisser la main à la machine, qui prend elle-même en charge, ou du moins en partie, les décisions de ciblage ? Quels rôles, par exemple, dévolus à la data 1P dans un PMax de Google ? Rappelons que dans le cas de PMax, Google encourage les annonceurs à laisser l’algorithme identifier, par lui-même, les audiences les plus susceptibles de réaliser l’action souhaitée par l’annonceur. Il convient alors de « lâcher la bride » à l’algorithme, en lui laissant un champ des possibles très ouvert en termes de cibles à explorer. Le principe est le même chez Advantage+ de Meta, et dans les produits similaires proposés par les grandes plateformes. S’il faut bien, en effet, avec ce types de campagnes, laisser l’algorithme apprendre, par lui-même, les annonceurs sont invités à aiguiller celui-ci : nous évoquions, lors de cette session, les « signaux d’audiences » ou les « termes de recherche » à transmettre à la plateforme, qui doivent aider celle-ci à apprendre plus rapidement. La solution ne s’en tiendra pas à ces audiences 1P, qui ne sont que des signaux visant à orienter son travail. Là encore, les données de l’annonceur représentent un atout précieux à l’ère des campagnes automatisées. 

Ajoutons, pour finir, que la capacité de l’annonceur à bien nourrir l’algorithme avec ses données 1P revêt une importance majeure, quel que soit le type de campagne mise en place (manuelle ou automatisée). On pense en particulier aux données de conversion sur les sites des annonceurs, dont une partie échappe maintenant aux plateformes publicitaires, sous les effets conjugués des initiatives privacy (dont les évolutions des navigateurs) et de l’adoption d’ad-blockers par les internautes. Or ces données de conversion, qui sont bien des données 1P, permettent aux algorithmes d’apprendre, et de mieux performer… Des solutions techniques existent, qui renvoient au sujet de la mesure, dont nous parlerons dans la deuxième partie de ce papier. Au menu : l’adaptation des créas (et oui, c’est bien beau de multiplier les segments, mais encore faut il pouvoir leur proposer des messages différents), la mesure et la connaissance client… et des solutions technologiques comme les CDP et les Data Clean Room. 

Rendez-vous le 12 février pour la 2nde partie de cette 4e session de rattrapage !

News Scan Book

Le clash des IA - Claude vs ChatGPT
Précédent Suivant

1