L’analyse sémantique : une réponse au cookieless ?

Par Élodie C. le 28/02/2022

Temps de lecture : 6 min

L'interview de Grégory Jamet, directeur produit chez Qwarry.

Avec la nouvelle rubrique Focus Adtech, la Réclame souhaite donner la parole aux acteurs du marché pour expliquer les technologies à l’œuvre et dessiner les contours de l’industrie de demain.

Avec le cookieless en ligne de mire, l’industrie de la publicité en ligne déroule les alternatives à ce qui était jusqu’alors l’alpha et l’omega du ciblage publicitaire. Le RGPD et les principaux navigateurs web (Safari, Firefox) sont venus bousculer l’ordre établi avant que Google ne vienne porter l’estocade. 

Et si l’on redonnait du sens au ciblage en même temps que l’industrie relevait l’un des plus grands défis – pédagogique – qui se présente à elle, redonner du sens à la publicité en ligne en expliquant son utilité pour l’écosystème certes, et l’économie dans son ensemble. Grégory Jamet, directeur produit chez Qwarry nous explique en quoi l’analyse sémantique fait partie de la solution et donc du présent et du futur de la publicité en ligne.

Sur quelles technologies se base cette nouvelle offre ? Que permet-elle ?

Grégory Jamet : Aujourd’hui, notre solution se base sur l’analyse sémantique. Nous avons construit des modèles dotés d’intelligence artificielle, disons-le simplement, qui vont récupérer les contenus des pages web disponibles à l’achat et à la vente en programmatique. Grâce à ce contenu et à notre modèle, nous pouvons déduire que le contenu va aborder telles ou telles thématique(s) (jusqu’à 450) et y attacher un score.

Pour un article présent sur Le Monde par exemple, nous allons en extraire le texte pour que nos modèles travaillent dessus et identifient les sujets de l’article. Si l’on prend un papier sur la crise ukrainienne, nous pourrons détecter des thèmes types militaire, politique, mais également énergétique s’il évoque les gazoducs Nord Stream qui approvisionnent l’Europe. La solution classe le texte selon différentes catégories avec un score « d’intensité » : plus le score est haut, plus le thème principal est celui détecté.

Cela nous permet de connaître de façon précise le sujet du contenu. Ainsi, lorsqu’il est commercialisé sur le RTB (real-time bidding, NDLR), cela permet de bénéficier d’un ciblage très précis. Aujourd’hui, pour cibler des utilisateurs, les données third party sont encore très largement utilisées : une solution évidemment efficace pour la diffusion des campagnes, mais vous n’êtes pas sans ignorer que plus le temps passe, moins ces données sont accessibles, à la fois grâce au RGPD en Europe, qui demande le consentement des utilisateurs pour qu’elles soient traitées, et via les navigateurs eux-mêmes qui bloquent désormais par défaut les cookies tiers, comme Safari (Apple) et Firefox (Mozilla) dans un premier temps, et Chrome (Google) d’ici fin 2023.

En conséquence, la moitié de l’inventaire n’est pas ciblable avec de la donnée utilisateur. Notre solution permet à un acheteur de cibler un utilisateur qu’il ait donné son consentement ou non, juste au moment où il consulte un article. Nous couvrons un inventaire qui n’est plus ciblable aujourd’hui.

Quel est son avantage sur le marché, sa valeur ajoutée ?

G.J. : Qwarry va débloquer un inventaire non identifiable en termes d’intérêt jusqu’à présent. Avec l’extrême précision des scores, nous sommes en mesure de fournir un détail beaucoup plus important que nos concurrents qui, eux, classent les contenus à partir d’un mot-clé ou d’un groupe de mots pour en déduire une seule catégorisation. Notre solution analyse l’intégralité du contenu, travaille le sens des mots entre eux, et score l’ensemble des sujets présents — automobile, environnement, mobilité, SUV par exemple. 

Ensuite, il y a également un aspect du keywording, encore assez peu utilisé aujourd’hui à des fins de ciblage, mais plutôt plutôt d’exclusion. Le keywording permet de travailler un ou plusieurs mots : pour déterminer qu’un contenu parle de mode, cet outil se base sur une liste de mots comme défilé ce qui est assez commun et pourrait intégrer le défilé du 14 juillet qui n’a pas grand-chose à voir avec la mode. En nous basant sur l’intégralité du contenu, et non pas sur une sélection de mots-clés, nous pouvons déterminer qu’il s’agit d’un défilé militaire.

Vous venez d’annoncer un partenariat avec Xandr, que va permettre le fruit de votre alliance ? 

G.J. : Nous proposons d’ores et déjà notre techno sur des offres tout-en-un, où l’on va opérer l’achat et la vente d’inventaire. C’est-à-dire que nous allons à la fois acheter l’inventaire auprès des publishers, l’augmenter avec notre technologie et le revendre aux annonceurs. On opère ainsi quasiment l’intégralité de la campagne en interne. 

Avec Xandr, un acheteur média va utiliser directement la plateforme Xandr, et donc rester maître de sa stratégie d’achat. La technologie Qwarry étant désormais disponible sur cette plateforme, il peut en bénéficier : opérer avec des cookies, et récupérer cet inventaire non disponible en profitant de la précision de notre technologie.

Google a reporté la mise à mort des cookies tiers sur son navigateur, puis a dévoilé Topics en remplacement de FloC, quels grands défis voyez-vous arriver après le cookieless ?

G.J. : Le cookieless et Topics sont des défis présents depuis un moment maintenant. Je travaille depuis très longtemps maintenant dans la publicité en ligne, et avant pour une DMP, nous parlions déjà de la fin du cookie en 2008. Il a mis 14 ans à mourir, un peu comme Marion Cotillard dans Batman (The Dark Knight Rises, et pour l’histoire, c’est visible ici, NDLR). 

En termes de ciblage, le cookieless va pouvoir se gérer grâce à des technologies comme la nôtre, et d’autres qui auront peut-être plus de mal à prendre : des unions sont créées entre sociétés pour concevoir des identifiants publicitaires, puis des constructeurs de smartphones qui entendent eux-mêmes échafauder leur propre politique liée à la confidentialité… ce n’est pas si simple que ça. Travailler avec du contextuel permet d’être certain d’adresser l’intégralité de l’inventaire.

Le vrai souci du cookieless qu’il faudra gérer à l’avenir, ce sont toutes les problématiques liées à l’attribution. Lorsqu’on cliquera ou souscrira à quelque chose après avoir cliqué sur une publicité, à qui l’attribue-t-on sans cookie ? De même pour le capping, la pression publicitaire auprès de l’utilisateur… c’est un vrai sujet toujours en discussion, il n’y a pas de vraie solution. Le défi du cookieless n’est donc pas encore terminé.

L’un des vrais défis au niveau de l’industrie de la publicité en ligne, c’est qu’elle est souvent mal perçue par les utilisateurs lambda. C’est l’une des raisons qui explique le nombre de refus collecté par les CMP (Consent management plateform) quant à l’utilisation de leurs données. Avec de bonnes raisons puisqu’il y a eu et qu’il y a toujours un peu d’abus sur l’utilisation des données utilisateur et la pression publicitaire.

Le défi global est de parvenir à faire comprendre l’utilité de la publicité en ligne. Certes, elle peut parfois déranger ou ne pas être complètement précise (« accurate ») pour un utilisateur, mais sans publicité sur Internet beaucoup de services seraient payants aujourd’hui. Les internautes ont pris l’habitude du tout gratuit, mais rien n’est gratuit. C’est quelque chose de très compliqué à faire comprendre en dehors de l’industrie.

Il est nécessaire de redonner son sens à la publicité en ligne, non seulement cela a son intérêt en termes de revenus pour les publishers qui dépendant des revenus publicitaires, mais également pour l’industrie au global : de nombreuses industries dépendent de la santé des ventes qui vont être faite et l’industrie du web contribue à la santé de l’économie.

News Scan Book

Starbucks célèbre ses 20 ans en France

1

2

3

4

5

Précédent Suivant