IA : pourquoi « nano-banana » de Google s’apprête à tout changer pour le monde de l’image

Par Olivier Legris le 01/09/2025

Temps de lecture : 6 min

Après la post-vérité, bienvenue dans l'ère de la post-photographie.


Cette tribune est signée Olivier Legris. Il est le co-fondateur d’Alter, un assistant IA Mac qui révolutionne l’usage des ordinateurs en permettant aux modèles de « voir » ce qui se passe sur l’écran et donc d’offrir la meilleure réponse et la meilleure automatisation possible. Il a débuté sa carrière avec une expérience de 10 ans en agence.


Vous vous souvenez du lancement de GPT-4, ce moment où tout le monde découvrait enfin le vrai potentiel de l’IA génératrice de texte ? Non seulement plus performante que GPT-3, mais fondamentalement plus puissante, plus fiable et plus accessible ? Nous venons de revivre cette révolution, mais cette fois-ci, avec l’image.

Gemini 2.5 Flash Image de Google, connu dans l’ombre sous le nom de code « nano-banana », ne se contente pas d’être une mise à jour mineure de la génération d’images par IA. C’est un tournant avec lequel l’édition d’images par IA cesse d’être une simple « démo technologique fascinante » pour devenir : « p..…, ça marche vraiment » (à tel point que même votre grand-mère va s’y mettre).

Pourquoi cette fois, cela fait toute la différence

J’expérimente les outils d’images IA depuis les premiers exploits de DALL·E, qui nous émerveillait avec ses chiens surréalistes en combinaison spatiale.

Mais ce que Google vient de dévoiler change tout. Quatre caractéristiques expliquent ce saut :

1. Une simplicité déroutante. Finie la course au prompt parfait comme un sortilège. Il suffit de dire « change la chemise bleue en rouge » et c’est fait. Direct, sans bavure.

2. Une fidélité au prompt impressionnante. Gemini suit les instructions à la lettre au lieu de s’égarer dans des hallucinations d’images (même si les mains avec six doigts sont encore parfois au rendez-vous).

3. Une rapidité qui invite à l’expérimentation continue. Comptez environ 5 secondes par génération, de quoi tester, modifier et affiner votre image en temps réel, au lieu d’attendre dans l’incertitude.

4. Un coût quasi négligeable. À 0,039 $ par image, mille retouches professionnelles vous reviendraient à moins de 40 $. Bien loin du prix d’un photographe ou d’un graphiste.

L’une des démos les plus impressionnantes à ce jour : générer un élément isométrique à partir d’une photo prise de nuit (source)

Le poids des mots, le choc des photos

L’IA textuelle, on s’y est habitué avec ses subtilités : une sorte de « uncanny valley » où l’on décèle un style trop lisse, générique, parfois artificiel. C’est utile, mais rarement convaincant à l’œil humain. (NB : j’aime quand les LLM jouent la carte du méta-texte)

Avec les images, ce luxe n’existe pas.

Un regard posé sur une photo produit un jugement immédiat : est-ce vrai ou faux ? Et avec Gemini 2.5 Flash Image, ce jugement devient de plus en plus incertain.

À la différence du texte, traité linéairement et analytiquement, l’image touche directement, viscéralement, instantanément.

Il n’y a pas de progression dans la prise de conscience : soit cela semble réel, soit cela semble faux. Et de plus en plus souvent, cela semble réel.

La manipulation d’images devient un enjeu concret

C’est là que cela se complique. Générer une image complètement inventée, comme un chat en lunettes de soleil dans sa fusée, ne trompera personne (ou presque).

Modifier des photos existantes, en revanche, brouille la frontière entre « amélioration » et « fabrication ».

J’ai passé un après-midi à retoucher des photos réelles avec Gemini 2.5 Flash Image : changer des vêtements, ajuster des expressions, déplacer des personnes sur différents fonds. Le résultat ? Si parfait que j’ai moi-même fini par perdre la notion des versions authentiques. (NB: la cohérence des visages reste le talon d’Achille quand on change radicalement les habits)

Les watermarks, une solution à double tranchant

Google propose une réponse technique : le watermark [filigrane en V.F., ndlr] invisible SynthID dans chaque image générée. Un exploit, ce watermark résiste à la compression, au recadrage, et à de petites modifications.

Mais, cela ne fonctionne que si tout le monde utilise Google.

Que se passe-t-il lorsque les clones open-source fleuriront ? Quand une version dépourvue de watermark verra le jour ? Ou que des acteurs malintentionnés chercheront spécifiquement des alternatives sans marquage ?

Le watermark semble plus un compromis politique face à une course technologique effrénée. Utile, oui, mais loin d’être suffisant face à ce qui s’annonce.

La responsabilité sociale face à la manipulation d’images IA

La vraie question n’est pas technique, elle est sociétale. Qui doit détecter et signaler les contenus générés ou modifiés par IA ?

Les plateformes comme X, Instagram ou Facebook, devraient-elles identifier ces images ? Les interdire ? Exiger légalement que les créateurs divulguent la nature IA de leurs contenus ?

La technologie évolue plus vite que notre capacité à nous adapter socialement. Pendant que la discussion sur la transparence est en cours, des millions de faux parfaits circulent, devançant les vérificateurs de faits.

Et en France, on connaît bien la lenteur des réactions, à l’image du décret n° 2017-738 [du 4 mai 2017 relatif aux photographies à usage commercial de mannequins dont l’apparence corporelle a été modifiée, ndlr] auquel sont confrontés les publicitaires.

Le transfert de texture est également une fonctionnalité intéressante de nano-banana. (source)

Bienvenue dans l’ère post-photographique

Que nous le voulions ou non, nous voilà entrés dans l’ère post-photographique.

La question n’est plus de savoir si l’IA peut créer des images fausses à couper le souffle — elle le peut déjà. Elle est plutôt : comment adaptons-nous notre littératie médiatique, nos cadres juridiques et nos normes sociales dans un monde où voir ne signifie plus croire, malgré Saint-Thomas d’Aquin.

Le « moment nano-banana de Google » est saisissant, non seulement par sa puissance, mais parce qu’il nous force à affronter une nouvelle réalité. Nous avons franchi une étape où la technologie dépasse notre aptitude à gérer ses conséquences.

Le génie est sorti de sa lampe. Reste à savoir si nous saurons bâtir les infrastructures sociales et techniques pour vivre d’une manière responsable avec ces images « faussement vraies », ou si nous allons laisser le chaos régner en attendant une solution.

Quel impact dans la communication et pour les marques?

Cette arrivée change profondément les règles du jeu pour les agences et les marques.

La barrière à l’entrée dans la création de contenus visuels devient quasi inexistante, offrant à quiconque la possibilité de produire rapidement des images attrayantes sans compétences techniques poussées. Ce service s’avère particulièrement parfait pour alimenter les réseaux sociaux et produire des assets optimisés pour le mobile et le web.

Bien qu’il soit avant tout une aubaine pour les petits budgets, il ne faut pas sous-estimer son potentiel sur des supports plus stratégiques comme les sites internet, les communications corporate ou l’e-commerce.

Après une période probable de pression sur les prix du marché de la création visuelle, l’impact majeur résidera dans la multiplication massive des assets et dans la diversité sans précédent des formats disponibles.

Ce foisonnement d’images personnalisées pourra ainsi stimuler les campagnes marketing, mais nécessitera aussi de maîtriser leur organisation et cohérence pour ne pas diluer la force de la marque. Plus que jamais, il faudra des experts in the loop, car si la création devient très facile, les erreurs non désirées aussi.

News Scan Book

1

2

3

4

5

Précédent Suivant