Un son en un prompt.
Ce 19 février, Google déploie Lyria 3, son nouveau modèle de génération musicale intégré à Gemini. Disponible directement dans l’application Gemini, ce générateur de musique par IA permet de créer des morceaux de 30 secondes à partir d’un simple prompt, d’une image ou d’une vidéo.
Après le texte, l’image et la vidéo, Google enrichit les outils disponibles dans son chatbot. Avec Lyria 3, l’utilisateur peut décrire un genre de musique, préciser une époque, un tempo, des instruments, un style vocal ou un thème de paroles. Le modèle se charge du reste, y compris de la rédaction des paroles grâce aux capacités textuelles de Gemini.
L’objectif affiché n’est pas (encore) de produire des titres calibrés pour les plateformes de streaming, mais plutôt de générer une ambiance, une sonnerie ou une bande-son adaptée à des contenus courts.
Pensé comme un « collaborateur musical », Lyria 3 a été développé avec l’apport de producteurs et musiciens afin d’affiner la compréhension des notions de rythme, d’arrangement et de cohérence sonore.
Google met en avant la possibilité de « créez des morceaux cohérents » et d’explorer « les langues et genres du monde entier », avec des voix générées dans plusieurs langues, dont le français, l’anglais, l’allemand, l’espagnol ou le japonais.
L’une des fonctionnalités différenciantes repose sur la composition à partir d’images. L’utilisateur peut importer une photo ou une vidéo, que Gemini analyse pour en extraire une ambiance et la transformer en un morceau cohérent. L’intégration avec Nano Banana permet même de générer automatiquement une pochette d’album.
Avec cette option supplémentaire, Google confirme sa stratégie : faire de Gemini une plateforme créative tout-en-un, capable de passer d’une idée à un contenu prêt à être partagé.











