Ceci est une révolution : OpenAI dévoile son IA générative vidéo, Sora 

Par Iris M. le 16/02/2024

Temps de lecture : 3 min

Un prompt-to-video impressionnant.

Ah, l’IA… Quand les leaders des intelligences artificielles vont-ils faire une pause dans ce cycle d’innovations de tous les instants? Une chose est sûre, ce ne sera pas aujourd’hui : OpenAI, la société mère de ChatGPT, l’IA la plus populaire depuis sa création il y a un peu plus d’un an, s’est mis en tête de casser (à nouveau) Internet en faisant l’annonce de sa dernière pépite : Sora

Alors certes, ce n’est pas la première société d’IA à créer un modèle permettant de passer du texte à la vidéo, de l’image à la vidéo ou de la vidéo à la vidéo (permettant de changer le fond d’une vidéo, de la faire évoluer ou encore de l’allonger). Runway, Pika ou encore HeyGen proposent déjà des services similaires… mais ont également des faiblesses auxquelles Sora affirme répondre. Les images qui circulent déjà de la version 1 de Sora, qui sera disponible au grand public une fois les derniers tests terminés, sont déjà époustouflantes. Sauf si vous faites partie des quelques chanceux, généralement des artistes, designers ou cinéastes, qui ont actuellement ou auront prochainement accès à cette technologie. 

À condition de prompter correctement l’IA, rien ne semble pouvoir l’empêcher de vous donner satisfaction – même si on se doute bien que seuls les meilleurs résultats nous sont montrés, garantis sans retouches de la part d’OpenAI. Hormis quelques bugs liés à la compréhension de l’espace, ce qui ne surprendra pas les habitués des IA génératives.

Pour l’instant, son plus grand compétiteur semble être Google Lumière, annoncé il y a de cela quelques semaines et dont on attend encore l’ouverture de l’accès au grand public. Les deux semblent fonctionner grâce à un procédé similaire, qui générerait les images qui composent la vidéo entière d’un seul coup, afin d’éviter toutes erreurs lorsqu’un objet sort du cadre pour y revenir ensuite. 

Dans son état actuel, Sora permet de créer des vidéos jusqu’à une minute en HD, qui suivront votre prompt de bout en bout. Il vous sera possible de générer des scènes complexes, aux multiples détails, autant au niveau des personnages que du décor, une prouesse apparemment rendue possible car la vidéo serait générée “d’un bloc” et non image par image, ce qui donnait jusqu’alors un certain scintillement au sein des vidéos, chaque image tentant de ressembler à la précédente.

La société annonce aussi que le modèle n’est pas encore parfait et ne comprend pas toujours les relations de cause et conséquences qu’ont certains objets sur d’autre. Il pourrait également avoir du mal à suivre un mouvement de caméra spécifique, ou pourrait inverser la droite et la gauche. Un exemple ici : 

Quant à la sécurité d’une telle évolution, une équipe est en effet en train de réaliser toutes sortes de tests sur le modèle. Comme à l’accoutumée, OpenAI devrait se montrer très prudent, laissant la possibilité à ses alternatives, notamment Open Source, d’être plus permissif vis-à-vis des fakes et contenus olé olé.

Une évolution de la vidéo par IA stupéfiante : 

Malgré une innovation qui se montre fort spectaculaire, voire révolutionnaire, seul le temps nous dira réellement ce à quoi nous avons affaire. Comme nous avons pu l’observer par le passé, il y a parfois un monde entre les vidéos de démonstration et le véritable service à sa sortie.

News Scan Book

1

2

3

4

5

Précédent Suivant