Vos données. Votre choix.

Si vous n’acceptez que les cookies essentiels, nous utilisons des cookies et des technologies similaires pour collecter des informations sur votre appareil et votre comportement d’utilisation sur notre site Internet. Nous en avons besoin pour vous permettre, par exemple, de vous connecter en toute sécurité et d’utiliser des fonctions de base telles que le panier d’achats.

Si vous acceptez tous les cookies, nous pouvons également utiliser ces informations afin de vous afficher des offres personnalisées, améliorer nos sites et vous présenter des annonces publicitaires ciblées sur nos sites et d’autres sites ainsi que sur nos applications. Cela nous permet également de transmettre certaines données à des tiers et à nos partenaires publicitaires.

OpenAI Sora
Nouveautés + tendances

OpenAI Sora : un nouveau modèle d'IA texte-vidéo donne des résultats incroyables

Martin Jud
16/2/2024
Traduction : traduction automatique

Il n'y a pas si longtemps, les vidéos d'IA faisaient penser à de mauvais trips de drogue. Aujourd'hui au moins, les choses changent, car OpenAI a présenté son modèle d'IA text-to-vidéo Sora. Les vidéos qu'il crée, qui peuvent durer jusqu'à 60 secondes, ont de quoi séduire.

L'éditeur de logiciels américain OpenAI a présenté un nouveau modèle d'IA. Sora convertit des prompts de texte en scènes vidéo complexes pouvant durer jusqu'à une minute. Celles-ci peuvent contenir différents personnages et donner des résultats réalistes ou fantaisistes, difficilement exprimables par des mots. Et ce, bien que les vidéos elles-mêmes soient basées sur des mots. La deuxième scène, que l'on peut voir dans la vidéo suivante, est basée sur le texte prompt suivant : "Une portée de chiots Golden Retriever joue dans la neige. Leurs têtes dépassent de la neige et en sont recouvertes."

Si vous voulez savoir quelle saisie de texte a conduit à chaque résultat, vous trouverez les différentes vidéos et prompts sur le site OpenAI.

Sora dispose non seulement d'une compréhension approfondie du langage pour interpréter l'input, mais aussi d'une connaissance de la façon dont les choses se comportent dans le monde physique. Malgré cela, les vidéos sont encore loin d'être parfaites. Si vous regardez attentivement, vous découvrirez l'une ou l'autre erreur.

L'OpenAI le sait également. La société indique que la physique présente des faiblesses dans les scènes complexes. Il peut y avoir des confusions dans les détails spatiaux, ainsi que dans les séquences temporelles telles que les mouvements de caméra. OpenAI indique également qu'il est possible que Sora ne comprenne pas certains cas de cause à effet : "Par exemple, une personne pourrait mordre dans un biscuit, mais il se peut que le biscuit ne porte aucune trace de morsure après coup."

Techniquement, Sora est un modèle de diffusion capable de créer des vidéos entières en une seule fois ou d'en prolonger une existante. De même, il est possible d'utiliser une image fixe comme modèle au lieu d'une entrée de texte. Pour l'instant, Sora n'est disponible que pour un groupe sélectionné de testeurs. On ne sait pas encore quand le modèle d'IA sera mis à la disposition du public, ni à quel prix.

Photo d’en-tête : OpenAI Sora

Cet article plaît à 51 personne(s)


User Avatar
User Avatar

Le baiser quotidien de la muse stimule ma créativité. Si elle m’oublie, j’essaie de retrouver ma créativité en rêvant pour faire en sorte que mes rêves dévorent ma vie afin que la vie ne dévore mes rêves.


Nouveautés + tendances

Du nouvel iPhone à la résurrection de la mode des années 80. La rédaction fait le tri.

Tout afficher

24 commentaires

Avatar
later