
Point de vue
Art(ificiel) : comment l’IA bouscule le marché de l’art
par Michelle Brändle
Il existe aujourd'hui plusieurs générateurs d'IA qui créent une image à partir d'un texte. Il faut toujours s'armer de patience lorsqu'on les utilise, car il faut souvent attendre plusieurs minutes avant d'obtenir un résultat. Stability AI change cela.
Stability AI est une société qui crée des générateurs de texte, d'image et de vidéo basés sur des modèles d'apprentissage profond. Ils appellent leur générateur texte-image Stable Diffusion. Celui-ci crache une image à partir d'un texte de description appelé prompt. La première version existe depuis plus d'un an, avec un successeur amélioré, le Stable Diffusion XL.
Mais, que ce soit dans la première version ou dans son successeur, il faut plusieurs minutes entre la saisie du texte et le résultat. Stability AI a maintenant lancé une nouvelle version de son générateur d'images sous forme de démo. Le Stable Diffusion XL Turbo (SDXL-Turbo) est basé sur le modèle Stable Diffusion XL et, contrairement à son grand frère, fournit des résultats en quelques secondes.
J'ai déjà abordé plus en détail le fonctionnement des générateurs dans des articles précédents. En tant qu'utilisateur, le principe est simple : vous saisissez un texte, appelé invite, et le programme crache une ou plusieurs images en fonction de cette description. C'est une excellente source d'inspiration pour les créatifs, par exemple.
Comme un tel programme doit recourir à une base de données assez importante pour obtenir un résultat, il nécessite une énorme puissance de calcul. Et cela prend beaucoup de temps. Si le résultat ne vous plaît pas, vous devez compléter, modifier ou même réécrire votre texte. Le processus recommence depuis le début. Cela peut être fatigant.
Avec le Turbo SDXL, Stability AI a créé un programme qui fournit des images à partir des messages-guides si rapidement qu'ils le qualifient eux-mêmes de résultat en temps réel. Les images obtenues ne sont pas aussi détaillées que celles de la version plus lente, mais elles sont toujours d'assez bonne qualité. Cependant, elles sont impressionnantes rien que par la vitesse à laquelle elles ont été créées.
Normalement, le processus d'un générateur d'images comprend 20 à 50 étapes. L'innovation du SDXL Turbo réside dans le fait que le programme ne nécessite que quatre étapes pour la sortie. Cette approche est appelée par Stability AI "Adversarial Diffusion Distillation". Elle est assez complexe, ce n'est pas pour rien que Stability AI a expliqué en détail la théorie qui la sous-tend.
Ce qui est intéressant, c'est que le résultat n'est pas seulement un gain de temps, mais que le processus nécessite également moins de puissance de calcul, selon Stability AI. Ainsi, même mon Macbook Air équipé d'une puce M1 dispose de suffisamment de puissance pour obtenir quelques résultats amusants. Vous trouverez la version de démonstration sur ce site web. Après une dizaine de phrases et de résultats, la version gratuite est toutefois épuisée. Les images peuvent être modifiées davantage grâce à un bouton d'édition. Par exemple, en appuyant sur un bouton, vous pouvez supprimer l'arrière-plan ou afficher trois autres résultats similaires. Ces modifications prennent un peu plus de temps.
Dans mon monde, Super Mario chasse les Stormtroopers avec une licorne et Harley Quinn prépare des cocktails pour Eddie et Peter au bar de la plage. Là où je peux exprimer ma créativité, j'ai des fourmis dans les doigts. Mais c'est peut-être aussi parce que rien d'autre ne coule dans mes veines que du chocolat, des paillettes et du café.