Des entreprises comme Stitch Fix expérimentent déjà DALL-E 2 – TechCrunch

Des entreprises comme Stitch Fix expérimentent déjà DALL-E 2 – TechCrunch

Cela fait quelques semaines seulement qu’OpenAI a commencé à permettre aux clients d’utiliser commercialement des images créées par DALL-E 2, son système de synthèse d’image par IA remarquablement puissant. Mais malgré les limitations techniques actuelles et le manque de licences en volume, sans parler de l’API, certains premiers utilisateurs disent qu’ils testent déjà le système pour divers cas d’utilisation commerciale, attendant le jour où DALL-E 2 deviendra suffisamment stable pour déployer en production. .

Stitch Fix, le service en ligne qui utilise des algorithmes de recommandation pour personnaliser les vêtements, affirme avoir expérimenté DALL-E 2 pour visualiser ses produits en fonction de caractéristiques spécifiques telles que la couleur, le tissu et le style. Par exemple, si un client de Stitch Fix commandait un “jean skinny stretch rouge taille haute” pendant le projet pilote, DALL-E 2 était utilisé pour générer des images de cet article, qu’un styliste pouvait utiliser pour l’associer à un article similaire. produit dans l’inventaire Stitch Fix.

“DALL-E 2 nous aide à montrer les caractéristiques les plus informatives d’un produit de manière visuelle et aide finalement les stylistes à trouver l’article parfait qui correspond à ce qu’un client a demandé dans ses commentaires écrits”, a déclaré un porte-parole à TechCrunch par e-mail.

Une génération DALL-E 2 du pilote de Stitch Fix. Le message était : “doux, vert olive, belle couleur, poches, imprimé, texture mignonne, long cardigan.” Crédits image : IA ouverte

Bien sûr, le DALL-E 2 a des bizarreries, dont certaines font réfléchir les premiers utilisateurs en entreprise. Eric Silberstein, vice-président de la science des données chez la startup de commerce électronique Klaviyo, décrit dans un article de blog ses impressions mitigées sur le système en tant qu’outil de marketing possible.

Il souligne que les expressions faciales des modèles humains générés par DALL-E 2 ont tendance à être inappropriées et que les muscles et les articulations sont disproportionnés, et que le système ne comprend pas toujours parfaitement les instructions. Lorsque Silberstein a demandé à DALL-E 2 de créer l’image d’une bougie sur une table en bois sur un fond gris, DALL-E 2 effaçait parfois le dessus de la bougie et le fondait dans le bureau ou ajoutait une bordure incongrue autour de la bougie.

DALL-E 2Eric Silberstein

Expériences de Silberstein avec DALL-E 2 pour la visualisation de produits. Crédits image : IA ouverte

“Pour les photos avec des humains et les photos d’humains modélisant des produits, il ne pouvait pas être utilisé tel quel”, a écrit Silberstein. Pourtant, il a dit qu’il envisagerait d’utiliser le DALL-E 2 pour des tâches telles que donner des points de départ pour les modifications et proposer des idées aux graphistes. “Pour les photos d’archives sans humains et les illustrations sans directives de marque spécifiques, DALL·E 2, à mon œil non averti, pourrait raisonnablement remplacer l'”ancienne méthode” à ce stade”, a poursuivi Silberstein.

Les éditeurs de Cosmopolitan sont arrivés à une conclusion similaire lorsqu’ils se sont associés à l’artiste numérique Karen X. Cheng pour créer une couverture pour le magazine à l’aide de DALL-E 2. L’arrivée à la couverture finale a nécessité une direction très spécifique de Cheng, ce qui, selon les éditeurs, est illustratif de la limitation de DALL-E 2 en tant que générateur d’art.

Mais l’étrangeté de l’IA fonctionne parfois, comme une fonctionnalité, plutôt que comme un bug. Pour sa campagne Draw Ketchup, Heinz a demandé à DALL-E 2 de générer une série d’images de bouteilles de ketchup en utilisant des termes en langage naturel tels que “ketchup”, “ketchup art”, “ketchup flou”, “ketchup dans l’espace” et “ketchup” . la renaissance du ketchup.” La société a invité les fans à soumettre leurs propres invites, que Heinz a organisées et partagées sur ses réseaux sociaux.

Heinz DALL-E 2

Les bouteilles Heinz « imaginées » par DALL-E 2, une partie de la récente campagne publicitaire de Heinz. Crédits image : IA ouverte

« Avec l’imagerie de l’IA qui domine les actualités et les médias sociaux, nous avons vu une opportunité naturelle d’étendre notre campagne “Draw Ketchup” ; enraciné dans l’idée que Heinz est synonyme du mot ketchup, pour tester cette théorie dans l’espace de l’IA », a déclaré Jacqueline Chao, responsable principale de la marque Heinz, dans un communiqué de presse.

De toute évidence, les campagnes alimentées par DALL-E 2 peuvent fonctionner lorsque le sujet est l’IA. Mais plusieurs utilisateurs commerciaux de DALL-E 2 disent qu’ils ont réussi le système pour générer des actifs qui ne montrent pas les signes révélateurs des limites de l’IA.

Jacob Martin, un ingénieur logiciel, a utilisé DALL-E 2 pour créer un logo pour OctoSQL, un projet open source qu’il développe. Pour environ 30 $, soit à peu près le coût des services de conception de logo sur Fiverr, Martin s’est retrouvé avec une image de dessin animé d’une pieuvre qui ressemble à une illustration humaine à l’œil nu.

“Le résultat final n’est pas idéal, mais j’en suis très content”, a écrit Martin dans un article de blog. « En ce qui concerne DALL-E 2, je pense qu’en ce moment, il est encore dans une phase de “première itération” pour la plupart des éléments et des objectifs, la principale exception étant les croquis au crayon ; ceux-ci sont incroyablement bons… Je pense que la vraie percée viendra lorsque DALL-E 2 sera 10 à 100 fois moins cher et plus rapide.

DALL-E 2 OctoSQL

Le logo OctoSQL, généré après plusieurs tentatives avec DALL-E 2. Crédits image : IA ouverte

Un utilisateur de DALL-E 2, Don McKenzie, concepteur principal de la startup de développement Deephaven, a poussé l’idée un peu plus loin. Il a testé l’application du système pour générer des vignettes sur le blog de l’entreprise, motivé par l’idée que les publications avec images suscitent beaucoup plus d’engagement que celles qui n’en ont pas.

“En tant que petite équipe composée principalement d’ingénieurs, nous n’avons ni le temps ni le budget pour commander des illustrations personnalisées pour chacun de nos articles de blog”, a écrit McKenzie dans un article de blog. “Jusqu’à présent, notre approche consistait à passer 10 minutes à faire défiler des images tangentiellement liées mais finalement incompatibles à partir de sites de photos, à télécharger quelque chose qui n’est pas terrible, à le mettre en avant et à publier.”

Después de gastar un fin de semana y $45 en créditos, McKenzie dice que pudo reemplazar unas 100 publicaciones de blog con imágenes generadas por DALL-E 2. Fue necesario jugar con las indicaciones para obtener los mejores resultados, pero McKenzie dice que valió la pena l’effort.

“En moyenne, je dirais qu’il a fallu quelques minutes et quatre à cinq invites par article de blog pour obtenir quelque chose dont j’étais satisfait”, a-t-il écrit. “Nous dépensions plus d’argent et de temps sur les images de stock par mois, avec un résultat pire.”

Pour les entreprises qui n’ont pas le temps de réfléchir, il existe déjà une startup qui essaie de commercialiser les capacités de génération d’actifs de DALL-E 2. Unstock.ai, construit sur DALL-E 2, promet “des images et des illustrations de haute qualité à la demande”, gratuitement, pour le moment. Les clients entrent une annonce (par exemple “Vue de dessus de trois poissons rouges dans un bocal à poissons”), puis choisissent un style préféré (art vectoriel, photoréaliste, dessiné au crayon) pour créer des images, qui peuvent être recadrées et recolorées.

Unstock.ai automatise essentiellement l’ingénierie rapide, un concept de l’IA qui cherche à intégrer une description de tâche dans le texte. L’idée est de fournir des instructions détaillées à un système d’IA afin qu’il réponde de manière fiable à ce qui lui est demandé ; en général, les résultats d’une annonce du type “Photo d’une femme buvant un café, se rendant au travail à pied, téléobjectif” seront beaucoup plus cohérents que “Une femme marchant”.

Il est susceptible d’être un signe avant-coureur d’applications à venir. Lorsqu’il a été contacté pour commenter, OpenAI a refusé de partager des chiffres sur les utilisateurs commerciaux de DALL-E 2. Mais pour l’anecdote, la demande semble être là. Des solutions non officielles au manque d’API de DALL-E 2 ont fait surface sur le Web, assemblées par des développeurs désireux de transformer le système en applications, services, sites Web et même jeux vidéo.

#Des #entreprises #comme #Stitch #Fix #expérimentent #déjà #DALLE #TechCrunch

Leave a Comment

Your email address will not be published.