Update majeure Midjourney

Les dernières nouveautés de Midjourney V5 !

Alors que la V4 était tout juste sortie en Décembre 2022, Midjourney vient de sortir une nouvelle mise à jour majeure et de passer son algorithme de génération d’image sur une version 5. Cette nouvelle update devrait ainsi corriger quelques problèmes de la V4. En plus d’amener de nouvelles fonctionnalités, entre autre le « image to text » qui devrait permettre de générer une prompt textuelle sur la base d’une image uploadée.

Les annonces et nouveautés en bref

Quand est sortie Midjourney V5 ?

Midjourney V5 est sortie le 15 Mars 2023, et est à présent disponible pour tous ! Pour passer sur cette nouvelle version de l’algorithme, il vous suffit simplement d’utiliser la commande /settings dans Discord, et de sélectionner l’option « MJ Version 5 »

Parmi ce qui a été annoncé

Beaucoup de points ont été annoncés, et même si un bon nombre de ces annonces se contentent d’évoquer une amélioration globale de la compréhension linguistique de l’algorithme et de la génération d’image en elle-même, certaines nouveautés et fonctionnalités sortent du lot

Meilleure compréhension du langage et des prompts fournies
Un algorithme plus flexible et moins « ciblé » dans sa manière de générer des images
Davantage de contrôle sur l’aspect esthétique
Amélioration de la génération d’image sur la base d’un fichier importé
Amélioration de la génération des yeux, des visages et des mains
Plus de détails et une meilleure précision dans la génération d’image
Implémentation d’un système de vote – À venir
Fonctionnalité Image-vers-texte – À venir
Une génération d’image plus rapide
Système de « Zoom out » pour augmenter la largeur et les détails d’une scène – À venir

Corrections et améliorations de Midjourney V5

Amélioration des mains générées par Midjourney

Vous avez sans doute déjà rencontré ce problème, mais Midjourney V4 a beaucoup de mal à représenter des mains, sans y ajouter des doigts en trop, en fusionner d’autres ou même déformer considérablement les mains des modèles humains générées. Ce problème est à présent considérablement réduit avec Midjourney V5, en optimisation la pose des mains, qu’elles soient le sujet principal de l’image ou non.

Amélioration des yeux et des images générées

Midjouney V4 était à la fois très bon lorsqu’il s’agissait de générer des portraits de visage, et étonnement catastrophique lorsque le visage d’un modèle représentait moins de 5% ou 10% de l’image finale. Celui-ci générait dans la majorité des cas, des personnes au visages déformés et à peine reconnaissable, un gros point négatif pour ceux n’ayant pas l’habitude ou les compétences pour corriger manuellement les images générées. Midjourney V5 corrige maintenant fortement ce problème, en améliorant la génération de visage, même lorsque ceux-ci ne recouvrent pas la majorité de l’image générée.

Faciliter la mise en page d’éléments complexes en fond d’image

Midjourney V5 améliore également le rendu visuel d’images photoréalistes, et optimise la génération d’éléments plus petits et détails en fond. On peut penser à une pièce avec beaucoup de produits sur ses étagères ou à une rue de métropole en pleine heure de pointe. L’idée étant d’éviter au maximum que les éléments secondaires ne se trouvent déformés dès qu’il ne représente plus une part imposante de l’image générée

Animaux, Interface Design et Architecture

D’après plusieurs sources, ses domaines de création devraient aussi être améliorés dans Midjourney V5. Il est vrai que ceux-ci représentaient une part non négligeable des images générées, en plus de faire partie des catégories susceptibles d’être davantage utilisées dans un cadre professionnel et donc de pousser plus d’internautes à opter pour un abonnement mensuel payant (notamment l’architecture et la création d’interface web).

Besoin d’un Prompt designer expérimenté ? Contactez-nous !

06 10 25 42 32

Les annonces de fonctionnalités pour Midjourney V5

La présence d’un outil image to text – À venir

Midjourney V5 pourrait proposer un système de reconnaissance d’image permettant d’uploader une image, et d’en obtenir ensuite une description texte de la part de Midjourney. Description qui pourrait s’apparenter à un prompt, et que l’on pourrait ensuite réutiliser pour créer des images similaires à celle uploadé dans un premier temps. Une fonctionnalité qui permettrait d’accéder beaucoup plus rapidement à un résultat visuel précis, en se basant simplement sur des contenus image déjà existants.

Intégration d’un outil pour « dézoomer » une image générée – À venir

Midjourney V5 devrait aussi vous permettre de dézoomer une image précédemment créée, dans l’optique d’ajouter du détails autours de la scène déjà générée, et de sorte à permettre un meilleur contrôle du zoom et du cadre de l’image téléchargeable. Ce qui pourrait permettre de corriger les nombreuses situations où une image semble intéressante visuellement, mais où le cadre général semble trop restreint pour être utilisé correctement dans un autre contexte (site internet, réseaux sociaux, document imprimé…)

Évolutions futures de Midjourney

Bien qu’aucun communiqué officiel n’a été délivré sur ces sujets, plusieurs retours ont été évoqués concernant les futures évolutions de Midjourney et les axes qui seront pris pour améliorer davantage cet outil de génération d’image.

Voter pour des images et obtenir des crédits gratuits

Il semble que Midjourney veuille offrir la possibilité de gagner des crédits de génération gratuit pour ceux n’ayant pas les moyens d’opter pour un abonnement annuel. En proposant à ses utilisateurs un système de vote, afin d’améliorer les futures génération de Midjourney, et de bénéficier progressivement d’une large base de données sur ce qui semble plaire ou non en matière de génération.

Il semble que Midjourney souhaite intégrer assez rapidement cette fonctionnalité à son site, et des rumeurs évoquant Mars 2023 ont déjà été entendues. Il est donc possible que cet ajout se fasse dans les semaines à venir.

Transparence et modèle 3D

La transparence est susceptible d’être ajoutée dans le futur, ce qui ne devrait pas poser problème et pourrait permettre la génération d’image déjà détourée. Plutôt que de devoir initialement demander un fond blanc qui devra ensuite retirer via un logiciel de retouche photo ou via un second algorithme d’IA.

Pour la 3D, difficile de savoir s’il s’agit de simple rendu « 3D » sur une image figée (ce qui est déjà plus ou moins accessible) ou si Midjourney compte proposer une feature permettant l’export de modèles 3D, utilisables sur les logiciels dédiés à ce type de fichier. A voir comment cette information évolue dans le temps.

Upscale à 2048×2048 par défaut

Midjourney génère pour le moment des images en 1024 par 1024 pixels par défaut et au format carré, mais il semble que l’équipe en charge de l’algorithme souhaite augmenter la taille des images upscaler suite à la génération des 4 premières propositions.

Le souci actuel des upscales secondaires « light » et « beta », est que Midjourney ne prend pas en compte le prompt texte initial dans ce processus. Et se contente d’ajouter des détails sur l’ensemble de l’image sans vraiment se demander si les éléments ajoutés font sens dans la mise en scène. Ce qui amène très régulièrement Midjourney à ajouter des détails sans fondement et détruisant même parfois des zones qui était parfaitement générées en 1024×1024.

En espérant que l’amélioration de la résolution par défaut puisse résoudre ce problème, quitte à continuer de proposer d’autres upscales encore plus importantes si nécessaire.

Protection contre les deep fakes

Attention, il semble que Midjourney souhaite progressivement se protéger qu’on l’utilisation abusive de visage (de célébrité ?) en mettant en place des avertissement ou des bannissements dans le cas ou des deepface problématiques seraient créés par l’intermédiaire de Midjourney. Sans doute pour éviter la propagation de fake news (Politiciens, acteurs, athlètes…), en pourrait entre autres penser à deux célébrités s’embrassant, ou deux politiciens se serrant la main…

Suppression d’un nom d’artiste sur demande

Attention, ceci est une supposition de l’auteur, mais plusieurs noms d’artistes célèbres (je n’ai malheureusement plus les références) semblent d’hors et déjà bannis, comme pouvaient l’être certains termes à caractères « sensibles ».

Pour se protéger juridiquement, il y a ainsi de fortes chances que Midjourney propose progressivement aux artistes qui le souhaitent de retirer leur nom des mots clés autorisés, de sorte à protéger le cadre général de leur œuvre. Même si officiellement, il n’est pas encore possible de protéger par un droit d’auteur un style graphique. Ce type de mot « interdit » est aussi susceptible d’être étendu à d’autres termes, et entre autres les nom de marques et de studio (Disney, Pixar…)

Comment utiliser Midjourney V5 ?

Midjourney V5 à été déployé comme l’a été la version 4, vous n’aurez donc rien à faire pour accéder aux nouvelles fonctionnalités proposées, il vous suffira simpelment de modifier le paramétrage initial de votre compte Discord via la commande /settings. Par défaut, tous les comptes existants devraient continuer d’utiliser la V4 dans un premier temps.

Vous pourrez forcer Midjourney à passer en V5 en utilisant la commande : /settings
Puis en sélectionnant la version V5 de Midjourney