Tentative d'illustration «composite»

L'enjeu ici c'est de produire une image en essayant de contrôler un maximum la composition et le sens de l'image. Le pitch de départ est de créer à partir de zéro une image cinématographique où deux personnages sont aux prises avec un monstre des marais. Pour ce faire on va construire une image de référence fabriquée avec des morceaux hétéroclites comme un collage assez grossier.

Il nous faut d'abord un décor :

Prompt : cinematic film still A dark swamp landscape . shallow depth of field, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy


Puis une créature hostile :

Prompt : a entirely frightening monster with a wide-open mouth full of long, standing in profile, thin teeth and blind eyes


On va ensuite chercher sur le web des images avec des postures utilisables :


Sur cette base on va faire un montage tout pourri dans Photoshop en noir et blanc. Pas besoin de pinailler, ce qui nous intéresse c'est d'avoir une composition d'où l'on va tirer un fichier de profondeur Z index.


On passe à la génération de notre image finale. Par tâtonnements on modifie et on ajuste prompt et réglages.

Prompt :
cinematic film still of a entirely frightening monster with a wide-open mouth full of long attack a man on the ground and a woman with a gun in dark swamp. low angle light, summer evening light.
shallow depth of field, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy


Comme attendu le premier rendu n'est pas terrible, mais il nous donne une image plus homogène comme base pour ControlNet et le fichier Z index.
On pondère la force de ControlNet par rapport au prompt et on arrête son influence avant la fin de la génération d'images pour laisser plus de liberté et avoir des propositions différentes. On affine aussi le prompt.

cinematic film still of a entirely frightening (swamp ugly monster:1.1) with a wide-open mouth full of long attack a soldat on the ground and a woman soldat shooting with a gun in dark swamp. low angle light, summer evening light. twilight, fog. dark theme.
shallow depth of field, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy

Quelques exemples en variant les réglages.



Finalement on choisit une image qui nous semble correspondre le mieux, et on essaye de corriger les détails avec la fonction InPaint de SD mais aussi avec l'IA de Photoshop meilleure sur les mains par exemple.

Et voilà ! C'est un exercice que l'on pourrait pousser encore mais nous voici déjà avec un bon nanar où dans une base Américaine secrète une expérience pour produire un super soldat à base de gènes d'alligator dérape.

L'idée ici était d'essayer de rester maitre de l'idée générale, de la composition mais aussi de laisser une place maitrisée au hasard. C'est assez simple quand on n'a qu'une image à produire mais cela devient tout de suite plus complexe si on veux par exemple faire un storyboard d'une séquence complète.

Bonus

En bonus quelques affiches de cet hypothétique film que nous allons appeler "Alligator man". Une façon de voir que SDXL n'est pas le pingouin qui glisse le plus loin sur la banquise en matière de respect typographique. On veut l'alligator mutant sur l'image ainsi que l'héroïne soldat du film histoire de voir que les biais sexistes des affiches de film sont bien respectés à travers les époques ;)

Dans un style vintage de film des années 40-70

Et des années 80 a aujourd'hui