Les IA génératives sont aujourd'hui au centre d'une révolution en devenir et les avis et opinions très polarisés entre confiance aveugle ou peur de fin du monde à la Terminator nous laissent un peu démunis face à l'inconnu.
Je me prénomme Denis, je suis né en 1970 et je suis développeur et graphiste chez Girelle Production et le Nouveau Bazar depuis de nombreuses années. Ce blog a pour fonction de consigner mes expériences autour des IA génératives d'images. Mon but est principalement d'étudier les solutions open source ou tout du moins gratuites et utilisables localement c'est-à-dire pouvant fonctionner sur un ordinateur personnel sans recourir à des services en ligne comme MidJourney ou Dall-E par exemple.
Stable diffusion dont il va être beaucoup question ici n'est pas considéré par certains comme un logiciel libre et est considéré par d'autres comme open source . Il est sous licence CreativeML Open RAIL-M et je me garderais bien de dire si il est complètement open source ou pas car c'est un débat de juriste, ce que je ne suis pas. Il a été créé et est maintenu par la société Stability AI, et il a donc le mérite d'être gratuit. Dans le cadre de ce blog, je ne l'utilise que de façon expérimentale.
Je le confesse, en tant que développeur et graphiste j'ai plus d'une fois ressenti l'effet "Whaou !" devant les résultats proposés par les IA génératives. L'envie de comprendre le fonctionnement et d'en maitriser les usages vient en partie de là.
Néanmoins comprendre une technologie n'est pas synonyme de l'admirer béatement. J'ai un certain nombre de critiques à adresser aux IA et si dans les articles à venir je vais plutôt parler méthode et technique, je vais profiter de cette introduction pour esquisser quelques pistes de réflexion sur le sujet.
le premier problème éminemment politique des IA ainsi que des technologies émergentes, est la question de l'intérêt général.
Ce n'est jamais une très bonne idée de décorréler l'émergence d'une technologie du contexte global. L'apparition des IA dans une société capitaliste et libérale n'a pas le même sens que dans une société collectiviste, cela va de soi. La vitesse et la direction des évolutions technologiques dans notre monde actuel sont grandement conditionnées par un environnement ultra concurrentiel et la volonté d'hégémonie de groupes ou d'intérêts privés. Cela pose pour moi le premier problème éminemment politique des IA ainsi que des technologies émergentes en général, à savoir l'intérêt collectif versus les intérêt privées.
Quand par exemple le CEO de Stability AI prophétise la disparition d'ici 5 ans des développeurs informatiques remplacés par des IA, cela questionne évidemment ma pratique professionnelle, mais ce sont surtout les intentions qui sont derrière cette phrase qui m'intéressent. On peut prêter au CEO une grande expertise dans le domaine ainsi que des informations dont nous ne disposons pas pour pouvoir affirmer sans études ni sources cette prophétie, mais je pense que la réalité est plus prosaïque. J'ai le sentiment d'avoir à faire à une prophétie souhaitée comme autoréalisatrice. En se posant comme le propriétaire de la future main d'œuvre en informatique, il invite implicitement à investir sur lui et à gonfler son capital plutôt que par exemple, investir dans l'école et la formation. Je caricature un peu mais il se joue aujourd'hui un combat idéologique de cette nature. l'IA n'est pas pensée comme un outil émancipateur au service de l'intérêt général et quand elle est parfois présentée comme telle, c'est plutôt de mon point de vue un cheval de Troie. On nous vante alors les performances hors norme de l'IA sur la détection des mélanomes, tumeurs au cerveau et autres maladies, passant d'ailleurs sous le tapis une réflexion légitime sur le sur-diagnostique, pour légitimer son adoption dans tous les domaines. Ce n'est pas sans rappeler l'argument des opérations chirurgicales améliorées par la 5G alors que je me doute (sans preuve ceci dit, ce n'est qu'une opinion) que le gros du bénéfice sera plutôt absorbé par des intérêts privés.
L'information, un autre point sensible qui peux souffrir d'une utilisation non réglementée des IA.
Un autre problème souvent évoqué quand on parle des IA génératives, c'est l'impact grandissant sur l'information. La production de fake news se trouve simplifiée, la création de faux comptes crédibles, dans le but d'inonder de fausses informations les réseaux sociaux, devient plus simple et efficace. D'une manière générale les arnaques en tout genre comme par exemple le phishing, trouvent dans les IA des alliées de poids. On assiste alors à une défiance renforcée vis-à-vis de l'information et la frontière entre vérité et opinions se brouille de plus en plus.
Ici aussi on ne peut pas décorréler ces problèmes du monde dans lequel on vit. L'information étant aujourd'hui considérée comme une marchandise, il est naturel de voir les lois du marché infléchir les stratégies des media. Dans un contexte où la rentabilité se dispute au temps long de la vérité, l'IA a toutes les chances de prospérer et l'avenir dans le domaine est loin d'être reluisant.
Un poids non négligeable dans l'utilisation des ressources et l'émission de gaz à effet de serre.
En termes de consommation énergétique le problème se pose aussi de façon aiguë au regard des enjeux planétaires. L'entrainement et l'utilisation des IA demandent des ressources énormes et on peut s'interroger légitimement sur la balance bénéfice / nuisance d'un tel investissement. Dans le cas qui m'intéresse, à savoir Stable Diffusion, sans être totalement sûr de sa véracité, j'ai trouvé l'information suivante sur la configuration d'entrainement: elle aurait été entrainée sur une configuration à 256 puces Nvidia A100 ce qui est somme toute pas mal, même si dans le domaine des crypto-monnaies (qui, je le rappelle, servent essentiellement à enrichir une poignée de débiles) ça doit faire doucement rigoler. En termes d'utilisation je fait tourner ça sur une machine équipée d'une RTX 2080 S ou sur mon portable avec une RTX 3060. La consommation énergétique est alors équivalente à une utilisation vidéo ludique sur ces mêmes machines. Les consommations peuvent être très disparates et dépendent du type de services et des infrastructures utilisées. Voici une étude que j'ai trouvée sur le sujet commanditée en partie par la société Hugging Face qui est un acteur incontournable du domaine, ce qui oblige à prendre cette étude avec des pincettes, mais c'est malgré tout pas très jojo. L'ensemble du numérique représente aujourd'hui entre 3 et 4 % des émissions de gaz à effet de serre au niveau mondial et 2,5% à l'échelle nationale (voir ici ou là par exemple). On pourrait se dire que cela n'est pas énorme en rapport à d'autres activités humaines mais les projections de croissance du domaine laissent penser qu'il est indispensable de s'en préoccuper sérieusement et ce dès maintenant.
En résumé, j'ai, pour ma part, l'impression que les IA peuvent être un accélérateur de tous les travers d'un système économique et politique défaillant. La question est de savoir si on aura réussi à rendre la planète inhabitable avant qu'elles aient un impact sur nos vies ou si elles vont concourir à accélérer le mouvement de destruction générale.
Sur ce, bonne lecture !
Sources citées :