Une innovation récente dans le domaine de la modélisation générative ouvre des perspectives inédites et étonnantes. En effet, le modèle « Blackout Diffusion » redéfinit les règles de la création d’images par IA, avec des implications inégalées pour l’avenir de la recherche scientifique mais pas uniquement.
Le cadre d’intelligence artificielle Blackout Diffusion se distingue par sa capacité à générer des images à partir d’une toile vierge. Contrairement aux autres modèles de diffusion générative, il n’est pas nécessaire d’initier un «germe aléatoire» pour démarrer le processus de création.
Présenté lors de la récente Conférence Internationale sur l’Apprentissage Automatique, Blackout Diffusion produit des échantillons comparables à ceux des modèles actuels comme DALL-E ou Midjourney, mais nécessite moins de ressources computationnelles que ces derniers.
Implications pour la révolution industrielle et scientifique
« La modélisation générative est en train de provoquer une nouvelle révolution industrielle avec sa capacité à assister de nombreuses tâches, telles que la génération de code logiciel, de documents juridiques et même d’œuvres d’art », a expliqué Javier Santos, chercheur en IA au Laboratoire National de Los Alamos et co-auteur de Blackout Diffusion.
« Cette approche pourrait être exploitée pour réaliser des découvertes scientifiques, et le travail de notre équipe a jeté les bases et les algorithmes pratiques pour appliquer la modélisation par diffusion générative à des problèmes scientifiques qui ne sont pas continus par nature. »
Un fonctionnement distinct dans des espaces discrets
Les modèles de diffusion génèrent des échantillons similaires aux données sur lesquelles ils sont entraînés. Ils fonctionnent en ajoutant du bruit à une image jusqu’à ce qu’elle devienne méconnaissable, puis tentent de retrouver son état original. Les modèles actuels nécessitent un bruit d’entrée, c’est-à-dire une forme de données pour commencer la production d’images.
« Nous avons démontré que la qualité des échantillons générés par Blackout Diffusion est comparable à celle des modèles actuels tout en utilisant un espace computationnel plus restreint », a indiqué Yen Ting Lin, physicien à Los Alamos qui a dirigé la collaboration Blackout Diffusion.
Applications potentielles et principes de conception
L’équipe a testé Blackout Diffusion sur plusieurs ensembles de données standardisés, y compris la base de données modifiée de l’Institut national des normes et de la technologie, l’ensemble de données CIFAR-10, qui contient des images d’objets dans 10 classes différentes, et le CelebFaces Attributes Dataset, qui comprend plus de 200 000 images de visages humains.
Par ailleurs, l’équipe a utilisé la nature discrète de Blackout Diffusion pour clarifier plusieurs idées fausses largement répandues sur le fonctionnement interne des modèles de diffusion, fournissant une compréhension critique des modèles de diffusion générative.
Ils fournissent également des principes de conception pour de futures applications scientifiques. « Cela démontre la première étude fondamentale sur la modélisation par diffusion en états discrets et ouvre la voie à de futures applications scientifiques avec des données discrètes », a ajouté Yen Lin.
En synthèse
La modélisation par diffusion générative, telle que développée par l’équipe de Blackout Diffusion, pourrait potentiellement accélérer considérablement le temps passé à exécuter de nombreuses simulations scientifiques sur des superordinateurs, ce qui soutiendrait le progrès scientifique tout en réduisant l’empreinte carbone de la science computationnelle.
Les exemples divers mentionnés incluent la dynamique des réservoirs souterrains, les modèles chimiques pour la découverte de médicaments et l’expression génique de molécules et de cellules uniques pour comprendre les mécanismes biochimiques dans les organismes vivants.
Pour une meilleure compréhension
Qu’est-ce que Blackout Diffusion?
Blackout Diffusion est un modèle d’intelligence artificielle qui génère des images sans nécessiter de données initiales sous forme de bruit aléatoire.
Comment se compare-t-il aux modèles existants?
Il produit des échantillons de qualité comparable à des modèles comme DALL-E ou Midjourney, mais avec moins de ressources computationnelles.
Quelles sont les implications de cette innovation?
Elle a le potentiel de transformer de nombreux domaines, notamment la recherche scientifique, en accélérant les simulations et en réduisant l’impact environnemental.
Dans quels espaces fonctionne Blackout Diffusion?
Contrairement aux modèles existants qui opèrent dans des espaces continus, Blackout Diffusion fonctionne dans des espaces discrets.
Quelles sont les applications futures envisagées?
Les applications futures pourraient inclure la dynamique des réservoirs souterrains, la découverte de médicaments et l’étude des mécanismes biochimiques.
Références
Santos, J., & Lin, Y. T. (2021). Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces. Proceedings of Machine Learning Research.