Techniques d’apprentissage automatique de la conception expérimentale avancée d’Imperial et de BASF | Nouvelles impériales






La société impériale et chimique BASF dévoilera de nouvelles méthodes d’optimisation de la conception expérimentale lors de la principale conférence sur l’apprentissage automatique NeurIPS.

Trois articles décrivant de nouvelles techniques d’apprentissage automatique qui répondent aux besoins critiques de l’industrie chimique ont été jugés suffisamment convaincants pour être acceptés à la conférence NeurIPS, l’un des lieux internationaux les plus compétitifs pour la recherche en apprentissage automatique.

Chez BASF, nous considérons la numérisation comme essentielle pour renforcer notre rôle de leader en R&D dans l’industrie chimique et répondre aux besoins pressants de l’industrie en matière de développement durable. Dr Christian Holtze BASF

Développées dans le cadre d’un partenariat à grande échelle entre l’Impériale et BASF, les techniques sont conçues pour aider les scientifiques de la recherche et du développement (R&D) en chimie et dans d’autres domaines à améliorer les processus industriels avec un minimum d’essais et d’erreurs en prédisant quelles pratiques donneront les résultats les plus bénéfiques . . Ils peuvent également aider à automatiser le processus de R&D.

Ces progrès devraient contribuer à accélérer le développement de nouveaux produits chimiques innovants et de méthodes de production plus efficaces et durables.

Le professeur Ruth Misener, responsable de la recherche sur l’optimisation basée sur les données chez Imperial Computing chez BASF/RAEng, a déclaré : « Notre recherche avec BASF contribue à la transformation numérique de l’industrie chimique en adaptant les méthodes de conception expérimentale avancées aux exigences spécifiques du secteur. Cela aidera à créer une chimie meilleure et plus durable. La recherche fait également d’importantes avancées théoriques dans l’apprentissage automatique. L’acceptation dans NeurIPS est une indication que notre travail est reconnu par la communauté d’apprentissage automatique au sens large.”

Le Dr Christian Holtze, développeur de partenariats universitaires et ingénieur de recherche en chef chez BASF, a déclaré : « Chez BASF, nous considérons la numérisation comme essentielle pour renforcer notre rôle de leader en R&D dans l’industrie chimique et répondre aux besoins pressants de l’industrie en matière de durabilité. Nous apprécions depuis longtemps l’expérience pionnière d’Imperial dans ce domaine. Un excellent exemple est notre travail avec le professeur Ruth Misener et ses collègues, qui partagent notre vision de développer des capacités numériques perturbatrices pour l’industrie chimique de demain.

Detlef Kratz et Ian Walmsley signent le contrat
Plus tôt cette année, le Dr Detlef Kratz (président du groupe de recherche chez BASF) et le professeur Ian Walmsley (recteur de l’Impériale) ont signé un nouvel accord-cadre marquant une nouvelle phase dans le partenariat stratégique. Photo : Fergus Burnet

Optimisation R&D

Les chimistes industriels expérimentent régulièrement pour développer des produits performants, tels que des revêtements et des batteries, afin de maximiser la pureté des produits chimiques et de minimiser les coûts matériels et énergétiques de leur production. Cela nécessite de tester de nombreuses combinaisons d’ingrédients et de paramètres du réacteur, tels que le débit et la température.

Parce que le processus expérimental lui-même est coûteux, les entreprises chimiques visent à concevoir ces expériences pour faire le meilleur travail possible d’optimisation du processus de production sur un nombre fini d’itérations expérimentales.

Bien que la recherche soit née de besoins pratiques en chimie, elle les a transformés en méthodes mathématiques avec des applications générales en apprentissage automatique.

Compte tenu de cela, cela n’a pas de sens de décider à l’avance quelles valeurs de paramètre tester à chaque itération de l’expérience. Au lieu de cela, les chimistes effectuent généralement plusieurs itérations initiales avec des valeurs différentes et utilisent les résultats pour faire une prédiction approximative des paramètres – par exemple, quelle température – fourniront les meilleures performances.

Des itérations supplémentaires sont ensuite conçues à la volée pour améliorer progressivement l’exactitude et la précision de la première prédiction.

Une version plus avancée de ce processus itératif repose sur des algorithmes d’optimisation plutôt que sur l’intuition humaine. Dans l’optimisation bayésienne, un algorithme combine des données expérimentales avec une hypothèse de fond statistique, connue sous le nom de processus gaussien, pour estimer une fonction mathématique qui relie les paramètres de production aux variables expérimentales. Partant d’une approximation élevée, cette estimation est présentée non pas comme une certitude, mais comme une distribution de probabilité sur une gamme de fonctions possibles.

Le but de l’algorithme est de trouver les paramètres qui donnent les meilleures performances de production, et la distribution de probabilité aide à le faire en permettant à l’algorithme de prédire quels paramètres expérimentaux sont les plus susceptibles de mieux fonctionner. Les scientifiques expérimentaux dans un certain nombre de domaines académiques et industriels utilisent de plus en plus des algorithmes d’apprentissage automatique qui utilisent cette méthode.

“Les algorithmes surpassent souvent l’intuition humaine car il est très difficile pour les humains de voir ce qui se passe lorsqu’il y a autant de variables”, explique le Dr Robert M Lee, expert en apprentissage automatique de BASF, qui a mené la recherche avec des collègues d’Imperial et de BASF. collègues Dr Behrang Shafei et Dr David Walz.

« Un autre avantage qu’ils offrent est l’automatisation. Dans la plupart des cas, il y a encore une personne dans la boucle, mais nous avons quelques cas où nous pouvons boucler cette boucle, ce qui signifie que vous pouvez vous éloigner, vous concentrer sur autre chose et revenir à de bons résultats.

La chimie progresse

Bien que l’optimisation de la conception expérimentale soit déjà un domaine couronné de succès, la chimie industrielle se débat toujours avec des contraintes pratiques difficiles à prendre en compte dans les algorithmes d’optimisation. Ceux-ci inclus:

– Le coût de la modification des variables physiques – par exemple, la modification de la température est un peu plus facile qu’auparavant.
– Le fait que certains types de données expérimentales reviennent plus rapidement que d’autres, et que les chimistes doivent prendre des décisions de conception expérimentale avant de toutes les recevoir, est connu sous le nom de traitement par lots asynchrone.
– Objectifs multiples, tels que la nécessité de minimiser le coût de production des produits chimiques tout en augmentant la qualité et la durabilité.
– Combinaison de variables continues telles que la température avec des variables catégorielles telles que marche et arrêt.
– La multiplicité ou le fait que certaines sources d’information sont plus fiables que d’autres.
– Les contraintes d’entrée telles que les faits connus indépendamment de l’expérience, par exemple les composants chimiques exprimés en pourcentages, doivent totaliser 100 %.

De nombreuses applications célèbres de l’apprentissage automatique sont des cas où vous pouvez ajouter autant de données que vous le souhaitez pour faire fonctionner les algorithmes – mais ce n’est pas le cas dans tous les domaines. Alexandre Thebelt

De nouvelles techniques développées par des chercheurs de l’Impériale et de BASF répondent à bon nombre de ces limitations. Un article présente une technique d’optimisation qui fait un compromis entre plusieurs objectifs, tandis qu’un autre considère les contraintes d’entrée et différents types de variables. Le troisième calcule les coûts de commutation variables, multi-fidélité et batch asynchrone.

Les auteurs des articles sont des doctorants et des universitaires des départements d’informatique et de mathématiques de l’Impérial, ainsi que des scientifiques de R&D de BASF. La recherche a été financée par BASF et le Conseil de recherche en génie et en sciences physiques par l’intermédiaire du Centre de formation doctorale en statistique et apprentissage automatique.

Les nouvelles frontières de l’apprentissage automatique

Portrait du professeur Ruth Misener
Au Département d’informatique, la professeure Ruth Misener étudie les solutions aux problèmes d’optimisation dans l’industrie. Il est titulaire de la chaire de recherche sur l’optimisation basée sur les données chez BASF/RAEng.

Bien que la recherche soit née de besoins pratiques en chimie, elle les a transformés en méthodes mathématiques avec des applications générales dans l’apprentissage automatique et le potentiel d’avoir un impact majeur au-delà de l’industrie chimique elle-même.

“La communauté de l’apprentissage automatique s’intéresse de plus en plus à ce genre de problèmes”, a déclaré Alexander Thebelt, doctorant en informatique et auteur principal d’un article. De nombreuses applications populaires d’apprentissage automatique sont des situations où il y a beaucoup de données, et vous pouvez envoyer autant de données que vous le souhaitez aux algorithmes pour les traiter. Ce n’est pas le cas dans tous les domaines. Si nous pouvons utiliser notre technologie pour découvrir de nouveaux matériaux qui pourraient avoir un impact énorme sur l’humanité et l’industrie. Cela pourrait être aussi important que tout ce que nous avons vu jusqu’à présent dans l’apprentissage automatique.”

Le Dr Lee a déclaré qu’il n’est pas rare d’appliquer des problèmes de chimie industrielle pour ouvrir de nouvelles approches théoriques dans la recherche sur l’apprentissage automatique. « Les personnes en apprentissage automatique considèrent traditionnellement les données comme des tableaux, des images ou du texte. Dès que vous arrivez et dites, mes entrées ne sont pas celles-ci, ce sont en fait des molécules, et puis les gens disent que c’est intéressant, je peux représenter une molécule comme un graphique avec des nœuds et des arêtes et faire toutes sortes de choses intelligentes.

« Notre partenariat avec Ruth [Misener] e groupe est extrêmement précieux car il a une jambe en génie chimique et l’autre en intelligence artificielle, ce qui est essentiel dans ce genre de travail. C’est rafraîchissant pour nous de collaborer avec l’Académie; ça donne une autre façon de voir les choses. C’est quelque chose que nous ne pouvons pas cultiver à la maison.”

  • José Pablo Folch, Shiqiang Zhang, Robert M. Lee, Behrang Shafei, David Walz, Calvin Tsay, Mark van der Wilk et Ruth Misener. (2022) “SnAKe : Optimisation Bayésienne avec Exploration Pathwise.”
  • Alexander Thebelt, Calvin Tsay, Robert M. Lee, Nathan Sudermann-Merch, David Walz, Behrang Shafei et Ruth Misener. (2022) “Nyaux d’ensembles d’arbres pour l’optimisation bayésienne avec des contraintes connues sur les espaces d’entités mixtes.”
  • Ben Tu, Axel Gandy, Nicolas Kantas, Behrang Shafei (2022) “Recherche d’entropie conjointe pour l’optimisation bayésienne multi-objectifs”

Leave a Reply

Your email address will not be published. Required fields are marked *