THREE ARTICLES ON THE APPLICATION OF MACHINE LEARNING AND ARTIFICIAL NEURAL NETWORKS TO ANALYZE AND SIMULATE DESIGNED ENVIRONMENTAL PROCESSES

McCORMICK, Mark William

Résumé

This thesis consists of three scientific publications that use machine learning methods to understand industrial processes that were designed to improve environmental quality. My work contributes to efforts to make numerical models for simulation and process control that can be applied to improve equipment design and process performance. The personal gain achieved was acquisition of the knowledge and practical skills needed to make better quantitative data analysis and predictive models.
Chapter 1 reports the analysis of data obtained from continuous torrefaction trials conducted in an integrated pilot plant. The purpose of the work was to gain insights into the process behavior that might be useful in the conception of a process controller that aims to obtain a product having a high and constant calorific value from heterogeneous raw biomass having a low and fluctuating calorific value. Principal components analysis of on-line operational data showed that the first 10 principal components account for only 75% of the total variance in the system. This indicates that the data cannot be summarized by only a few latent variables. The Hotelling’s t-squared statistic and the first principal component scores were analyzed to identify the periods of process instability and then to identify the disturbance and the manipulated parameters that contribute to the variance during these periods. A Partial Least Squares regression model was developed to map the relation between principal components and the heating value of the torrefied product. The presence of significant and persistent correlations between changes in the values of two parameters, was assessed by determining the correlations at different lag times.
Chapter 2 reports the development of artificial neural network predictive models of data acquired during 12 months of operation of an anaerobic digester treating food wastes. The purpose of the work was to make a predictive model to map process performance, evaluated in terms of CH4 production, to measurable operational parameters. The models were then assessed for use as decision tools to control the digester feeding rate. Three separate model architectures were evaluated: 1) Long short-term memory (LSTM) 2) Convolutional (CNN) and 3) a hybrid model featuring parallel data flow through LSTM and CNN layers. The LSTM model was found to have the lowest RMSE between predicted and measured biogas production. However, the 1-layer CNN proved to more accurately make correct feeding decisions (58%) which was slightly lower than the rate obtained by skilled operators (63%).
Chapter 3 reports the development of a problem-solving approach and a simulation tool for use in designing upflow anaerobic filters (UAF) for wastewater treatment. The multi-layer perceptron (MLP) artificial neural network model was found to be more accurate than a 4th degree polynomial model and more appropriate than the LSTM model. The Root Mean Squared Error (RMSE) of the predicted responses on unseen test data was 10.1% of the range of the true response values and the coefficient of determination (R2) was 0.66. The MLP model was then used to run simulations of different design values of the UAF packing diameter, packing material type and the bioreactor height to diameter ratio. The ranked results of simulation were used to select the optimal design values.
--
Cette thèse se compose de trois publications scientifiques qui utilisent des méthodes d'apprentissage automatique pour comprendre des processus industriels qui ont été conçus pour améliorer la qualité de l'environnement. Mon travail contribue aux efforts visant à créer des modèles numériques pour la simulation et le contrôle de processus. Les modèles peuvent être appliqués pour améliorer la conception d’équipements et les performances de processus. Le gain personnel réalisé a été l'acquisition des connaissances et des compétences pratiques nécessaires pour mieux analyser des données quantitatives et mieux concevoir des modèles prédictifs.
Le chapitre 1 rapporte l'analyse des données obtenues à partir d'essais de torréfaction en continu menés dans une usine pilote intégrée. Le but du travail était de mieux comprendre le comportement du procédé et d’extraire des informations qui pourraient être utiles dans la conception d'un contrôleur de procédé visant à obtenir un produit ayant une valeur calorifique élevée et constante à partir de biomasse brute hétérogène ayant une valeur calorifique faible et fluctuante. L'analyse en composantes principales des données opérationnelles en ligne a montré que les 10 premières composantes principales ne représentent que 75 % de la variance totale du système. Cela indique que les données ne peuvent pas être résumées par seulement quelques variables latentes. La statistique t-carré de Hotelling et les scores de la première composante principale ont été analysés pour identifier les périodes d'instabilité du processus, puis pour identifier les paramètres de perturbation et les paramètres manipulés qui contribuent à la variance au cours de ces périodes. Un modèle de régression des moindres carrés partiels a été développé pour décrire la relation entre les composants principaux et le pouvoir calorifique du produit torréfié. La présence de corrélations significatives et persistantes entre les changements des valeurs de deux paramètres a été évaluée en déterminant les corrélations à différents temps de latence.
Le chapitre 2 rapporte le développement de modèles prédictifs à réseaux de neurones artificiels entrainés avec des données acquises pendant 12 mois de fonctionnement d'un digesteur anaérobie traitant des déchets alimentaires. L'objectif des travaux était de réaliser un modèle prédictif permettant de décrire la relation entre les performances du procédé, évaluées en termes de production de CH4, et des paramètres opérationnels mesurables. Les modèles ont ensuite été évalués pour être utilisés comme outils de décision pour contrôler le taux d'alimentation du digesteur. Trois architectures de modèles distinctes ont été évaluées : 1) Long short-term memory (LSTM) 2) convolution à 1 couche (1-D CNN) et 3) un modèle hybride présentant un flux de données parallèle à travers les couches LSTM et 1-D CNN. Le modèle LSTM s'est avéré avoir le RMSE le plus bas entre la prédiction de la production de biogaz et la production réellement mesurée. Cependant, le 1-D CNN s'est avéré plus précis comme aide à la prise de décision d'alimentation du digesteur. Le taux de décisions correctes était de 58%, ce qui était légèrement inférieur au taux obtenu par des opérateurs qualifiés (63%).
Le chapitre 3 rapporte le développement d'une approche de résolution du problème de développement d’équipements et un outil de simulation à utiliser dans la conception de filtres anaérobies à flux ascendant (UAF) pour le traitement des eaux usées. Le perceptron multicouche
014
(MLP) s'est avéré être plus précis qu'un modèle polynomial du 4e degré et plus approprié que le modèle LSTM. L'erreur quadratique moyenne (RMSE) des réponses prédites sur les données de validation était de 10,1% de la plage des valeurs de réponse réelles et le coefficient de détermination (R2) était de 0,66. Le modèle MLP a ensuite été utilisé pour exécuter des simulations de différentes valeurs de conception du diamètre de garnissage, du type de matériau de garnissage et du rapport hauteur/diamètre du bioréacteur. Les résultats classés de la simulation ont été utilisés pour sélectionner les valeurs de conception optimales.

SERVAL

serveur académique lausannois

THREE ARTICLES ON THE APPLICATION OF MACHINE LEARNING AND ARTIFICIAL NEURAL NETWORKS TO ANALYZE AND SIMULATE DESIGNED ENVIRONMENTAL PROCESSES

Détails