Likelihood estimation and risk assessment for inverse problems in the geosciences
Détails
Télécharger: thèse-FL-OK.pdf (6169.35 [Ko])
Etat: Public
Version: Après imprimatur
Licence: Non spécifiée
Etat: Public
Version: Après imprimatur
Licence: Non spécifiée
ID Serval
serval:BIB_61BCFA95009A
Type
Thèse: thèse de doctorat.
Collection
Publications
Institution
Titre
Likelihood estimation and risk assessment for inverse problems in the geosciences
Directeur⸱rice⸱s
Linde Niklas
Codirecteur⸱rice⸱s
Ginsbourger David
Détails de l'institution
Université de Lausanne, Faculté des géosciences et de l'environnement
Statut éditorial
Acceptée
Date de publication
2023
Langue
anglais
Résumé
In the geosciences, inversion problems emerge from the need to estimate environmental variables from indirect measurements. This thesis concentrates on the inference of geo- physical or hydrogeological properties using geophysical or hydrological measurements. To enable uncertainty quantification, we employ a probabilistic inversion approach within a Bayesian framework, focusing on the posterior probability density function of the model parameters given the observed data. We address the following two research questions: (1) How can we efficiently solve Bayesian inverse problems involving intractable likelihood functions? (2) How can the combination of inversion and risk assessment methods enhance the accuracy of rare event probability estimation? The likelihood function is intractable in latent variable models, where the relationship between target model parameters and mea- surements is obscured by an intermediate (latent) variable. We consider cases involving uncertain petrophysical relationships and hyperparameter estimation, respectively. While the former is concerned with estimating hydrogeological parameters from geophysical data by treating the intermediate geophysical properties as latent variables, the latter targets hyperparameters (such as mean, standard deviation and integral scales) by considering the local properties of the field as latent variables. Performing inversion in both situations necessitates the estimation of an intractable likelihood function. To address this challenge, we employ two methods: the correlated pseudo-marginal method, which involves Monte Carlo averaging over samples of the latent variable, and a Gaussian approximation based on local linearization of the geophysical forward operator. In the context of petrophysical uncer- tainty, we find that the correlated pseudo-marginal method allows for accurate estimation, even in scenarios with high petrophysical uncertainty. In contrast, the less computationally intensive linearized Gaussian approach becomes gradually less accurate as the uncertainty in the petrophysical relationship increases. In the realm of hyperparameter estimation, we concentrate on the correlated pseudo-marginal method, showcasing its capacity to enhance the accuracy of hyperparameter estimation. Our second research question focuses on rare event estimation, for which the main objective is not to determine the posterior distribution of model parameters, but to characterize the distribution of a quantity of interest depending on these parameters through a non-linear relationship. Specifically, we aim to calculate the probability of this quantity assuming critical values, representing a rare event. To handle the associated challenges of rare event estimation, we employ two approaches: Sequential Monte Carlo combined with subset sampling and an energy-based model approach utilizing a bias potential. We evaluate the performance of the proposed methods using problems related to groundwater hazards and illustrative examples from the engineering literature. Encouragingly, both approaches demonstrate the ability to accurately estimate rare event probabilities smaller than one in a million. In summary, this thesis presents methodological advances to improve the computational efficiency and realism of probabilistic Bayesian inversion approaches for targeted estimation of properties and attributes of environmental systems.
Keywords Bayesian inversion, geophysics, hydrology, hydrogeophysics, Markov chain Monte Carlo, Sequential Monte Carlo, latent variable model, likelihood estimation, impor- tance sampling, rare events, energy-based models
--
Dans le domaine des géosciences, les problèmes inverses émergent de la nécessité d’estimer des variables environnementales à partir de mesures indirectes. Cette thèse se concentre sur l’inférence de propriétés géophysiques ou hydrogéologiques à partir de mesures géo- physiques ou hydrologiques. Pour permettre une quantification des incertitudes associées nous employons une approche d’inversion probabiliste dans un cadre bayésien, en nous concentrant sur la distribution a posteriori des paramètres du modèle compte tenu des données observées. Nous abordons les deux questions de recherche suivantes : (1) Comment adapter efficacement des méthodes d’inversion bayésiennes en présence de variables la- tentes? (2) Comment combiner les approches d’inversion et d’évaluation des risques pour améliorer l’ exactitude dans l’estimation de probabilités d’événements rares? La fonction de vraisemblance est difficile à cerner dans les modèles à variables latentes, où la relation entre les paramètres du modèle cible et les mesures est opacifiée par les incertitudes résidu- elles sur lesdites variables latentes. Nous examinons des cas impliquant respectivement des relations pétrophysiques incertaines et l’estimation d’hyperparamètres. Alors que le premier cas concerne l’estimation de paramètres hydrogéologiques à partir de données géophysiques en traitant les propriétés géophysiques intermédiaires comme des variables latentes, le second cas cible des hyperparamètres (tels que la moyenne, l’écart-type et les échelles d’intégrales) en considérant cette fois les propriétés locales du champ comme des variables latentes. L’inversion nécessite dans les deux situations l’estimation d’une fonction de vraisemblance complexe. Pour relever ce défi, nous utilisons deux méthodes : la méthode pseudo-marginale corrélée, qui implique une moyenne de Monte Carlo sur des échantillons de la variable latente, et une approximation gaussienne basée sur la linéarisation locale de la réponse géophysique ciblée. Dans le contexte de l’inversions en présence de relations pétrophysiques incertaines, nous constatons que la méthode pseudo-marginale corrélée permet une estimation précise, même dans des scénarios à forte incertitude pétrophysique. En revanche, l’approche gaussienne linéarisée, moins gourmande en ressources compu- tationnelles, perd progressivement en précision à mesure que l’incertitude de la relation pétrophysique augmente. Dans le cas de l’estimation des hyperparamètres, nous nous con- centrons sur la méthode pseudo-marginale corrélée et constatons qu’elle peut permettre d’améliorer l’estimation des hyperparamètres. Notre deuxième question de recherche porte sur l’estimation d’événements rares, pour laquelle l’objectif principal n’est pas de déterminer la distribution postérieure des paramètres du modèle, mais plutôt de caractériser la distri- bution d’une quantité d’intérêt dépendant de manière non linéaire de ces paramètres. Plus précisément, nous cherchons à calculer la probabilité que cette quantité prenne une valeur critique, qui représente un événement rare. Pour relever les défis associés à l’estimation des événements rares, nous utilisons deux approches : d’une part, une méthode de Monte Carlo séquentielle combinée à un sous-échantillonnage et, d’autre part, une approche fondée sur des modèles génératifs reposant sur le concept d’énergie libre (Energy-based models; EBM) et utilisant un potentiel de biais. Nous évaluons les performances des méthodes proposées en utilisant des problèmes simplifiés liés aux risques de contamination des eaux souterraines et des exemples tirés de la littérature de l’estimation de probabilité d’évènements rares en ingénierie. Il est encourageant de constater que les deux approches permettent d’estimer avec précision des probabilités d’événements rares d’occurence inférieure à un sur un million. En résumé, cette thèse présente des avancées méthodologiques visant à améliorer l’efficacité computationnelle et le réalisme des approches d’inversion probabiliste bayésienne pour l’estimation ciblée de propriétés et attributs des systèmes environnementaux.
--
Les études géoscientifiques impliquent souvent la résolution de problème dits “inverses”, dans lesquels des paramètres et propriétés environnementaux sont estimés sur la base de mesures disponibles et d’hypothèses de départ sur les phénomènes étudiés. Cette thèse se concentre sur l’utilisation de données géophysiques et hydrogéologiques pour déduire les caractéristiques géophysiques (par exemple, la conductivité électrique), géologiques (par exemple, la teneur en argile) ou hydrogéologiques (par exemple, la saturation en eau) dans la subsurface. Lors de la résolution de problèmes inverses, il est important d’avoir conscience qu’il existe toujours une incertitude inhérente aux résultats obtenus. Pour y remédier, nous utilisons une approche d’inversion probabiliste qui fournit une gamme de solutions possibles (dite distribution postérieure bayésienne). Dans ce contexte, cette thèse se concentre sur deux questions de recherche principales : (1) Comment résoudre efficacement les problèmes d’inversion si les paramètres d’intérêt ne sont pas directement liés aux mesures ? (2) Comment combiner les approches d’inversion et d’évaluation des risques pour prédire la probabilité d’occurrence des événements dangereux ? L’inversion probabiliste repose sur une fonction de vraisemblance, qui quantifie la probabilité qu’un ensemble spécifique de valeurs des paramètres du modèle soit à l’origine des données observées. Dans certains modèles, il est difficile d’évaluer la fonction de vraisemblance en raison de la présence d’une variable latente intermédiaire, qui brouille la relation directe entre les paramètres du modèle et les mesures. Nous considérons d’abord un scénario dans lequel les variables hydrogéologiques d’intérêt ne sont qu’indirectement liées aux mesures géophysiques par l’intermédiaire de propriétés géophysiques latentes. Dans un second scénario d’intérêt, nous nous intéressons à l’estimation d’ hyperparamètres tels que la moyenne et la structure de corrélation du domaine cible lorsque les mesures ne sont qu’indirectement liées à ces hyperparamètres par le biais de propriétés locales du domaine. Le calcul direct de la fonction de vraisemblance n’est possible dans aucun de ces deux scénarios. Pour surmonter cette difficulté, nous investiguons deux méthodes : la méthode pseudo-marginale corrélée et une approximation gaussienne linéarisée. Alors que la méthode pseudo-marginale corrélée implique un échantillonnage et un calcul de moyenne sur les variables latentes, l’approximation gaussienne linéarisée repose sur une approximation locale. Dans nos cas d’essai, la méthode pseudo-marginale corrélée apparaît comme une approche généralement applicable et précise. En revanche, l’approximation gaussienne linéarisée est plus efficace sur le plan du calcul, mais au prix d’une perte de précision. Dans notre deuxième question de recherche, nous nous concentrons sur l’estimation d’ événements rares, où l’objectif principal n’est pas d’estimer les paramètres du modèle eux-mêmes, mais évaluer un risque qui dépend de ces paramètres. Un exemple d’évènement dangereux étudié en hydrogéologie est la contamination d’un aquifère, un processus qui est influencé par les propriétés hydrauliques entre la source de contamination et l’aquifère. Lorsqu’il s’agit d’événements rares, il est nécessaire de recourir à des approches spécialisées pour parvenir à une estimation précise de la probabilité d’occurrence. Tout d’abord, nous considérons une méthode de Monte Carlo séquentielle combinée à un échantillonnage par sous-ensembles. Dans cette approche, nous générons des échantillons de manière itérative et les rapprochons progressivement de la région critique associée à l’événement rare en question. Par la suite, nous introduisons une approche basée sur le concept d’énergie libre (Energy-based models; EBM) en utilisant un potentiel de biais pour forcer l’échantillonnage dans une région qui est pertinente pour la quantité d’intérêt. De manière prometteuse, les deux approches montrent de bonnes performances dans l’estimation précise des probabilités d’événements rares, même lorsqu’ils se produisent à un taux inférieur à un sur un million. En résumé, cette thèse présente des avancées méthodologiques visant à améliorer l’efficacité computationnelle et le réalisme des approches d’inversion probabiliste pour l’estimation ciblée de propriétés et attributs des systèmes environnementaux
Keywords Bayesian inversion, geophysics, hydrology, hydrogeophysics, Markov chain Monte Carlo, Sequential Monte Carlo, latent variable model, likelihood estimation, impor- tance sampling, rare events, energy-based models
--
Dans le domaine des géosciences, les problèmes inverses émergent de la nécessité d’estimer des variables environnementales à partir de mesures indirectes. Cette thèse se concentre sur l’inférence de propriétés géophysiques ou hydrogéologiques à partir de mesures géo- physiques ou hydrologiques. Pour permettre une quantification des incertitudes associées nous employons une approche d’inversion probabiliste dans un cadre bayésien, en nous concentrant sur la distribution a posteriori des paramètres du modèle compte tenu des données observées. Nous abordons les deux questions de recherche suivantes : (1) Comment adapter efficacement des méthodes d’inversion bayésiennes en présence de variables la- tentes? (2) Comment combiner les approches d’inversion et d’évaluation des risques pour améliorer l’ exactitude dans l’estimation de probabilités d’événements rares? La fonction de vraisemblance est difficile à cerner dans les modèles à variables latentes, où la relation entre les paramètres du modèle cible et les mesures est opacifiée par les incertitudes résidu- elles sur lesdites variables latentes. Nous examinons des cas impliquant respectivement des relations pétrophysiques incertaines et l’estimation d’hyperparamètres. Alors que le premier cas concerne l’estimation de paramètres hydrogéologiques à partir de données géophysiques en traitant les propriétés géophysiques intermédiaires comme des variables latentes, le second cas cible des hyperparamètres (tels que la moyenne, l’écart-type et les échelles d’intégrales) en considérant cette fois les propriétés locales du champ comme des variables latentes. L’inversion nécessite dans les deux situations l’estimation d’une fonction de vraisemblance complexe. Pour relever ce défi, nous utilisons deux méthodes : la méthode pseudo-marginale corrélée, qui implique une moyenne de Monte Carlo sur des échantillons de la variable latente, et une approximation gaussienne basée sur la linéarisation locale de la réponse géophysique ciblée. Dans le contexte de l’inversions en présence de relations pétrophysiques incertaines, nous constatons que la méthode pseudo-marginale corrélée permet une estimation précise, même dans des scénarios à forte incertitude pétrophysique. En revanche, l’approche gaussienne linéarisée, moins gourmande en ressources compu- tationnelles, perd progressivement en précision à mesure que l’incertitude de la relation pétrophysique augmente. Dans le cas de l’estimation des hyperparamètres, nous nous con- centrons sur la méthode pseudo-marginale corrélée et constatons qu’elle peut permettre d’améliorer l’estimation des hyperparamètres. Notre deuxième question de recherche porte sur l’estimation d’événements rares, pour laquelle l’objectif principal n’est pas de déterminer la distribution postérieure des paramètres du modèle, mais plutôt de caractériser la distri- bution d’une quantité d’intérêt dépendant de manière non linéaire de ces paramètres. Plus précisément, nous cherchons à calculer la probabilité que cette quantité prenne une valeur critique, qui représente un événement rare. Pour relever les défis associés à l’estimation des événements rares, nous utilisons deux approches : d’une part, une méthode de Monte Carlo séquentielle combinée à un sous-échantillonnage et, d’autre part, une approche fondée sur des modèles génératifs reposant sur le concept d’énergie libre (Energy-based models; EBM) et utilisant un potentiel de biais. Nous évaluons les performances des méthodes proposées en utilisant des problèmes simplifiés liés aux risques de contamination des eaux souterraines et des exemples tirés de la littérature de l’estimation de probabilité d’évènements rares en ingénierie. Il est encourageant de constater que les deux approches permettent d’estimer avec précision des probabilités d’événements rares d’occurence inférieure à un sur un million. En résumé, cette thèse présente des avancées méthodologiques visant à améliorer l’efficacité computationnelle et le réalisme des approches d’inversion probabiliste bayésienne pour l’estimation ciblée de propriétés et attributs des systèmes environnementaux.
--
Les études géoscientifiques impliquent souvent la résolution de problème dits “inverses”, dans lesquels des paramètres et propriétés environnementaux sont estimés sur la base de mesures disponibles et d’hypothèses de départ sur les phénomènes étudiés. Cette thèse se concentre sur l’utilisation de données géophysiques et hydrogéologiques pour déduire les caractéristiques géophysiques (par exemple, la conductivité électrique), géologiques (par exemple, la teneur en argile) ou hydrogéologiques (par exemple, la saturation en eau) dans la subsurface. Lors de la résolution de problèmes inverses, il est important d’avoir conscience qu’il existe toujours une incertitude inhérente aux résultats obtenus. Pour y remédier, nous utilisons une approche d’inversion probabiliste qui fournit une gamme de solutions possibles (dite distribution postérieure bayésienne). Dans ce contexte, cette thèse se concentre sur deux questions de recherche principales : (1) Comment résoudre efficacement les problèmes d’inversion si les paramètres d’intérêt ne sont pas directement liés aux mesures ? (2) Comment combiner les approches d’inversion et d’évaluation des risques pour prédire la probabilité d’occurrence des événements dangereux ? L’inversion probabiliste repose sur une fonction de vraisemblance, qui quantifie la probabilité qu’un ensemble spécifique de valeurs des paramètres du modèle soit à l’origine des données observées. Dans certains modèles, il est difficile d’évaluer la fonction de vraisemblance en raison de la présence d’une variable latente intermédiaire, qui brouille la relation directe entre les paramètres du modèle et les mesures. Nous considérons d’abord un scénario dans lequel les variables hydrogéologiques d’intérêt ne sont qu’indirectement liées aux mesures géophysiques par l’intermédiaire de propriétés géophysiques latentes. Dans un second scénario d’intérêt, nous nous intéressons à l’estimation d’ hyperparamètres tels que la moyenne et la structure de corrélation du domaine cible lorsque les mesures ne sont qu’indirectement liées à ces hyperparamètres par le biais de propriétés locales du domaine. Le calcul direct de la fonction de vraisemblance n’est possible dans aucun de ces deux scénarios. Pour surmonter cette difficulté, nous investiguons deux méthodes : la méthode pseudo-marginale corrélée et une approximation gaussienne linéarisée. Alors que la méthode pseudo-marginale corrélée implique un échantillonnage et un calcul de moyenne sur les variables latentes, l’approximation gaussienne linéarisée repose sur une approximation locale. Dans nos cas d’essai, la méthode pseudo-marginale corrélée apparaît comme une approche généralement applicable et précise. En revanche, l’approximation gaussienne linéarisée est plus efficace sur le plan du calcul, mais au prix d’une perte de précision. Dans notre deuxième question de recherche, nous nous concentrons sur l’estimation d’ événements rares, où l’objectif principal n’est pas d’estimer les paramètres du modèle eux-mêmes, mais évaluer un risque qui dépend de ces paramètres. Un exemple d’évènement dangereux étudié en hydrogéologie est la contamination d’un aquifère, un processus qui est influencé par les propriétés hydrauliques entre la source de contamination et l’aquifère. Lorsqu’il s’agit d’événements rares, il est nécessaire de recourir à des approches spécialisées pour parvenir à une estimation précise de la probabilité d’occurrence. Tout d’abord, nous considérons une méthode de Monte Carlo séquentielle combinée à un échantillonnage par sous-ensembles. Dans cette approche, nous générons des échantillons de manière itérative et les rapprochons progressivement de la région critique associée à l’événement rare en question. Par la suite, nous introduisons une approche basée sur le concept d’énergie libre (Energy-based models; EBM) en utilisant un potentiel de biais pour forcer l’échantillonnage dans une région qui est pertinente pour la quantité d’intérêt. De manière prometteuse, les deux approches montrent de bonnes performances dans l’estimation précise des probabilités d’événements rares, même lorsqu’ils se produisent à un taux inférieur à un sur un million. En résumé, cette thèse présente des avancées méthodologiques visant à améliorer l’efficacité computationnelle et le réalisme des approches d’inversion probabiliste pour l’estimation ciblée de propriétés et attributs des systèmes environnementaux
Création de la notice
01/12/2023 13:44
Dernière modification de la notice
31/01/2024 7:31