Pattern Detection for Spatial Data. A spatial autocorrelation and functional free energy framework for segmentation = Détection de formes pour les données spatiales. Un cadre d'autocorrélation spatiale et fonctionnelle d'énergie libre pour la segmentation
Details
Serval ID
serval:BIB_7EAE48B85E67
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Pattern Detection for Spatial Data. A spatial autocorrelation and functional free energy framework for segmentation = Détection de formes pour les données spatiales. Un cadre d'autocorrélation spatiale et fonctionnelle d'énergie libre pour la segmentation
Director(s)
BAVAUD François
Institution details
Université de Lausanne, Faculté des géosciences et de l'environnement
Publication state
Accepted
Issued date
2021
Language
english
Abstract
Une forme (pattern en anglais) exprime une régularité dans le monde. Il s'agit ici de la détecter automatiquement. Cette régularité provient de l'organisation d'éléments observables et localisés tout autour de nous : des données spatiales. En pratique, la forme perçue immédiatement par nos sens est une simplification, à différentes échelles, de cette organisation. Sa perception indirecte à l'aide d'outils est utilisée en sciences, en particulier dans l'analyse de données. Cette analyse consiste à décomposer méthodiquement une forme en ses éléments pour construire un modèle. Le modèle mathématique et sa métrique de référence peuvent être ensuite résolus par une estimation automatique. Ce manuscrit met en contexte et développe différentes approches d'analyse semi-automatique (humaine et machine) pour l'exploration de données spatiales variées. En fait, elles permettent de détecter des formes, en particulier par la segmentation automatique et la mesure de l'autocorrélation spatiale.
La perception visuelle et machine sont complémentaire dans le processus de détection de forme. La régularité de la forme se manifeste par un ensemble d'éléments homogènes et remarquables. Cette homogénéité est spatiale lorsqu'il y a une proximité entre toutes les paires d'éléments, mais elle s'observe aussi lorsqu'il y a une certaine similarité entre toutes ces mêmes paires d'éléments. Visuellement, une forme globale peut apparaître immédiatement ou intuitivement dans une organisation de formes homogènes et remarquables. Sinon, cette forme globale peut être révélée à l'aide de l'automatisation machine en maximisant la proximité et la similarité entre les éléments pour les regrouper ou les discriminer dans de plus petits ensembles homogènes. Ces ensembles remarquables révèlent visuellement de par leur organisation spatiale et leur hétérogénéité cette forme plus globale.
Les approches proposées dans ce manuscrit se basent principalement sur des réseaux irréguliers et pondérés en lien avec l'autocorrélation spatiale. Le lien spatial entre toutes les paires d'éléments, la proximité, peut être représenté par les arêtes d'un système réticulaire où les éléments sont les nœuds. Ce lien non orienté est combiné avec l'inverse de la similarité, la dissimilarité, qui joue en quelque sorte le rôle de résistance à ce lien spatial. La pondération relative des nœuds permet de tenir compte d'une contribution variable ou uniforme des éléments. Mais, surtout, elle permet d'implémenter des objets mathématiques sophistiqués dans la modélisation du lien spatial entre les éléments. Dès lors, il devient possible de mesurer l'autocorrélation spatiale globale, mais aussi locale, utile pour déterminer statistiquement et à différentes échelles si des formes sont significativement présentes dans un jeu de données testé. En reprenant cette même base mathématique, une famille d'algorithmes itératifs a été développée pour détecter les formes en considérant la résolution du problème de la segmentation par l'optimisation de l'énergie libre. Elles ont pour but de maximiser la proximité et la similarité de manière supervisée ou non dans une fonctionnelle d'appartenance floue avec l'ajout d'un terme entropique. De nature flexibles, elles sont librement paramétrables quant à la finesse de l'appartenance et la sensibilité à la proximité spatiale et/ou à la similarité entre toutes les paires d'éléments jusqu'à révéler sous diverses perspectives la présence de formes.
Ce manuscrit est un recueil de contributions sous forme d'articles peer-reviewed (revus par les pairs en français) qui a été rédigé à la suite de leur publication. Sa lecture devrait permettre de comprendre de manière générale, pour un public large au-delà du milieu académique possiblement, les enjeux, le contexte puis la problématique adressée dans ces contributions. Ces contributions reflètent plusieurs années de travaux scientifiques dont la publication est le fruit de conjonctures heureuses, parfois chanceuses, de résultats significatifs et d'opportunités de publication. Le temps ayant raison de certains détails contextuels, ces articles peuvent apparaître dans ce manuscrit parfois de manière décousue les uns par rapport aux autres. Néanmoins, ils ont apporté ponctuellement des éléments formels et méthodologiques reconnus pour l'exploration de données spatiales à travers la détection de forme.
--
A pattern (forme in French) expresses a regularity in the world. The aim here is to detect it automatically. This regularity comes from the organisation of observable elements located all around us: spatial data. In practice, the pattern perceived _immediately_ by our senses is a simplification, at different scales, of this organisation. Its indirect perception with the help of tools is used in science, in particular in data analysis. This analysis consists of methodically breaking down a form into its elements to build a model. The mathematical model and its reference metric can then be solved by automatic estimation. This manuscript puts into context and develops different semi-automatic analysis approaches (human and machine) for the exploration of various spatial data. In fact, they allow pattern detection, in particular through automatic segmentation and spatial autocorrelation measurement.
Visual and machine perception are complementary to each other in the process of pattern detection. Pattern regularity results from a set of homogeneous and remarkable elements. This homogeneity is spatial when there is proximity between all pairs of elements, but it is also observed when there is some similarity between all pairs of elements. Visually, a global pattern may appear immediately or intuitively in an organisation of homogeneous and remarkable pattern. Alternatively, this global pattern can be revealed through machine automation (also called learning) by maximising the proximity and similarity between elements to group or discriminate them into smaller homogeneous sets. These remarkable sets visually reveal this more global pattern through their spatial organisation and heterogeneity.
The approaches proposed in this manuscript are mainly based on irregular and weighted networks related to spatial autocorrelation. The spatial link between all pairs of elements, the proximity, can be represented by the edges of a reticular system where the elements are the nodes. This undirected link is combined with the inverse of similarity, dissimilarity, which acts as a kind of resistance to this spatial link. The relative weighting of the nodes makes it possible to take into account a variable or uniform contribution of the elements. But, above all, it makes it possible to implement sophisticated mathematical objects in the modelling of the spatial link between elements. From then on, it becomes possible to measure the global spatial autocorrelation, but also the local autocorrelation, useful to determine statistically and at different scales if patterns are significantly present in a tested dataset. Taking this same mathematical basis, a family of iterative algorithms has been developed to detect patterns by considering the resolution of the segmentation problem through free energy optimisation. Those algorithms aim to maximise proximity and similarity in a supervised or unsupervised by defining a soft membership functional with the addition of entropy terms. Flexible in nature, they are freely parametrizable in terms of membership finesse and sensitivity to spatial proximity and/or similarity between all pairs of elements to reveal under various perspectives the presence of forms.
This manuscript is a collection of contributions in the form of peer-reviewed articles that has been written following their publication. Its reading should provide a general understanding, possibly for a wider audience than the academic community, of the issues, context and problems addressed in these contributions. These contributions reflect several years of scientific work, the publication of which is the result of fortunate and sometimes lucky circumstances, significant results and publication opportunities. As time has taken its toll on some of the contextual details, these articles may appear in this manuscript sometimes in a disjointed manner. Nevertheless, they have punctually brought formal and methodological elements that are recognized for the exploration of spatial data through the detection of form.
La perception visuelle et machine sont complémentaire dans le processus de détection de forme. La régularité de la forme se manifeste par un ensemble d'éléments homogènes et remarquables. Cette homogénéité est spatiale lorsqu'il y a une proximité entre toutes les paires d'éléments, mais elle s'observe aussi lorsqu'il y a une certaine similarité entre toutes ces mêmes paires d'éléments. Visuellement, une forme globale peut apparaître immédiatement ou intuitivement dans une organisation de formes homogènes et remarquables. Sinon, cette forme globale peut être révélée à l'aide de l'automatisation machine en maximisant la proximité et la similarité entre les éléments pour les regrouper ou les discriminer dans de plus petits ensembles homogènes. Ces ensembles remarquables révèlent visuellement de par leur organisation spatiale et leur hétérogénéité cette forme plus globale.
Les approches proposées dans ce manuscrit se basent principalement sur des réseaux irréguliers et pondérés en lien avec l'autocorrélation spatiale. Le lien spatial entre toutes les paires d'éléments, la proximité, peut être représenté par les arêtes d'un système réticulaire où les éléments sont les nœuds. Ce lien non orienté est combiné avec l'inverse de la similarité, la dissimilarité, qui joue en quelque sorte le rôle de résistance à ce lien spatial. La pondération relative des nœuds permet de tenir compte d'une contribution variable ou uniforme des éléments. Mais, surtout, elle permet d'implémenter des objets mathématiques sophistiqués dans la modélisation du lien spatial entre les éléments. Dès lors, il devient possible de mesurer l'autocorrélation spatiale globale, mais aussi locale, utile pour déterminer statistiquement et à différentes échelles si des formes sont significativement présentes dans un jeu de données testé. En reprenant cette même base mathématique, une famille d'algorithmes itératifs a été développée pour détecter les formes en considérant la résolution du problème de la segmentation par l'optimisation de l'énergie libre. Elles ont pour but de maximiser la proximité et la similarité de manière supervisée ou non dans une fonctionnelle d'appartenance floue avec l'ajout d'un terme entropique. De nature flexibles, elles sont librement paramétrables quant à la finesse de l'appartenance et la sensibilité à la proximité spatiale et/ou à la similarité entre toutes les paires d'éléments jusqu'à révéler sous diverses perspectives la présence de formes.
Ce manuscrit est un recueil de contributions sous forme d'articles peer-reviewed (revus par les pairs en français) qui a été rédigé à la suite de leur publication. Sa lecture devrait permettre de comprendre de manière générale, pour un public large au-delà du milieu académique possiblement, les enjeux, le contexte puis la problématique adressée dans ces contributions. Ces contributions reflètent plusieurs années de travaux scientifiques dont la publication est le fruit de conjonctures heureuses, parfois chanceuses, de résultats significatifs et d'opportunités de publication. Le temps ayant raison de certains détails contextuels, ces articles peuvent apparaître dans ce manuscrit parfois de manière décousue les uns par rapport aux autres. Néanmoins, ils ont apporté ponctuellement des éléments formels et méthodologiques reconnus pour l'exploration de données spatiales à travers la détection de forme.
--
A pattern (forme in French) expresses a regularity in the world. The aim here is to detect it automatically. This regularity comes from the organisation of observable elements located all around us: spatial data. In practice, the pattern perceived _immediately_ by our senses is a simplification, at different scales, of this organisation. Its indirect perception with the help of tools is used in science, in particular in data analysis. This analysis consists of methodically breaking down a form into its elements to build a model. The mathematical model and its reference metric can then be solved by automatic estimation. This manuscript puts into context and develops different semi-automatic analysis approaches (human and machine) for the exploration of various spatial data. In fact, they allow pattern detection, in particular through automatic segmentation and spatial autocorrelation measurement.
Visual and machine perception are complementary to each other in the process of pattern detection. Pattern regularity results from a set of homogeneous and remarkable elements. This homogeneity is spatial when there is proximity between all pairs of elements, but it is also observed when there is some similarity between all pairs of elements. Visually, a global pattern may appear immediately or intuitively in an organisation of homogeneous and remarkable pattern. Alternatively, this global pattern can be revealed through machine automation (also called learning) by maximising the proximity and similarity between elements to group or discriminate them into smaller homogeneous sets. These remarkable sets visually reveal this more global pattern through their spatial organisation and heterogeneity.
The approaches proposed in this manuscript are mainly based on irregular and weighted networks related to spatial autocorrelation. The spatial link between all pairs of elements, the proximity, can be represented by the edges of a reticular system where the elements are the nodes. This undirected link is combined with the inverse of similarity, dissimilarity, which acts as a kind of resistance to this spatial link. The relative weighting of the nodes makes it possible to take into account a variable or uniform contribution of the elements. But, above all, it makes it possible to implement sophisticated mathematical objects in the modelling of the spatial link between elements. From then on, it becomes possible to measure the global spatial autocorrelation, but also the local autocorrelation, useful to determine statistically and at different scales if patterns are significantly present in a tested dataset. Taking this same mathematical basis, a family of iterative algorithms has been developed to detect patterns by considering the resolution of the segmentation problem through free energy optimisation. Those algorithms aim to maximise proximity and similarity in a supervised or unsupervised by defining a soft membership functional with the addition of entropy terms. Flexible in nature, they are freely parametrizable in terms of membership finesse and sensitivity to spatial proximity and/or similarity between all pairs of elements to reveal under various perspectives the presence of forms.
This manuscript is a collection of contributions in the form of peer-reviewed articles that has been written following their publication. Its reading should provide a general understanding, possibly for a wider audience than the academic community, of the issues, context and problems addressed in these contributions. These contributions reflect several years of scientific work, the publication of which is the result of fortunate and sometimes lucky circumstances, significant results and publication opportunities. As time has taken its toll on some of the contextual details, these articles may appear in this manuscript sometimes in a disjointed manner. Nevertheless, they have punctually brought formal and methodological elements that are recognized for the exploration of spatial data through the detection of form.
Create date
02/02/2022 11:28
Last modification date
10/02/2022 6:33