Regression-Based Approach to Test Missing Data Mechanisms
Détails
Sous embargo indéterminé.
Accès restreint UNIL
Etat: Public
Version: Après imprimatur
Licence: Non spécifiée
Accès restreint UNIL
Etat: Public
Version: Après imprimatur
Licence: Non spécifiée
ID Serval
serval:BIB_5779315B6CE0
Type
Thèse: thèse de doctorat.
Collection
Publications
Institution
Titre
Regression-Based Approach to Test Missing Data Mechanisms
Directeur⸱rice⸱s
Berchtold André
Détails de l'institution
Université de Lausanne, Faculté des sciences sociales et politiques
Statut éditorial
Acceptée
Date de publication
2019
Langue
anglais
Résumé
Missing data are an important issue in the social sciences. Knowing about the type of missing data is essential to appropriately treating data with missing values. This thesis focuses on the handling of missing data mechanisms, both simple and mixed, and how to determine whether missing data are completely randomly distributed or not. It develops an alternative regression-based approach to test missing data mechanisms for continuous and categorical data, and compares it to commonly used tests.
Different sets of simulation are provided to understand the power and the behaviour of the different existing approaches to test missingness when the sample size, the data type and distribution, the number, type, and generation mechanism of missing data, as well as the level of correlation between variables vary.
Finally, a real case is used to show in a complete procedure how missing data should be treated, with a cross-sectional and longitudinal application to the professional path survey.
--
Les données manquantes sont un important problème en sciences sociales. La connaissance du type des données manquantes est essentielle pour une analyse appropriée des valeurs manquantes. Cette thèse se concentre sur la gestion des mécanismes simples et mixtes des données manquantes et la manière de tester si les données manquantes sont distribuées de manière complètement aléatoire ou non. Une approche alternative, basée sur un modèle de régression et applicable aux données continues et catégorielles, est développée afin de tester les mécanismes des données manquantes. Elle est comparée aux tests les plus usuels couramment utilisés pour évaluer ces mécanismes.
Plusieurs séries de simulations sont présentées afin de mettre en évidence la puissance des approches existantes pour tester les mécanismes des données manquantes en fonction de la taille d’échantillon, du type et de la distribution des données, du nombre, du type et de la génération des données manquantes, ainsi que du niveau de corrélation entre les variables.
Finalement, une procédure complète du traitement des données manquantes est pro-posée dans le cadre d’une étude réelle avec des données transversales et longitudinales de l’enquête des trajectoires professionnelles.
Different sets of simulation are provided to understand the power and the behaviour of the different existing approaches to test missingness when the sample size, the data type and distribution, the number, type, and generation mechanism of missing data, as well as the level of correlation between variables vary.
Finally, a real case is used to show in a complete procedure how missing data should be treated, with a cross-sectional and longitudinal application to the professional path survey.
--
Les données manquantes sont un important problème en sciences sociales. La connaissance du type des données manquantes est essentielle pour une analyse appropriée des valeurs manquantes. Cette thèse se concentre sur la gestion des mécanismes simples et mixtes des données manquantes et la manière de tester si les données manquantes sont distribuées de manière complètement aléatoire ou non. Une approche alternative, basée sur un modèle de régression et applicable aux données continues et catégorielles, est développée afin de tester les mécanismes des données manquantes. Elle est comparée aux tests les plus usuels couramment utilisés pour évaluer ces mécanismes.
Plusieurs séries de simulations sont présentées afin de mettre en évidence la puissance des approches existantes pour tester les mécanismes des données manquantes en fonction de la taille d’échantillon, du type et de la distribution des données, du nombre, du type et de la génération des données manquantes, ainsi que du niveau de corrélation entre les variables.
Finalement, une procédure complète du traitement des données manquantes est pro-posée dans le cadre d’une étude réelle avec des données transversales et longitudinales de l’enquête des trajectoires professionnelles.
Création de la notice
10/12/2019 11:34
Dernière modification de la notice
07/01/2020 11:16