Regression-Based Approach to Test Missing Data Mechanisms

Details

Ressource 1 Under indefinite embargo.
UNIL restricted access
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_5779315B6CE0
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Regression-Based Approach to Test Missing Data Mechanisms
Author(s)
Rouzinov Serguei
Director(s)
Berchtold André
Institution details
Université de Lausanne, Faculté des sciences sociales et politiques
Publication state
Accepted
Issued date
2019
Language
english
Abstract
Missing data are an important issue in the social sciences. Knowing about the type of missing data is essential to appropriately treating data with missing values. This thesis focuses on the handling of missing data mechanisms, both simple and mixed, and how to determine whether missing data are completely randomly distributed or not. It develops an alternative regression-based approach to test missing data mechanisms for continuous and categorical data, and compares it to commonly used tests.
Different sets of simulation are provided to understand the power and the behaviour of the different existing approaches to test missingness when the sample size, the data type and distribution, the number, type, and generation mechanism of missing data, as well as the level of correlation between variables vary.
Finally, a real case is used to show in a complete procedure how missing data should be treated, with a cross-sectional and longitudinal application to the professional path survey.
--
Les données manquantes sont un important problème en sciences sociales. La connaissance du type des données manquantes est essentielle pour une analyse appropriée des valeurs manquantes. Cette thèse se concentre sur la gestion des mécanismes simples et mixtes des données manquantes et la manière de tester si les données manquantes sont distribuées de manière complètement aléatoire ou non. Une approche alternative, basée sur un modèle de régression et applicable aux données continues et catégorielles, est développée afin de tester les mécanismes des données manquantes. Elle est comparée aux tests les plus usuels couramment utilisés pour évaluer ces mécanismes.
Plusieurs séries de simulations sont présentées afin de mettre en évidence la puissance des approches existantes pour tester les mécanismes des données manquantes en fonction de la taille d’échantillon, du type et de la distribution des données, du nombre, du type et de la génération des données manquantes, ainsi que du niveau de corrélation entre les variables.
Finalement, une procédure complète du traitement des données manquantes est pro-posée dans le cadre d’une étude réelle avec des données transversales et longitudinales de l’enquête des trajectoires professionnelles.
Create date
10/12/2019 11:34
Last modification date
07/01/2020 11:16
Usage data