Recovering the underlying trajectory from sparse and irregular longitudinal data

In this article, we consider the problem of recovering the underlying trajectory when the longitudinal data are sparsely and irregularly observed and noise‐contaminated. Such data are popularly analyzed with functional principal component analysis via the principal analysis by conditional estimation...

Full description

Saved in:
Bibliographic Details
Published inCanadian journal of statistics Vol. 50; no. 1; pp. 122 - 141
Main Authors Nie, Yunlong, Yang, Yuping, Wang, Liangliang, Cao, Jiguo
Format Journal Article
LanguageEnglish
Published Hoboken, USA John Wiley & Sons, Inc 01.03.2022
Wiley Subscription Services, Inc
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:In this article, we consider the problem of recovering the underlying trajectory when the longitudinal data are sparsely and irregularly observed and noise‐contaminated. Such data are popularly analyzed with functional principal component analysis via the principal analysis by conditional estimation (PACE) method. The PACE method may sometimes be numerically unstable because it involves the inverse of the covariance matrix. We propose a sparse orthonormal approximation (SOAP) method as an alternative. It estimates the optimal empirical basis functions in the best approximation framework rather than eigen‐decomposing the covariance function. The SOAP method avoids estimating the mean and covariance function, which is challenging when the assembled time points with observations for all subjects are not sufficiently dense. The method also avoids the inverse of the covariance matrix, hence the computation is more stable. It does not require the functional principal component scores to follow the Gaussian distribution. We show that the SOAP estimate for the optimal empirical basis function is asymptotically consistent. The finite‐sample performance of the SOAP method is investigated in simulation studies in comparison with the PACE method. Our method is demonstrated by recovering the CD4 percentage curves from sparse and irregular data in a multi‐centre AIDS cohort study. Résumé Cet article traite de l'estimation (ou récupération) d'une trajectoire sous‐jacente à des données longitudinales clairsemées, irrégulières et contaminées par du bruit. L'analyse de ce type de données fait usuellement appel aux techniques de l'Analyse en Composantes Principales Fonctionnelles, plus spécifiquement l'Analyse Principale par Espérance Conditionnelle (PACE). La méthode PACE peut parfois e^tre numériquement instable car elle implique l'inverse de la matrice de covariance. Pour parer à cette éventualité, les auteurs du présent travail proposent une méthode d'approximation orthonormale clairsemée (SOAP). Cette dernière adopte le meilleure cadre d'approximation pour estimer les fonctions de base empiriques optimales pluto^t que de recourir à une décomposition en valeurs propres de la matrice de covariance. Ainsi, la méthode SOAP contourne la difficulté d'estimer la moyenne et la covariance lorsque l'ensemble des observations dans le temps n'est pas dense. En plus d'assurer une stabilité numérique en évitant l'inversion de la matrice de covariance, cette méthode n'impose pas la normalité des scores des composantes principales fonctionnelles. Les auteurs prouvent la convergence asymptotique de l'estimateur SOAP de la fonction de base empirique optimale et présentent des études de simulation pour comparer sa performance avec celle de la méthode PACE sur des échantillons finis. Ensuite, ils illustrent la mise en œuvre de l'approche proposée en utilisant des données éparses et irrégulières provenant d'une étude de cohorte multicentrique sur le SIDA pour estimer des courbes de CD4.
Bibliography:ObjectType-Article-1
SourceType-Scholarly Journals-1
ObjectType-Feature-2
content type line 14
ISSN:0319-5724
1708-945X
DOI:10.1002/cjs.11677