Recovering the underlying trajectory from sparse and irregular longitudinal data
In this article, we consider the problem of recovering the underlying trajectory when the longitudinal data are sparsely and irregularly observed and noise‐contaminated. Such data are popularly analyzed with functional principal component analysis via the principal analysis by conditional estimation...
Saved in:
Published in | Canadian journal of statistics Vol. 50; no. 1; pp. 122 - 141 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | English |
Published |
Hoboken, USA
John Wiley & Sons, Inc
01.03.2022
Wiley Subscription Services, Inc |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | In this article, we consider the problem of recovering the underlying trajectory when the longitudinal data are sparsely and irregularly observed and noise‐contaminated. Such data are popularly analyzed with functional principal component analysis via the principal analysis by conditional estimation (PACE) method. The PACE method may sometimes be numerically unstable because it involves the inverse of the covariance matrix. We propose a sparse orthonormal approximation (SOAP) method as an alternative. It estimates the optimal empirical basis functions in the best approximation framework rather than eigen‐decomposing the covariance function. The SOAP method avoids estimating the mean and covariance function, which is challenging when the assembled time points with observations for all subjects are not sufficiently dense. The method also avoids the inverse of the covariance matrix, hence the computation is more stable. It does not require the functional principal component scores to follow the Gaussian distribution. We show that the SOAP estimate for the optimal empirical basis function is asymptotically consistent. The finite‐sample performance of the SOAP method is investigated in simulation studies in comparison with the PACE method. Our method is demonstrated by recovering the CD4 percentage curves from sparse and irregular data in a multi‐centre AIDS cohort study.
Résumé
Cet article traite de l'estimation (ou récupération) d'une trajectoire sous‐jacente à des données longitudinales clairsemées, irrégulières et contaminées par du bruit. L'analyse de ce type de données fait usuellement appel aux techniques de l'Analyse en Composantes Principales Fonctionnelles, plus spécifiquement l'Analyse Principale par Espérance Conditionnelle (PACE). La méthode PACE peut parfois e^tre numériquement instable car elle implique l'inverse de la matrice de covariance. Pour parer à cette éventualité, les auteurs du présent travail proposent une méthode d'approximation orthonormale clairsemée (SOAP). Cette dernière adopte le meilleure cadre d'approximation pour estimer les fonctions de base empiriques optimales pluto^t que de recourir à une décomposition en valeurs propres de la matrice de covariance. Ainsi, la méthode SOAP contourne la difficulté d'estimer la moyenne et la covariance lorsque l'ensemble des observations dans le temps n'est pas dense. En plus d'assurer une stabilité numérique en évitant l'inversion de la matrice de covariance, cette méthode n'impose pas la normalité des scores des composantes principales fonctionnelles. Les auteurs prouvent la convergence asymptotique de l'estimateur SOAP de la fonction de base empirique optimale et présentent des études de simulation pour comparer sa performance avec celle de la méthode PACE sur des échantillons finis. Ensuite, ils illustrent la mise en œuvre de l'approche proposée en utilisant des données éparses et irrégulières provenant d'une étude de cohorte multicentrique sur le SIDA pour estimer des courbes de CD4. |
---|---|
Bibliography: | ObjectType-Article-1 SourceType-Scholarly Journals-1 ObjectType-Feature-2 content type line 14 |
ISSN: | 0319-5724 1708-945X |
DOI: | 10.1002/cjs.11677 |