大規模リアルワールドデータにおける解析前のデータ 前処理に関する研究動向と今後の課題について ―臨床研究への利活用を見据えて

近年,世界的に医療情報データベースの利活用の気運が高まっており,我が国においてもリアルワールドデータ (RWD) を臨床研究に有効活用することが期待されている.一方で,電子カルテやDPC,レセプト等の蓄積された既存データを用いるデータベース研究は,統計解析の前に実施するデータ前処理の負荷が極めて高いことが知られている.しかしながら,データベース研究に関するデータ前処理の課題や研究を学術的な観点から体系的に整理した文献はほとんど見られない.そこで,本稿ではデータベース研究におけるデータ前処理の課題を疫学,および工学的な観点から体系的に整理し,それらの課題に取り組んでいる研究を紹介した後に,残され...

Full description

Saved in:
Bibliographic Details
Published in薬剤疫学 Vol. 27; no. 2; pp. 49 - 59
Main Author 岩尾, 友秀
Format Journal Article
LanguageJapanese
Published 一般社団法人 日本薬剤疫学会 20.10.2022
Subjects
Online AccessGet full text
ISSN1342-0445
1882-790X
DOI10.3820/jjpe.27.e1

Cover

More Information
Summary:近年,世界的に医療情報データベースの利活用の気運が高まっており,我が国においてもリアルワールドデータ (RWD) を臨床研究に有効活用することが期待されている.一方で,電子カルテやDPC,レセプト等の蓄積された既存データを用いるデータベース研究は,統計解析の前に実施するデータ前処理の負荷が極めて高いことが知られている.しかしながら,データベース研究に関するデータ前処理の課題や研究を学術的な観点から体系的に整理した文献はほとんど見られない.そこで,本稿ではデータベース研究におけるデータ前処理の課題を疫学,および工学的な観点から体系的に整理し,それらの課題に取り組んでいる研究を紹介した後に,残された課題や今後の研究動向について考察する.本稿では,データベース研究の課題を,①データコンテンツ,②データ構造,③大容量データの処理,という三つのカテゴリーに分類した.次に,データ前処理に取り組んでいる研究について調査し,課題ごとに体系的に取り上げた.調査の結果,データ前処理分野の研究は,解析に必要なデータコンテンツを既存のデータベースに補完することで,信頼性を高めることを目的とした研究がほとんどを占めていた.一方で,データ構造や大容量データ処理に関する課題解決を主目的とした研究は十分になされているとはいえない状況であった.データ前処理は生物統計学や機械学習等の関連領域と比較すると歴史が浅く,社会的な認知度が低いこともあり,当該分野を専門とする理工系の研究者が極めて少ないことが一因であると考えられる.本稿が端緒となりデータ前処理の重要性が認知されることで,傑出した研究成果が生まれ,臨床研究の領域においてRWD の利活用がますます興隆することを期待する.
ISSN:1342-0445
1882-790X
DOI:10.3820/jjpe.27.e1