巻頭言 ビッグデータ
ビッグデータが最近, マスコミによく取り上げられている. 従来のデータ処理アプリケーションでは処理が困難なほど巨大で複雑なデータ集合の集積を表す. 端的に言えば, ビッグデータとは1)Volume(容量:大量のデータ), 2)Velocity(頻度/スピード:データの発生-判断の時間の短縮), 3)Variety(種類/多様性:多種の情報ソース)の3Vで表現される. ビッグデータでは, 効率的に大量データを短時間処理する技術が必要となる. その技術とは, 統計分類, データ・クラスタリング, クラウドソーシング, データ融合と統合, 遺伝的アルゴリズム, 自然言語処理, ニューラルネットワーク...
Saved in:
Published in | 民族衛生 Vol. 79; no. 5; p. 111 |
---|---|
Main Author | |
Format | Journal Article |
Language | Japanese |
Published |
日本民族衛生学会
30.09.2013
|
Online Access | Get full text |
ISSN | 0368-9395 |
Cover
Summary: | ビッグデータが最近, マスコミによく取り上げられている. 従来のデータ処理アプリケーションでは処理が困難なほど巨大で複雑なデータ集合の集積を表す. 端的に言えば, ビッグデータとは1)Volume(容量:大量のデータ), 2)Velocity(頻度/スピード:データの発生-判断の時間の短縮), 3)Variety(種類/多様性:多種の情報ソース)の3Vで表現される. ビッグデータでは, 効率的に大量データを短時間処理する技術が必要となる. その技術とは, 統計分類, データ・クラスタリング, クラウドソーシング, データ融合と統合, 遺伝的アルゴリズム, 自然言語処理, ニューラルネットワーク, パターン認識, 予測モデリング, 回帰分析, 感情分析, シミュレーション, 時系列解析, データマイニンググリッド, クラウドベースのインフラストラクチャ, インターネットなど, 従来から我々が検討してきた課題であるが, 規模速度など驚異的変化がある. その一部として, 医学遺伝学領域ではゲノム配列解析と機能マッピングが着実に進んでいる. これらは, 民族衛生学の領域でも多くの研究がすすめられ, 今後, 関わり, 検討していくことが増えるであろう. 米国ではこれらの研究に数億ドルの予算が付与され, 「ビッグデータイニシアティブ」がスタートしている. その中心機関は, カリフォルニア大学バークレー校, MITなどで, 人工知能, がん対策のような医学生物学を含めた広範囲の研究を進めている. そしてその分析, 解析で非常に有用な知見が得られるという方向で議論が進んでいる. しかし, ビッグデータの分析に批判も多い. ビッグデータの分析による決断は必然的に「過去に得られた知見, もしくは現在のものを超えることはない」という判断も多い. また, 因子分析やクラスター分析などのデータの潜在構造用の方法論は, 通常小さいデータ集合で使用される双方向変量アプローチよりも, 分析的アプローチとして有用であることが証明されている. こう見てくるとビッグデータへの評価は, 収集, 分析の方法論も含め, 双方向の検討が現実的議論として進めてられてゆくなかで, 深く考えていく必要があると思われる. |
---|---|
ISSN: | 0368-9395 |