データマイニング

提供: Precipedia
2017年11月14日 (火) 03:29時点におけるJSPEreviewer (トーク | 投稿記録)による版

移動: 案内検索

データマイニング (Data mining)とは、有益なパターンやルールあるいはノイズを含むデータベースに蓄積された膨大なデータ(ビッグデータ)から、価値ある情報を発掘する方法のことである。

目次

詳細

 データマイニングの特徴は、解析の目的に合致した最適な解析手法をいくつか組み合わせることにより、データに忠実なルール生成が行えることである[1][2][3]。これは未知なるルールの発見という利点をもつが、多数の解釈困難なルールを生成してしまうという問題点が内在しているため、解析の特性をよく理解して抽出された結果の解釈を行わなければ、正しい結果は出力されない。また、データマイニングの最終目的は意志決定、すなわち問題解決であり、単なる予測ではない。
 データマイニングは、教師なし学習(階層型クラスタリング手法など)と教師あり学習(ニューラルネットワークなど)に大別される。データマイニングで取り扱うデータの形態は、量的データ(例えば、1,2,3・・などの数値データ)や、そのままでは演算のできない質的データ(例えば,誕生日や血液型)、時系列データなどが存在し、それぞれのデータの形態によって、使用可能な解析手法は異なる。
 データマイニングの目的は、①データのグループ、,②データの特徴抽出、③データの予測に大別できる。それぞれの解析目的およびデータの形態を考慮して、解析者は適切な解析方法を選択してデータマイニングを行う必要がある。


関連項目

  • ニューラルネットワーク
  • 多変量解析


外部リンク

引用

  1. U. Fayyad, G. P. Shapiro and P. Smyth, “From Data Mining to Knowledge Discovery in Databases,” AI Magazine, Vol. 17, No. 3, pp. 37-54, 1996.
  2. J. Hosking, E. Pednault and M. Sudan, “A Statistical Perspective on Data Mining,” Future Generation Computer Systems, Vol. 13, No. 2-3, pp. 117-134, 1997.
  3. C. Glymour, D. Madigan, D. Pregibon and P. Smyth, “Statistical Inference and Data Mining,” Communication of the Acm, Vol. 39, No. 11, pp. 35-41, 1996.