業務紹介

データマイニング

データマイニングの最も重要な要素は、アナリストの関連業務知識と思考モードです。通常、データマイニングは主に、分類、クラスタリング、相関、予測の4種類の問題を解決することに重点を置いています。データマイニングは、解決可能な問題種類を非常に明確に定義します。

一、分類問題
分類問題は予測的な問題ですが、普段の予測問題との区別は、具体的な数値(例55、65、75……)ではなく、その予測結果が類別(例 A、B、C三種類)です。
二、クラスタリング
クラスタリングは予測的な問題範疇ではなく、主に、オブジェクトのグループを複数のグループへの分割問題を解決します。分割ベースはクラスタリングのキーポイントです。
三、相関問題
ウォルマートの「ビールとおむつ」事例は、データマイニング/データウェアハウスの相関代表事例であり、世のなかのものは密接に結びついており、相関問題のつながりは発現可能です。
四、予測問題
ここで定義される予測問題とは、狭い範囲の予測であり、前述の分類問題は含まれてないです。ちなみに、分類問題も予測範疇に属されるためです。通常予測問題は、主に予測変数値が連続的な数値を指します。

ツール 説 明(日本語)
RapidMiner データマイニング機能、データ前処理と可視化機能、予測分析と統計モデリング化機能、分析処理機能など。
WEKA データ前処理、収集、分類、回帰分析、可視化と特徴選択等機能にて、データ分析及び予測モデリング化の可視化と演算法などに活用されます。
Orange 生物情報とテキストデータのマイニング、Orange可視化コーディングとPythonスクリプトなど
NLTK 言語処理機能(データマイニング、マシンランニング、データクロール、感情分析など多言語処理タスク機能)
KNIME KNIMEはオープンソースデータ分析、レポートと総合プラットフォームであり、その他モジュール化データのパイプラインのコンセプトを経て、さまざまな機械学習コンポーネントとデータマイニングを統合する。また、KNIMEはグラフィカルインタフェース機能があり、データノードに対し更なる処理に十分便利です。

お問い合わせ

  • 本社 86-411-3989-5558
  • 東京支社 050-5539-8972