メインコンテンツへスキップ

はじめに

2つの新しいデータサイエンスチャート、コンフュージョンマトリクスと相関マトリクスを使用すると、ビジネス分析で例外や次のステップを特定する時間を節約できます。相関マトリクスは、DataSet内の変数がどのように相互に関連しているかを示します。詳細については、「 相関マトリクス 」を参照してください。コンフュージョンマトリクスは、機械学習分類モデルの予測パフォーマンスをまとめたものです。詳細については、「 コンフュージョンマトリクス 」を参照してください。 相関マトリクス
correlation matrix.jpg
コンフュージョンマトリクス
prediction v actual example.jpg

これらのチャートについては、以下のトピックで説明します。

相関マトリクス

相関マトリクスは、変数のセット間の相関係数を示す表です。表内の各ランダム変数(Xi)は、表内のほかの各値と相関関係にあります。これにより、どのペアが最も高い相関関係を持つかを確認できます。 変数とそれ自体の相関は常に1であるため、マトリクスの対角成分は常に1のセットになります。右上の三角形に値を入力できますが、これらの値は左下の三角形の繰り返しです。つまり、相関マトリクスは対称マトリクスでもあります。 相関マトリクスの1つの例は、受講者の試験スコアとほかのいくつかの変数との関係です。サンプル変数には、「勉強時間」、「IQスコア」、「睡眠時間」などがあります。 以下に、これらの変数を含む表の例を示します。
correlation table.jpg
このフォーマットでは、このデータの相関関係を分析するのは困難です。相関マトリクスチャートを使用すると、多くのことを行うことができます。 これは、アイデンティティ対角成分とチャートの上半分(重複データ)が削除された相関マトリクスです。
example matrix.jpg
相関マトリクスチャートを使用すると、正と負の相関関係、および相関関係の高さと低さをより簡単に確認できます。

相関マトリクスを作成する

相関マトリクスでは、X軸とY軸にデータを入力するために、少なくとも2つの数値列が必要です。相関マトリクスではテキスト列を使用できません。データ間の相関関係を確認できる列を選択する必要があります。 Analyzerで、相関マトリクスのデータを含む列を選択できます。データ列の選択について詳しくは、「 DataSet列をチャートに適用する 」を参照してください。 以下の例では、コスト、利益、売上データを使用して、全体的な売上データを比較し、相関を取っています。チャートの下にあるスケールキーを使用して、3つの入力が相互にどのように関連しているかを確認できます。
example correlation matrix.jpg

相関マトリクスをカスタマイズする

相関マトリクスの外観のカスタマイズは、チャートの設定を編集することで行います。利用できるすべてのチャートの設定については、「 チャートの設定 」を参照してください。 相関マトリクス固有のプロパティには、以下があります。

プロパティ

説明

[一般]>[正の値の色]

正の値の場合に
表示される色です。

[一般]>[ゼロの色]

「ゼロ」の値の場合に表示される色です。

画像

[一般]>[負の値の色]

負の値の場合に表示される色です。

[一般]>[セル境界線の色]

セル境界線の色です。

[一般]>[ハーフグリッドを表示] ハーフグリッドとしてのみ
マトリクスを表示します。
show half grid.png
[一般]>[ハーフグリッドの位置] ハーフグリッドが選択されている場合、
このプロパティはその位置を変更します。

[一般]>[アイデンティティを除外] マトリクスから
アイデンティティデータを削除します。
exclude identity.png

コンフュージョンマトリクスを作成する

コンフュージョンマトリクスには、以下のものが必要です。
  • 「予測される値」の測定またはディメンション — 予測値はデフォルトでY軸になります。
  • 「実際の値」の測定またはディメンション — 実際の値はデフォルトでX軸になります。
コンフュージョンマトリクスチャートでは、1/0、yes/no、またはtrue/falseの値入力タイプを使用します。 Analyzerで、コンフュージョンマトリクスのデータを含む列を選択できます。データ列の選択の詳細については、「 DataSet列をチャートに適用する 」を参照してください。 以下の例では、プロジェクトから除外される従業員の予測値が、会社を退職する従業員の実際の数とどのように関連しているかを示すために、従業員リテンションデータが使用されています。

コンフュージョンマトリクスをカスタマイズする

コンフュージョンマトリクスの外観のカスタマイズは、チャートの設定を編集することで行います。利用できるすべてのチャートの設定については、「 チャートの設定 」を参照してください。 コンフュージョンマトリクス固有のプロパティには、以下があります。

プロパティ

説明

[一般]>[実際の位置]

「実際の」値やラベルの位置を決定します。

[一般]>[実際の予測色]

「実際の」および「予測される」テキストセクションの塗りつぶしの色です。

[一般]>[正の値のラベル]

正の列のラベルに使用されるテキストです。

positive label.jpg

[一般]>[負の値のラベル]

負の列のラベルに使用されるテキストです。

negative label.jpg

[一般]>[正の位置] 正の列/行を最初に表示するか、最後に表示するかを決定します。
[一般]>[正/負の値の色] 正/負のテキストセクションの塗りつぶしの色です。


[一般]>[値のラベル] 値のラベルに使用されるテキストです。
[一般]>[真陽性の色] 真陽性の四分線の塗りつぶしの色です。
[一般]>[真陰性の色] 真陰性の四分線の塗りつぶしの色です。
[一般]>[偽陽性の色] 偽陽性の四分線の塗りつぶしの色です。
[一般]>[偽陰性の色] 偽陰性の四分線の塗りつぶしの色です。
[一般]>[境界線幅] 各セクションの周りの境界線幅です。 confusion border width.jpg
[一般]>[境界線の色] 各セクションの周りに作成される境界線の色です。

よくある質問

相関係数の計算にはどのような特定の方程式が使用されていますか? ピアソン相関係数が計算されます。 日本語