新入社員が教えるExcelでもできる分析手法、相関分析ってなに!?

Writer:Saito (22.08.25)

こんにちは!2022年度入社の新入社員、齋藤です!
私は現在、統計分析のお仕事をしています。前回は、「基本統計量」についてお話しました。

前回の記事はこちら

「基本統計量」では、データの特徴が簡単に分かります。

データ分析ツールには、もう一つ、データの特徴を見るためによく使われる分析手法があるんです。それこそが「相関分析」!!簡単なのに発見が多く、いろんな統計分析手法のベースに採用されたり、ビッグデータの分析に使用されたりと、活躍の場が多い手法です。

今回は「相関分析」についてお話ししていきます。

便利な分析手法、相関分析!!

相関分析とは、「2つのデータの関係性を表す相関係数を計算して求める分析手法」のことです。データの関係性を調べることで、関係性を再確認できたり、意外な関係性を発見できたりします。相関係数は、-1から1で表せます。相関係数の絶対値が大きいほど、関係性が大きいといえます。
(例:相関係数『0.2』と相関係数『-0.6』では後者がより関係性が大きい。)

相関分析は、データの特徴を簡単に把握できるため、よく使われる手法です。私もデータの関係性を知りたい時じゃなくても、とりあえず相関分析をします。

Excelで相関分析する前に!!
Excelで相関分析するには、「データ分析」という機能を使います。デフォルトでは表示されていないので表示されていない場合は、前回の記事をご覧ください。

データを用意します。持っているデータでもいいですし、今回はExcelデータを用意しましたのでダウンロードして使ってみてください。

先ほどのファイルを開くとsheet1に学生の成績データが入っています。6科目5段階評価の成績データです。

データ分析ツールの「相関」を選択します。

するとこのような画面が表示されます。

ここでセルを選択します。数字データ全てを含むように選択します。このとき、数字と一緒に『国語、数学…』の項目名も選択した上で、ウィンドウ中から『先頭行をラベルとして使用』にチェックを入れておくと、結果がより見やすくなります。

データは隣接していないと分析できないので注意してください。

相関係数って?どこからが相関が認められるの?

相関分析を実行するとこのような、結果が出ます。-1に近づけば近づくほど、負の相関が認められ、1に近づけば近づくほど正の相関が認められます。

R(絶対値) 意味
0 相関なし
0<r<0.2 ほとんど相関なし
0.2<r<0.4 低い相関あり
0.4<r<0.7 相関あり
0.7<r<1.0 高い相関あり
1.0 完全な相関

実際に相関が認められる値の基準は表の通りです。
今回の分析結果で、認められた相関は

  • 国語 社会 (0.50)
  • 数学 理科 (0.59)

この2点です。
これにより、

  • 国語の成績が高い時、社会の成績が高い時が多い。
  • 数学の成績が高い時、理科の成績が高い時が多い。

ということがわかります。

しかし、相関分析には欠点があります。例えば先のデータからは、「国語の成績が高い時、社会の成績が高い時が多い」という可能性を読み解くことができましたが、もしかしたらこれは「社会の成績が高い時、国語の成績が高い時が多い」のかもしれません。相関分析だけではこれを判別することができません。

そこで、「因果関係」という値で分析を補完します。因果関係の調べ方は次回紹介します。

今回は「相関分析」についてまとめてみました。Excelの相関分析機能は、総当たりで一気に分析してくれる点と、他のプログラミング言語で分析して結果を出すよりも見やすい表にしてくれることから、相関分析だからという理由にとどまらず重宝します。

次回以降は、因果関係がわかる「回帰分析」について掘り下げていこうと思いますので楽しみにしていただけると嬉しいです。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。
大学・企業のデータの活用方法がわからない、見やすいデータにしたい、効果的なデータ分析をして運営に活かしたいなど、現在の状況に合わせたご提案をさせていただきますので、是非ご相談ください。

コラム執筆中

アイビーネットでは、マーケティングなど様々なテーマでコラムを随時執筆中です。

コラム カテゴリ