新入社員が教えるExcelでもできる分析手法、回帰分析ってなに!?【重回帰分析編part1】

Writer:Saito (22.10.19)

こんにちは!2022年度入社の新入社員、齋藤です!
私は現在、統計分析のお仕事をしています。前回は、「単回帰分析」についてお話ししていきました。

前回の記事はこちら

回帰分析の中でも、今回は「重回帰分析」について紹介していきます。
今回は、重回帰分析の方法や、実行する際の注意点など、Excelのデータ分析ツールを使用して解説していきます。

単回帰分析と重回帰分析の違いとは?

単回帰分析は説明変数が1つであることに対して、重回帰分析は説明変数を複数持っています。前回の記事にも掲載したように、以下の式で表すことができます。

Y = a1X1 + a2X2 + a3X3 +… b

Y = 目的変数
X1、X2、X3 = 説明変数
a1、a2、a3 = 定数
b = 切片

重回帰分析は複数の説明変数の使用時にいくつかルールがあるため、単回帰分析と比較するとより注意が必要になります。

重回帰分析で注意すべき点!よくある失敗パターンとは?

重回帰分析は単回帰分析と同じ要領で実行できます。先述したように、重回帰分析は主に説明変数の使用時等にいくらか注意が必要です。よくある失敗パターンを紹介したいと思います。

①説明変数が多すぎる!!

説明変数は多すぎると分析精度の低下に繋がります。統計家の中でも、約7個におさまると良いという意見もあれば、標本数を15で割った数までが良いとも言われています。説明変数の数に絶対的な答えはありませんが、説明変数はなるべく少ない方が良いです。

②説明変数同士に強い相関がある!!

この場合、分析はできますがその精度は落ちてしまいます。Y = a1 X1 + a2 X2 + a3 X3 +… b(a:定数、b:切片)の関係が崩れてしまうことが原因です。

③調べたい項目、目的を持って分析をしていない!!

回帰分析は「目的が明瞭でない状態でひとまず分析をする」という扱いでは効力を発揮できません。例えば学生向けアンケート調査の場合は、「なぜ学生満足度が低下したのか」「なぜ生徒の成績が上がったのか」といった目的を持って分析に臨みましょう。

実際に重回帰分析してみよう!!

Excelで回帰分析する前に!!
Excelで回帰分析するには、「データ分析」という機能を使います。こちらは以前の記事に表示方法を紹介しているので、デフォルトでは表示されていないので表示されていない場合は、以前の記事をご覧ください。

データを用意します。持っているデータでもいいですし、今回はExcelデータを用意しましたのでダウンロードして使ってみてください。

今回は国語のテストに影響を与えているものを調査します。「漢字小テストの点数」とアンケートによる「一日の勉強時間」「一日の読書時間」の調査結果を使用します。

目的変数:国語のテスト
説明変数:漢字小テストの点数、一日の勉強時間(分)、一日の読書時間(分)

重回帰分析の前に、先に説明した失敗を避けるためにも事前準備をしましょう。説明変数同士に強い相関がないことを相関分析でもって確認します。今回はこのような結果になりました。強い相関は認められませんので、この係数で大丈夫そうですね。

では、重回帰分析をやっていきます。

データ分析ツールの「回帰分析」を選択します。

するとこのような画面が表示されます。ここでセルを選択します。入力Y範囲が目的変数、入力X範囲が説明変数です。

重回帰分析の時は説明変数全てがこちらの画像のように隣接している必要がありますので、ご自身のデータを使用する際にはご注意ください。

数字データ全てを含むように選択します。このとき、数字と一緒に項目名も選択した上で、ウィンドウ中から『先頭行をラベルとして使用』にチェックを入れておくと、結果がより見やすくなります。

画像のような結果が出ましたでしょうか。
(前回同様、結果を見やすくするために一部編集を行なっています。)

今回はひとまず、重回帰分析の失敗例を踏まないよう意識しつつ、単回帰分析との操作の違いを体感できればOKです。
分析結果の見方については、前回省いた点も含めて次回で解説を行います。楽しみにしていただけると嬉しいです。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。
大学・企業のデータの活用方法がわからない、見やすいデータにしたい、効果的なデータ分析をして運営に活かしたいなど、現在の状況に合わせたご提案をさせていただきますので、是非ご相談ください。

コラム執筆中

アイビーネットでは、大学IR・統計分析に関するコラムを随時執筆中です。