新入社員が教える統計、Excelでできるって本当!?データ分析ツールの使い方

Writer:Saito (22.07.21)

こんにちは!新入社員、齋藤です!
私は現在、統計分析のお仕事をしています。前回は、統計の「標準偏差」と「分散」についてご紹介しました。

前回の記事はこちら

今回は、少し実用的なExcelで簡単に分析ができる「データ分析ツール」の話をしていきたいと思います。

この「データ分析ツール」には、分散分析や相関分析、基本統計量などいろんな分析手法が盛り込まれています。その紹介もするのでぜひ最後までご覧ください!

データ分析ツールの導入方法!

今回は、「分析ツール」の中の「データ分析ツール」を使用します。

デフォルトでは、「データ分析ツール」が表示されていないことの方が多いです。表示されていない場合のために、表示の仕方から紹介していきます。
画像中の右側のように未導入であれば、まずは表示の設定から行いましょう。

データ分析ツールはホームタブにもあります。別物なので注意!

  1. まずデータタブを開きます。
  2. 分析ツールをクリックすると、アドインのウィンドウが表示されます。
  3. 「Solver Add-In」と「分析ツール」の両方をチェックし、OKをクリックすれば完了です。

データ分析ツールでできること

Excelのデータ分析ツールでは、多くの分析手法があり、特別な関数やコードを書く必要が基本的にはありません。
相関やヒストグラムなどの分析もデータを選択するだけで求められますし、グラフを出力してくれるツールもあります。大変な分析でもパッとできちゃうのが魅力です。

できる分析は以下の19種類です。

  • 分散分析:一元配置
  • 分散分析:繰り返しのある二元配置
  • 分散分析:繰り返しのない二元配置
  • 相関
  • 共分散
  • 基本統計量
  • 指数平滑
  • F検定:2標本を使った分散の検定
  • フーリエ解析
  • ヒストグラム
  • 移動平均
  • 乱数発生
  • 順位と百分位数
  • 回帰分析
  • サンプリング
  • t検定:一対の標本による平均の検定
  • t検定:等分散を仮定した2標本による検定
  • t検定:分散が等しくないと仮定した2標本による検定
  • z検定:2標本による平均の検定

データ分析ツールできる分析!おすすめ実用性高い分析3選!!

Microsoftの分析ツールの使い方ページ

…専門用語が多いですね。これらを一見してピンとくるのは、おそらく普段から分析に携わっている人に限られると思います。そして、よく使われるものからマイナーなものまであります。
今回は、IR業務で実用性が高いと思う3つをピックアップして紹介していきます!

1.相関分析

2つの測定変数が一緒に変化する傾向があるかどうかを調べることができる分析です。例えば、テストの点数で言う数学の点数が高い時、理科の点数が高いことが多い!!身長が高い時、体重も重い!!
このようなデータが取れます。ちなみにCORREL関数を使って相関係数を求めることもできます。しかし、量が多いと大変なので、一括で何項目も比較したい時はデータ分析ツールの方がおすすめです。

2.基本統計量

基本統計量とは、以前紹介した平均値や標準偏差などを同時に求めてくれるツールです。データの基本的な特徴を表す値を調べる時に使います。
こちらの使い方や値の見方については次回紹介します。

3.回帰分析

回帰分析とは、目的変数に予測変数がどれだけの影響を与えるのかを予測する分析です。例えば、英語のテストの点数が高いのは、個人の英語力が高いからだ!!体重が重いのは、身長が高いことが影響している!
このようなデータが取れます。回帰分析と言っても種類はたくさんあるのですが、Excelでは、単回帰分析と重回帰分析ができます。

Topic! データ分析ツールの弱点!?Excelで手軽にできるからこその罠が。
ここまで最強と言ってきたデータ分析ツールですが、実は弱点が何点かあります。「ちょっと分析したいなー。」という時はExcelで事足りるのですが、「本格的に分析を利用していきたい」という時にはちょっと使いづらい点があるんです。
    1. 19種類以外の分析はできません!

      あらかじめ用意してある19種類の分析以外はできません。例えば、因子分析だとか主成分分析、クラスター分析などはできないんです。
    2. データの行が多すぎると動きません!

      私も一度やったことがあるのですが、70万行25列のデータを分析はさすがにフリーズしました。数十万行のデータになると、Excelも辛いみたいです。ちなみに関数で実行したとしても、PCのスペックによってはフリーズすることも…
    3. 元データの数字を変更したいときは分析結果を出し直さないといけない!

      例えば関数で実行した場合、元のデータを変更すれば勝手に結果も変更されます。データ分析ツールを使う時は、その都度データを読み込んで結果を出力しているので元データをいじった場合出力し直し!ということが起きるんです。

今回は主に「データ分析ツール」についてまとめてみました。データ分析ツールは、ツール側が想定している分析手法であればたった数秒でやってくれる便利なツールです。だからこそ、メリットとデメリットを理解して使わなくてはいけません。実際、私が統計分析をするときはExcelだけでなく複数の分析ツールを利用する場合の方が多いです。と言いつつも、やはりExcelの「データ分析ツール」にはツールを利用した分析の第一歩に適した手軽さがあって素敵ですね。

次回以降は、今回紹介した分析手法を掘り下げていこうと思いますので楽しみにしていただけると嬉しいです。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。

当社では、大学の学生情報や成績情報、アンケート情報を使用して、可視化や統計分析をしています。
大学・企業のデータの活用方法がわからない、見やすいデータにしたい、効果的なデータ分析をして運営に活かしたいなど、現在の状況に合わせたご提案をさせていただきますので、是非ご相談ください。

コラム執筆中

アイビーネットでは、大学IR・統計分析に関するコラムを随時執筆中です。