1. TOP
  2. お役立ち情報
  3. 今日からはじめるExcelデータ分析!第1回平均値・中央値・最頻値って なに?

今日からはじめるExcelデータ分析!
第1回
平均値・中央値・最頻値って なに?

今日からはじめるExcelデータ分析!第1回平均値・中央値・最頻値って なに?

普段の仕事の中で目にするさまざまな数字やデータ、、その数字の意味、本当に理解できていますか?

ビジネスの現場ではデータをもとに今後の方向性を決めたり、企画を立てたりすることがよくあります。統計学やデータ分析について専門的な知識がなくても、ふだんの業務で「最近この商品の売り上げが伸びているから追加生産しよう」や、「毎年10月には気温が下がるから冬物を仕入れておこう」など、データや経験則をもとにものごとを決定する機会は多いのではないでしょうか。

「データ分析」と聞くと、「統計学の知識が必要なんでしょ、、」「複雑な計算式や専用のツールができないと分析なんてできないよ」と思われがちですが、実は普段の業務でよく使われているExcelで簡単にデータ分析ができます!難しい計算はExcelがやってくれるので、まずは目の前にあるデータから何を知りたいか、このデータでどんな問題を解決したいか考えてみましょう。

この記事では、専門的な知識がなくてもできる簡単なデータ分析方法を全3回にわたってご紹介します。第1回目は、データの特徴を表す値としてよく用いられる「平均値」「中央値」「最頻値」についてみていきます。
今仕事で扱っているデータを思い浮かべながら「あ、この方法を使えばこんなことが解決できそう」と想像しながら気軽に読んでみてください。

データの特徴を表す3つの代表値

先ほど挙げた3つの値は「代表値」と呼ばれ、データの中心的な値、標準となる値としてみることができます。それぞれどのような値かご存じでしょうか。Excelでの求め方と合わせてみてみましょう。

平均値

全データの平均となる値です。昨年との比較や他のデータとの比較ができます。
合計をデータの個数で割って求めます。Excelでは「AVERAGE(アベレージ)関数」を使用します。

平均値

中央値

全データの中心に位置する値です。データの数値を昇順(または降順)に並び替えて、ちょうど中心にくる値をとります。もしもデータの個数が偶数の場合は中心の2つの値の平均値が中央値になります。
Excelの「MEDIAN(メジアン)関数」を使って求められます。

中央値

最頻値

データの中でもっとも個数が多い(頻繁に現れる)値です。
Excelの「MODE.SNGL(モード・シングル)関数」を使って求められます。

最頻値

これらの3つの値はどれもデータの特徴を表す値ですが、それぞれ定義や求め方が異なり、当然結果も変わってきます。ここで大事なことは「このデータでどんな問題を解決したいか」を考えて代表値を使うことです。

次に、例を挙げて代表値の使い分けを考えてみます。

求める値でデータの印象がガラッと変わる?!

ある運送会社のA支店では所有している配達トラックが古くなってきたので新しいトラックに買い換えたいと思っています。そこで、B支店と比較をして古いトラックが多いことをアピールし、上層部に交渉することにしました。データを見るとどちらの支店も10年以上使用しているトラックが6台あり、特にA支店の方が古いトラックを使っているようには見えません。

トラック使用年数

では、このデータをどのような切り口で分析すればA支店は古いトラックが多いことがアピールできるでしょうか。まずはトラックの使用年数の「平均値」を出してみます。

トラックの使用年数の「平均値」

A支店は「8.3」、B支店は「8.5」になりました。これでは、「A支店が所有しているトラックはB支店より使用年数が短い」という印象になってしまいます。これでは交渉のアピールポイントにはなりません。

では、次に「中央値」を求めてみます。

トラックの使用年数の「中央値」

A支店は「9」、B支店は「7」となりました。これは所有しているトラック15台のうち中心に位置する値です。A支店のトラックは半数が9年以上使用しているということがわかります。先ほどの「平均」の数値より古いトラックが多いことがアピールできそうです。

もうひとつ、「最頻値」も求めてみましょう。
これはどの使用年数のトラックを一番所有しているかがわかります。

トラックの使用年数の「最頻値」

A支店は「6」、B支店は「5」となりました。この数値もアピールに使えそうです。

中央値と最頻値では、A支店のトラックの方が使用年数が古いことがわかったのに、なぜ平均値ではB支店の方が古いトラックが多いと出てしまったのでしょうか?実は平均値にはある「落とし穴」があったのです。

平均値の「落とし穴」

もう一度、それぞれのトラックの使用年数をみてみましょう。すると、B支店の一番新しいトラックの使用年数が5年なのに対して、A支店は使用年数1年のトラックを1台持っていました。この「1」という数字が全体の平均値を下げていたのです。

平均値の「落とし穴」

データ上で極端に小さい値や大きい値のことを「外れ値」と呼び、平均値はこの外れ値の影響を受けやすくなっています。平均値も間違った値ではありませんが、今回のケースであれば「トラックの使用年数が古いことをアピールして新しいトラックに買い換える」ことが目的なので、交渉の際には「中央値」と「最頻値」を用いてアピールすればいいことがわかりました。

最後に、、、

いかがでしたか?切り口によってデータの印象が変わっておもしろいですよね。このように、データをどのような目的で使用するかによってさまざまな分析方法を使い分ける必要があります。今回はデータ分析の本当の入り口として3つの代表値についてご紹介しました。この3つを知っているだけでも、自分がデータを使うときだけでなく誰かが作成したデータが本当に正しく分析されているのかを見極めることができるようになります。

Winスクールには、ビジネスの現場で扱うさまざまなデータをExcelを使って分析する手法と、データや数値を正しく理解するための統計に関する知識が学べる「Excelビジネスデータ分析」という講座があります!今回ご紹介した3つの代表値についてもさらに詳しく学ぶことができますので、もし興味を持っていただけたら一度「無料カウンセリング・受講相談」または「電話・オンライン説明会」にご参加ください。

BIツールで精度の高いデータ分析を実現

BIツールは企業内に蓄積される膨大なデータから必要な情報を抽出して、経営状況や売り上げの分析を行い、レポートを制作するためのツールです。さまざまなBIツールがある中でも「Power BI Desktop」はMicrosoft社製のBIツールで、ExcelなどのOffice製品との連携やノーコードでプログラミングすることなくデータ分析を行い、わかりやすいレポートが作成できることで、急激に注目度が高まっています。

分析したデータを効果的に利用したい方、さまざまな視点からデータを分析したい方、いつもデータの表現方法に迷ってしまう方はぜひPower BI Desktopを使ってみませんか?

Power BI Desktop講座

分析結果を可視化!そのままプレゼンでも使える「Power BI Desktop」

Microsoft社製のBIツール「Power BI Desktop」を使い、Excelから抽出したデータの分析とグラフによる効果的なレポート作成の手法…

関連記事