「平均42℃」なのに凍えた——データに騙されないための、たった一つの武器

平均値だけ見て旅行先を決めたら、水風呂に入らされた。その理不尽さの正体が「標準偏差」です。数式ゼロ、でも本質100%。読み終わったら、会議のデータが怖くなくなります。
統計学
温泉
作者

DeepFlow

公開

2026年4月24日

旅行サイトには「平均42℃、快適な湯加減」とあった。
いざ入ってみたら——20℃の水風呂だった。

パンフレットは嘘をついていない。でも、真実も語っていなかった
この理不尽さの正体を知れば、データを見る目が根本から変わります。

もちろん嘘の話です。そんなサイトあるわけがない。しかし、少なからず、平均値には騙されやすいのが私たちです。

実は、データに騙される経験は、誰もが日常的にしています。 会議室の売上報告、学校のテストの平均点、ダイエット食品の「平均-3kg」という広告。これらのほとんどは、「平均値」という便利な数字で、不都合な真実を覆い隠しています。

ここで、お伝えしたいのは、そのカラクリを見抜くたった一つの武器——「標準偏差(バラツキ)」です。数式はゼロ。でも、読み終わった後には確実に世界の見え方が変わります。


1. 「平均42℃」の二つの実在しない温泉街——平均水温が同じでも、、

温泉旅行を計画しているとしましょう。候補は二つの温泉街。どちらのパンフレットにも同じ文字が目に入ります。

「源泉の平均水温:42℃(快適な湯加減)」

こんなパンプレット見たことないっと思ったあなた、もう少し話に付き合ってください。

さあ、どちらを選びますか? もし隠れた源泉データが下記のようでしたら、、、

🏔️ 温泉街 A「安定の湯」

1号泉 41.5℃
2号泉 42.0℃
3号泉 42.5℃
平均:42.0℃ ✅ どこに入っても快適

🎰 温泉街 B「運命の湯」

1号泉 20.0℃ 🥶 水風呂
2号泉 42.0℃ 😌 ちょうどいい
3号泉 64.0℃ 🔥 熱湯風呂
平均:42.0℃ ⚠️ でも2/3は「ハズレ」

平均は同じ42℃。でも、Bに行けば3分の2の確率で地獄を見ます。

パンフレットの数字は正確でした。でも、「平均値しか書かなかった」ことで、本当に大事な情報——データのバラツキ——は隠れてしまいました。


2. 「バラツキ」を一つの数字で表す——それが標準偏差

この「散らばり具合」を定量化したものが、標準偏差(英語では Standard Deviation、略して SD または σ(シグマ))です。

  • 標準偏差が小さい → データが平均の近くに集中している(=安定・予測しやすい)
  • 標準偏差が大きい → データが平均から大きく離れている(=不安定・リスクが高い)

二つの温泉街の「分布の形」を視覚化すると、その違いは一目でわかります。

データの分布の違い——A市 vs B市(どちらも平均42℃)

20℃ 42℃ 64℃ 平均 A市(σ小:安定) B市(σ大:バラツキ大) 🥶水風呂 🔥熱湯

青い山(A市)は42℃に集中。赤い山(B市)は同じ平均でも、両端に「外れ値」が多い。

A市の分布は42℃を中心に鋭く集まっています。B市は同じ平均でも、広くなだらかに広がり、端には水風呂と熱湯が潜んでいます。山の「とがり具合」が、標準偏差の大小を表しています。


3. 他の話で考えてみる

温泉の話はおいといて、「どう使うの?」

📊 会議室・月次レポート

上司が言う。「今月の1日平均売上は10万円でした」

——ちょっと待ってください。その「10万円」が、毎日コンスタントに稼いだ10万円なのか、 月末に大口契約が1件入って平均を押し上げただけなのかで、 会社の実態はまったく違います。

標準偏差が大きければ「たまたま」、小さければ「実力」。 「平均」の隣に「バラツキ」がなければ、その数字は半分しか語っていない。

🎓 テスト結果・偏差値の正体

平均点50点のテストで、あなたは60点を取った。

クラス全員が45〜55点に集まる「差がつかないテスト」(σ小)なら、 あなたの60点は圧倒的トップ。 でも、10点〜90点まで散らばるテスト(σ大)なら、 60点はごく平凡かもしれない。

実はこれ、「偏差値」の仕組みそのものです。 偏差値とは、標準偏差を使って「自分が全体のどこにいるか」を示した数字。 偏差値50=平均ちょうど。偏差値60=平均より標準偏差1個分上にいる、という意味です。


4. 計算はExcelに全部任せる——人間がやるのは「読む」だけ

「標準偏差の計算式が複雑そう……」という心配は無用です。現代では、この計算を人間がする理由はありません。

Excelでの計算(コピペするだけ)

=STDEV.P(A1:A10)

カッコ内にデータの範囲を入れるだけ。一瞬でσが出ます。

STDEV.Pはデータ全体が手元にある場合(母標準偏差)。 サンプルデータの場合は STDEV.S を使います。

計算は機械に任せて、人間がやるべきことは一つ。「この標準偏差の値を見て、何を意味するか判断する」——この読み解く力が、データリテラシーの本質です。


まとめ——「平均値+標準偏差」がデータを見る最小単位

平均だけでは足りない
同じ平均でも、バラツキが違えばリスクは天と地ほど違う

標準偏差を確認する
「平均○○」の隣に「σ(バラツキ)」がなければ、その数字は不完全

計算はExcelに任せる
STDEV.P() 一発。人間がやるのは「読み解くこと」だけ