入門「統計」のお部屋

わかりやすく「統計」についてお話します。

【統計】nの意味、Nの意味

 今回は、統計に関してよく質問される内容から一つシェア。

 n数(エヌすう)について。

 

 マーケティングの世界や、工学、科学、医療、社会科学の世界で「N数/n数(エヌ数)」はよく出てきます。

 大学の時には私もあまり触れなかった言葉でしたが、就職した瞬間毎日のように飛び交っていて驚いた記憶があります。

 でも同じ「エヌ数」という言葉に2種類ある!ということに気づいたのは、少し経ってからでした。

 

 一度読んで理解いただければ、一生忘れないと思いますのでぜひどうぞ。

 また、初めて見聞きする方はそういうもんかと頭の片隅に置いておいて下さいませ。

 

<目次>

 

結論:N数、n数とは

まず結論からいくと、

  • N:母集団のサイズ
  • n:サンプルサイズ

です!

 

 平たくいうと、対象とする集団の大きさ(一般的な感覚の言葉でいうと数)と、そこから抽出する標本の大きさ(同左)です。

 例としてテレビの視聴率調査を挙げると、関東180万世帯の視聴率を、わずか900世帯の視聴率で推測されているようです

*1

 この例では、

  • N=180[万世帯]
  • n=900[世帯]

ですね。

 

 ものすごいざっくり言うと「全体がN、抜き取りがn」とイメージしてもらってもいいのかと思います。

 

 ここで世の中の大半の人が誤解している話をひとつ。

 一瞬複雑になりますが、すぐに繋がるのでお付き合いを。

 

なぜサイズという?サンプル数との違いは?

 上のN数、n数に一つ追加します。

  • N:母集団のサイズ
  • k:サンプル数
  • n:サンプルサイズ

 ここでフルーツの平均サイズ(直径)を調べる調査をするとしましょう。

 Nは例えば年間生産数としましょう。調べるだけ。決める必要はなし。

 kは調査対象のフルーツの種類。りんご、メロン、スイカならサンプル数k=3。

青りんごのイラストメロンのイラスト(フルーツ)すいかのイラスト「丸々すいかとカットすいか」

 

 nは各フルーツをいくつ調査するか。例えばそれぞれ100個ずつ調べるとすると、n=100。

 

 普通はnを「サンプル数」っていいたくなっちゃうかと思います*2

 

 ・・・えぇ、サイズ(大きさ)ってピンと来てませんでしたよね。

 これは英語に由来しており、

  • N:母集団のサイズ←Population size
  • k:サンプル数  ←The number of samples
  • n:サンプルサイズ←Sample size

という言葉が由来です。

 何かを調査する時に、グループを意識して、グループ数=サンプル数、グループごとの数、、、と言わず、「大きさ」が、サンプルサイズです!

 

 やっているうちに慣れるので、最初はフルーツの直径調査の例で覚えて下さい。

 もしくはこの名著タイトルを覚えて、これで計算できるのは採取するサンプルの「サイズ」、やな、という覚え方でもいいかと思います。

 

サンプルサイズの決め方 (統計ライブラリー)

サンプルサイズの決め方 (統計ライブラリー)

  • 作者:永田 靖
  • 出版社/メーカー: 朝倉書店
  • 発売日: 2003/09/28
  • メディア: 単行本(ソフトカバー)
 

 

 フルーツの例ではnを100とかしれっと書きましたが、統計的に適切に決めるにはお作法があり、それを書いたおそらく唯一の本がこの本らしいです*3

 

なぜ分けるのか

 ちょっと複雑でしたが、N、nと新しく出てきたk。

 この3つの使い分けは 致命的に重要です。

 下記のような問いを先に明らかにしておかないとデータ処理の段階でグダグダになり収集つかなくなります。

  • どのような集団を想定しているのか、
  • その集団からどのような標本(サンプル数を含めて)を抽出するのか
  • その標本はどの程度のサイズにすればそもそもの母集団の状態を予測するのに必要十分か
  • これらをコスト対効果やそもそもの実現可能性、使える期間やリソースなどを勘案して決める*4

 正直、初めてNknに触れた人にはピンと来ないかもしれません、一旦「使い分けるんだ!」という気合でもいいと思います。

 イメージはアイドルを調べにいくのに、どんなアイドルかよくわからずいくみたいな話かもしれません。

まず何をするのか

 このお話を腹落ちして頂き、息を吸って履くように使って頂くために、一つ例題をば。

例題)

 世界各国の身長調査。N、k、nを定義して下さい。

答え)

 引用へどうぞ→*5

まとめ

 仕事で使う時や、ニュースで見る時に小さくNとかnとか書いていたりしますが、Nは母集団のサイズ、nはサンプルサイズです。一般的な感覚で言う「サンプル数」はkと表され別の概念であることに注意。フルーツで言う種類ですね。 

そもそもの話

 なにか気になるニュースがあった場合に、

  • そのニュースが本当なのか?
  • 違った見方ができないか?
  • 危ないとしたらどのくらい危ないのか?

といったことを、データを使ってサッと確認できると便利。

 データで確認なんて毎回やっていられない!と感じられるかもしれませんが、慣れてくると、ちょっと見ただけで「違和感」を感じ取れるようになります。

「違和感」のあるお話は、眉につばをつけて読んで(聞いて)、必要に応じて自分で確認するというサイクル。

 もちろん仕事でも役立ちます。「データをロジカルに分析して定量的に結論を出すというスキル」があれば、

  • 給料やボーナスが増える
  • 圧倒的短時間で成果が出る
  • みんなから一目置かれ、頼りにされる

など、メリットしかありません。

 このブログではこういった統計的なお話をドンドンしていきたいと思いますのでぜひお読み頂けますと幸いです。

 知りたいことがもしあれば、ここのコメントに記載頂いてもいいですし、下のアドレスからメールにてご質問頂いてもご回答させて頂きますので良かったらぜひ。今ならキャンペーンでプレゼントもご用意しています。

 

キンドル本と動画セミナープレゼント

メルマガではブログでは非公開の情報を公開中です。更に知りたい場合は登録してください。

詳しくはこちら

f:id:kohei327:20191002002342j:plain

キンドルで発売中のこちらの本もプレゼント中!

 

 

 

*1:https://www.videor.co.jp/digestplus/tv/2016/05/697.html

*2:告白すると私も言っているときがあります。懺悔。。

*3:といくつかのレビューに書いてありました。確かに分かりやすいので取り組む際にはオススメ。値段が力強いですが価値あり。

*4:ここがいつも揉めます、はい。

*5: 対象国の人口がN、対象国数がk、各国から調査する人数がn。