入門「統計」のお部屋

わかりやすく「統計」についてお話します。

【統計ニュース】中国の新型肺炎(コロナウイルス)の発症者数について考えてみる

中国の新型肺炎

 ニュースで大騒ぎになってますね。中国の新型肺炎

 私達も他人事ではありませんので、今日はこのニュースについて解説してみます。

新型肺炎 上海や広東省でも疑い 武漢の患者1700人以上の推計も」

FNN.jpプライムオンライン

www.fnn.jp

 

 この記事では主に「患者1700人以上の推計」の意味合いについてわかりやすく解説してみます。

 その前にまずは、、

武漢市についてザックリおさらい

 「患者1700人以上の推計」について説明する前に、武漢市についてまずはザックリとおさらい。

 恥ずかしながら私も名前を聞いたことがあるなー程度でしたが、いやいやものすごい大都市! 

ja.wikipedia.org

 Wikipediaから抜粋すると

https://upload.wikimedia.org/wikipedia/commons/thumb/e/ea/Wuhan_Xibeihu_Area_Panorama%282017%29.jpg/1409px-Wuhan_Xibeihu_Area_Panorama%282017%29.jpg  

ということで、ガッツリ大都市!ニュースで「海鮮市場からかも?」とあったので、古風な町を想像していましたが、まるっきり逆でした。

 人口が多くて産業も発展しており、人の出入りも多いことから世界的に警戒しているわけですね。

 人の出入りに関して、武漢の空港である「武漢天河国際空港」は、全国8大ハブ空港の一つで、国際線旅客数 262.6万人(2017年)とのこと*1

 新千歳空港272万726人(2016年)と同規模のようです*2

 ちなみに日本最大の成田空港は3,535万人らしい*3。これはさすがですね。。

 

ということで本題へ。

推計1700人ってどのくらい?

 ソースはこれっぽい。

https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/news--wuhan-coronavirus/

 インペリアルカレッジロンドンというイギリスの名門大学。

 ちなみにこの論文の筆頭は日本人名。すごい!

 

 タイトルと要約を翻訳すると、

Estimating the potential total number of novel Coronavirus cases in Wuhan City, China

We estimate that a total of 1,723 cases of 2019-nCoV in Wuhan City (95% CI: 427 – 4,471) had onset of symptoms by 12th January 2020 (the last reported onset date of any case).

  • 武漢市での2019年新型コロナウイルスは2020年1月12日までに合計1,723症例(95%信頼区間:427-4,471症例)発症したと推定されます(全ての症例のうち、最後に報告された発症日)。

といったところ。

 

 気になる発症数は1,723症例(95%信頼区間:427-4,471症例)でしたね。

 1,723症例出ている!わけじゃなくて、427~4,471症例の間に本当の値がありそうだ!ということです。

 

427~4,471症例の間に本当の値がありそうだ!って?

 これは統計をかじった人でも理解していない人が多いので、ここで知っておくとこういうニュースの見通しがとても良くなります。

 この区間のことは「95%信頼区間といいます。

 この意味合いとしては

  • 100回同じ試験をして信頼区間を出したら(100個の信頼区間があれば)、その区間内に、真の値が存在する確率が95%

ということです。

 

 えぇ、回りくどいですね。。

 今回の例でいうと、「427-4,471」という幅が得られています。この幅を100回出したら95回はその幅の中に本当の数字があるよーということ。

 

 もういっそのこと簡単にしてしまおう!

 とすると「発症者数はだいたい427~4,471だ!」ということです。

推定の幅が広くてあんまり意味がない?

 いえいえ、使い方次第です。

 幅が広ければそれはそれで、元となる情報が少ないんだなと。

 元となる情報が少ない場合は安全側で考えておくのがベター。

 そうすると、この区間(範囲)内で一番上の4,471人いると考えてみよう。

 

 ・・・おぉ、たくさん出てるね。

 しかも今は中国は春節(正月)休み。

 日本にもどんどん観光客が来ている。

 

まとめ

 このウイルスの発症者数の見積もりはまだ正確にできない=情報が少ない。

 一方、中国は春節(正月)休みで日本にも観光客がどんどん来ている。

 よって、なるだけですが、中国の人が好きそうな観光地は避けたりした方がいいかも。

 

 まぁ人から人への感染はまだ確定してないし、致死率もまじでやばかったSARSなどに比べると低いものの、高齢者や体力が落ちている方は特に注意した方が良さそう。

 

 

最後に、そもそもの話

 例えばなにか気になるニュースがあった場合に、

  • そのニュースが本当なのか?
  • 違った見方ができないか?
  • 危ないとしたらどのくらい危ないのか?

といったことを、データを使ってサッと確認できると便利。

 データで確認なんて毎回やっていられない!と感じられるかもしれませんが、慣れてくると、ちょっと見ただけで「違和感」を感じ取れるようになります。

「違和感」のあるお話は、眉につばをつけて読んで(聞いて)、必要に応じて自分で確認するというサイクル。

 もちろん仕事でも役立ちます。「データをロジカルに分析して定量的に結論を出すというスキル」があれば、

  • 給料やボーナスが増える
  • 圧倒的短時間で成果が出る
  • みんなから一目置かれ、頼りにされる

など、メリットしかありません。

 このブログでは、こういった統計的なお話をドンドンしていきたいと思いますのでぜひお読み頂けますと幸いです。

 知りたいことがもしあれば、ここのコメントに記載頂いてもいいですし、下のアドレスからメールにてご質問頂いてもご回答させて頂きますので良かったらぜひ。今ならキャンペーンでプレゼントもご用意しています。

 

キンドル本と動画セミナープレゼント

メルマガではブログでは非公開の情報を公開中です。更に知りたい場合は登録してください。

詳しくはこちら

f:id:kohei327:20191002002342j:plain

キンドルで発売中のこちらの本もプレゼント中!