見聞

統計学を学んでみたくなった

document 見聞

ごきげんよう、二深すうちです。
私は今、開発現場のPMO(一部PM)業務をしています。
未経験でIT業界に転職して、夢にまで見ていた開発現場に足を踏み入れられてうれしいです。

毎日複数案件を渡り歩きながらお仕事をしているのですが、もっと良くならないかな、もっと楽にならないかな、ということを毎日のように考えています。
そして、性格上アイディアはそれなりに頭に浮かんでは来るのですが、結局そのアイディアは直感でしかなくて根拠がないワケです。
どうすれば根拠を持って提案できるかを考えたときに、「データを扱える人」になりたくなりました。
そこで思いついたのが「統計学を勉強してみよう」となったわけです。

まず始めの一歩として、「統計学が最強の学問である」を読んでみました。

本記事は「統計学が最強の学問である」の第一章を二深すうちワールドでお話ししていきたいと思います。

統計学って最強の学問なの?

まず私はこの「統計学が最強の学問である」を選んだ理由は、単純にChatGPTに勧められたからです笑

そのあと、Amazonの口コミも読みまして、「まずは1冊読んでみよう。」の気持ちで手に取りました。

私としては、タイトルを見て純粋に「統計学って最強なの?」と半信半疑になりました。
「なになに?私、最強になっちゃうの?」なんて、そんなミーハーな気持ちも湧き上がりつつ。

統計学が必須となると予言されていた?

「統計学が最強の学問である」の一章の冒頭に”H・G・ウェルズ”が登場します。
正直存じ上げなかったのですが、調べると1800年中盤から1900年中盤に活躍されていた方で、タイムマシンですとか、透明人間ですとか、サイエンスフィクションを広めた方だそうです。
純粋にそんな古くからタイムマシンとか透明人間ていう概念?が爆誕していたことに驚きました。

そんなH・G・ウェルズさんが「統計的思考(statistical thinking)は、将来、読み書きの能力と同じくらい、優れた市民にとって不可欠なスキルになるだろう」と1903年に予言していたそうです。

1903年(明治36年)は、世界ではライト兄弟が世界で初めて飛行機(ガソリンエンジン・プロペラ)を飛ばすことに成功し、日本では品川〜新橋間で東京初の民営路面電車(通称「チンチン電車」)が運行を開始した頃だそうですよ。

今の時代から見ると「科学が発展し始めたのかな。」くらいの時代に感じてしまいますが、その頃から”統計的思考が必須スキルになるであろう”と予言されていたのですね。どれだけ先の未来を見ていたのでしょうかね。

そして100年後、私たちは彼が予言した通りの岐路に立たされているようです。

たった6%の売り上げで60億の増加。なるほど、BIが流行るわけですね

皆さんは、ダイレクトメールというものを送られてきた経験はおありですか?

私は会社の仕事のメールは全て開封しないと気が済まないたちなのですが(もちろん攻撃メールは別ですが)、個人のプライベートのメールはPRメールやダイレクトメールでパンパンに占領されており、うんざりしています。未開封1万件越え。本当にうんざり。

このように、いくら送ってもむしろ迷惑に思うユーザーがいれば、逆にそのダイレクトメールにより購買されるユーザーもいるわけです。
著者は送った方がいい顧客・送らなくてもいい顧客を最適化したことにより、ある小売業者の売り上げを6%上げることに成功したそうです。その企業の6%はなんと60億。いやはやすごい。

この統計学をビジネス領域に応用することを「BI(ビジネスインテリジェンス)」と呼ぶそうです。
はい、IPAの試験に出てきました。BIをうまく活用すると、売れる人に売ることができ、無駄なコストをかけず、こんなに売り上げが増加するなら、皆喉から手が出るほど欲しがりますね。そりゃ流行るわけです。

最速で最善の答えを出す統計学

皆さんは何かを決定する際、どんな風に決定をしますか?

そうですね、では従業員の満足度を上げる対策を打ちましょう。
そのために従業員にアンケートも取ったのです。「給料が低い」とか「認めてもらえている気がしない」とか色々な内容がありました。
そして最終的には上司が優秀な人にプレゼントをあげることにしました。ハハ、誰が喜ぶんでしょうね。
案の定、従業員はスン・・・とします。「あのアンケートは何だったのか」と思った方もいたでしょう(過去の実話です笑)。

さあ、今回は従業員がスンとするか、退職するかということで済みますが、絶対に間違った決定をしてはいけない場合が存在します。人の命が関わるような場合です。

19世紀のロンドンでコレラ(当時は原因不明な疫病)に対して、史上初めて統計学の力を使って万単位の人命を救うことになります。

当時は科学者や医者などのすごい人たちが、「街がゴミや排泄物で臭いから消臭しよう!」と消臭剤を爆誕させたり、「汚物を片付けよう、よし、川に流そう!」と川に汚物を流すなどを行いました。結果、もっと人が亡くなることになります。すごい人たちが考えたすごい作戦が敗北するのですね。

そんな中、ジョン・スノウが登場します。
大変申し訳ございません、私、この方のことも存じ上げません。この方、外科医でなおかつ「疫学の父」の異名を持つ方のようです。

彼はコレラが発生している地域で環境を観察したり、コレラにかかった人と、そうでない人の違いを比べ、仮説を立て、データを集め、発症した人とそうでない人の違いがどの程度確かなものかを検証しました。
結果としては、上流から水を採取している水道会社と下流から採取している水道会社のどちらの水を飲んでいるかがコレラの発症と関連が見つかり、「下流から採取している水道会社の水を飲むな」と提案したところ、使用をやめた町はコレラの感染が止まったそうです。

さあ、皆さん、ちょっと前にすごい人たちが「汚物を片付けよう、よし、川に流そう!」と川に汚物を流しましたね。これのせいで下流から採取している水道会社の水を飲んだ人たちはさらに亡くなる結果となっていたのです。

のちにコレラは水中に生息するもの、コレラ患者の排泄物に含まれること、コレラが含まれている水を飲むと感染することが証明されます。

まあ、当時はジョン・スノウさんの提案は「科学的ではない」「確実な証拠がない」と学会や政府からはのけられてしまったそうなのですが(そもそもすごい人たちの作戦だって科学的でも確実な証拠もないくせにね。)。

これは、「統計学によって最速でかつ最善の答えを導き出した」確かなエピソードであり、
同時に、「人の勘やセンスだけで決めたことがいかに危ういか」を示すエピソードでもあります。

さらにのちに、ジョン・スノウさんが提唱した「疫学」の考え方は広がっていきます。
その結果、「がんになりたくなければたばこを控える」「心臓病対策には血圧を下げる」という、今の時代では多くの人が知っていそうな知識が生まれました。
しかし当時は、そうしたことが自明ではなく、「たばこは本当に悪いのか」「血圧が高いのはダメなのか」と、すごい人たちが知恵を絞って、あーでもないこーでもないと議論していたそうです。

そんな中で疫学が示したのは、「悪いか良いかは一旦どうでもいい。とりあえずやめろ。とりあえず下げろ」という、極めて実務的な判断でした。

この考え方により、人類の寿命は大きく伸びたと言われています。

エビデンスは?ってよく聞きますよね

近年では「エビデンスは?」や「ソースは?」という言葉をよく聞きます。

ところで、現代医療で最も重要な考え方の一つに「EBM(Evidence-Based Medicine)」、日本語で「科学的根拠に基づく医療」があります。
この「科学的根拠」の中でも、特に重視されるものの一つが「妥当な方法によって得られた統計データと、その分析結果」だそうです。
ジョン・スノウさんの「データと統計解析に基づいて最善の判断を下そう」という考え方は、100年という時間をかけて、医療の世界で欠くことのできないものになったそうです。

EBMが世界的に広まったのは1992年とのことです。それ以前から医師としてのキャリアを積んでいた人たちは、学生時代にこの考え方を学んでいなかったそうです。
それでも現在の医療では、統計学的なエビデンスが最重要であることは間違いありません。新薬の認可や保険適用などは、綿密に計画された研究と、適切な統計解析がなければ、厚生労働省に認めてもらえません。

そしてこのエビデンスという考え方は、教育にも活かされていくようです。
著者曰く、近年のアメリカの教育学界ではエビデンスの重要性が叫ばれ、エビデンスに基づいた教育方法の評価が行われているようです。
日本だと塾とかは有名大学出身の先生とかでアピールしますよね。
でも人それぞれ特性が違う中、有名大学出身の先生が教えてくれたからその人まで成績が上がるかって不明ですよね。聴覚がいいのか視覚がいいのかとかで物事の覚え方違うから・・・。
本来、「誰が教えるか」より「どんな条件で、どんな人に効果があったか」を見る必要があると思うんですよね、教育学界で統計学が取り入れられるのも納得です。

そしてさらに教育だけではなく、スポーツにも統計学が活かされており、データ分析により勝利を引き寄せるというような試みがされているそうです。「セイバーメトリクス」というらしいですよ。野球にも明るくないのでさっぱりなのですが。

他にも、経済学の分野では「経済成長が起こるかどうか」には「技術の進歩」が重要であることが分かってきたそうです。
さらに、教育レベルや、技術開発による利益が開発者に適切に配分される制度が整っているかどうかも重要で、逆に天然資源の有無は必ずしも関係していないことが明らかになったといいます。
(こうした結果を見ると、日本では研究者への投資は十分なのだろうか、と考えさせられます。)

ここまで医学、教育、スポーツ、経済とみてきましたが、ほとんどすべての学問に関わる学者は統計学を使わざるを得ない時代がすでに訪れていることが分かります。そして私たちも統計リテラシーさえあれば自分のカン以上の判断を、自分の人生に活かしやすくなるわけです。

ITと統計学がご結婚?

著者が小タイトルに「ITと統計学の素晴らしき結婚」とタイトルをつけていらっしゃるので、その方向性を引用させていただいてます。
ここでは結婚とは?は議論はしません笑

この記事にたどり着いた方の多くは、最近、統計学に興味を持たれたのではないでしょうか。
実は私は一時期、論文を紹介する動画や本をよく見ていました。
そうした内容に触れていく中で、どの分野の研究であっても、統計が欠かせない存在であることは頭の隅では感じていたんですね。
ですが、そんなにすごいものだったら、1992年までEBMが登場しないのって不思議ではありませんか?

結論としましては、ITの進化により、「データ収集・分析」が「簡単・爆速」になったわけです。
今までデータを収集するのは途方もなかったわけです。
1948年に「フラミンガム研究」という疫学研究が立ち上がりました。
ぜひ本書を読んで楽しんでいただきたいのですが、当時は調査が2年に1回で、5000人に検査と聞き取り調査を行ったそうです。大手企業なら従業員で5000人くらいいそうですが、2年に1回の健康診断のようなイメージですね。
なぜ2年に1回の頻度だったかと言いますと、データ入力・管理・集計がギリギリだったのですね。使用できる設備は大型のパンチカードシステムのみだったそうです。

皆さん、パンチカードシステムってご存じですか?紙に物理的に穴をあけてその位置にデータを記録する仕組みです。
この紙に5000人の生活習慣についての回答や血液検査の結果を手書きで記録したのちにパンチカードに記録しなおし、間違っていないかチェックし、そのあとに調査項目の平均値や割合などを集計するわけです。途方もなさすぎます。

その後、約10年後の1960年代にIBMが大型の汎用計算機を作り利用可能になって、やっと10年分の調査データを人の手ではなく計算機で分析できるようになるのです。

それ以降は私たちが知っているITの進歩により、パンチカードでのデータ入力は画面に簡単に入力できるようになり、データも簡単に送りたい相手にインターネットで送れるようになります。

昔の統計学は数式を理解し手計算で分析する形でしたが、今は統計解析のためのプログラムを書いたり、統計解析ツールを操作すれば、ある程度大きなデータを実際に分析することも可能になったわけです。

おしゃれな流行の言葉、ビッグデータ

「おしゃれ」自体は私がつけました。著者はそこまでおっしゃっていないです。
しかし私は「今はビックデータの時代だよ。」「え?ビックデータ知らないの?」的な言葉尻は、流行に敏感な彼彼女らのマストアイテムのような響きを感じるので「おしゃれ」とつけてみました。

冗談はさておき、「ビッグデータ」という言葉は、それなりに昨今聞き慣れた言葉だと思います。
ITの目まぐるしい進化によりあらゆる記録が電子化されて情報が蓄えられる時代となりました。
今までは紙作業を電子へ!と、ひたすらアナログ作業が電子化へ移動したわけですが、電子化が終わった後、今度は何で儲けていこうか。と考えていくわけですね。そしてこの大量の情報のデータを何とかいい感じに使ってサービスを提供できないかと考えていくわけです。著者曰く「統計解析」という言葉では地味で魅力的ではないので「ビッグデータ」や「ビジネスインテリジェンス」という言葉を生み出し着飾ったのではないかと書かれています。
言葉が違うだけでなんと魅力的な言葉になるのでしょうか。巷にもあふれてますよね、そういう言葉。
オタクから推し活へ、援助交際がパパ活へ、出会い系からマッチングアプリへ。
(言葉が変わるだけで、ずいぶん印象は変わるものですね。ブラックすぎますかね?)

またもや脱線しましたね。
しかし、さらに昨今流行っているテクノロジー分野として
・データマイニング/機械学習/人工知能/自然言語処理
・ビジネスインテリジェンス/競争分析
・分析/統計/ウェブ分析/A/Bテスト/統計解析
ここら辺が流行っているわけですが、名前は違っていても、全て統計が下敷きにあるようです。

統計学はこれからのセクシーな職業になるらしい

Googleのチーフ・エコノミストでいらっしゃるハル・ヴァリアン博士が2009年に論文誌で語ったそうです。
「私はこれからの10年で最もセクシーな職業は統計家だろうって言い続けているんだ。」と。

本書の初版が2013年なので、2009年の発言は当時としてはホットな話題です。
ただ、2025年、間もなく2026年になる今、「あれ、もう10年経ってない?」と少し思ってしまいました。
それでも、素敵な言葉ですよね。
(※英語での「セクシー」は「イケている」「魅力的」といった意味で使われることが多く、日本語の意味とは少し異なります)

著者もこの発言をとても光栄に受け取っているようで、統計学のすばらしさを力強く、そして楽しそうに語ってくれています。ぜひ本書で読んでみてください。

私としては、統計学が「セクシー(イケてる・魅力的)な職業」かどうかは正直分かりません。
ただ、自分のアイディアや発想を、確かな根拠をもって説明できる力が身につくのであれば、それはとてもかっこいいことだと思います。
自信をもって人生を豊かにする挑戦ができるなら、やらない手はないですよね。

こんなに素敵なことを勉強しようと思った自分が好きである

今回「統計学が最強の学問である」の第一章を自分なりにまとめたわけですが、
いわゆる序章部分なので実際にスキルが身についたわけではございません。
しかし、ワクワクが止まらないのです。
これからどんな面白いこと、時には分からないことに出くわすのかと思いますが、それでもこの序章が見せてくれた「自分自身の世界が明るくなる可能性」がなんと強烈に心を震わせてくれるのでしょうか。
お仕事でも情報と数字を見つめているので、お仕事がやりやすくなることは勿論ですが、世界の不思議を解き明かすことのできる魔法を手に入れられるのかもしれません。
そんなものに出会えた自分が最高に幸福であります。

次回は第二章を自分なりにまとめてみようと思います。

コメント

タイトルとURLをコピーしました