本文へスキップ
ブクドリ | BOOK DRIP
戻る

『「原因と結果」の経済学』中室牧子さん・津川友介さん|そのデータ、原因じゃなくてただの偶然かも

AI・テクノロジー
約7分で読めます

「メタボ健診を受ければ長生きできる」。 「テレビを見せると子どもの学力が下がる」。 「偏差値の高い大学に行けば収入が上がる」。

どれも、なんとなく正しい気がします。でも本書を読むと、3つとも科学的に否定されていることがわかります。

私たちが日々目にする「AをすればBになる」の多くは、原因と結果の関係ではありません。ただ連動して動いているだけの「相関関係」です。この2つを見分ける技術が、本書のテーマである因果推論です。

こんな人におすすめ

数式は一切出てきません。医療と教育という身近な話だけで、計量経済学の最先端まで連れて行ってくれる、入門の入門です。

この本の核心――分析できることと、読み解けることは違う

著者の中室牧子さんは教育経済学者、津川友介さんは医師であり医療政策学者です。お二人がそろって警告するのは、ビッグデータの時代だからこそ生まれた落とし穴です。

誰でもデータを集めて分析できるようになりました。でも、出てきた数字を正しく解釈するスキルは、分析スキルとはまったく別物です。

ここで使い分けたいのが、次の2つです。

因果関係 一方が原因となって、もう一方が結果として生じた状態。原因をもう一度起こせば、同じ結果が得られます。

相関関係 2つが連動して動いているように見えるけれど、原因と結果の関係にはない状態。一見原因に見えるものをもう一度起こしても、期待する結果は得られません。

著者はこう書いています。

多くの人がこれらの問いにイエスと答えてしまうのは、「因果関係」と「相関関係」を混同しているからである。

混同したまま行動すると、効果がないどころか、お金も時間も無駄になります。だから著者は、因果推論は氾濫時代に必須の教養だと言い切ります。

因果かどうかを疑う、3つのチェックポイント

データに関係が見えたとき、それが本当の因果関係なのかを確かめる方法があります。次の3つを順番に疑うことです。

1. まったくの偶然ではないか

無関係な2つが、たまたま似た動きをすることがあります。これを見せかけの相関と呼びます。米軍の情報アナリスト、タイラー・ヴィーゲンは、「ニコラス・ケイジの年間映画出演本数」と「プールの溺死者数」がきれいに連動するグラフを作って見せました。日本でも、ジブリ映画がテレビ放映されるとアメリカの株価が下がる「ジブリの呪い」が話題になりました。どちらも、ただの偶然です。

2. 第3の変数(交絡因子)はないか

原因と結果の両方に影響する、隠れた要因のことです。「体力がある子どもは学力が高い」というデータを見て、全児童にマラソンを義務づけても学力は上がりません。背後には「教育熱心な親」がいて、その親が運動も勉強もさせているだけだからです。

3. 逆の因果関係はないか

原因だと思っていたものが、実は結果かもしれません。「警察官が多い地域は犯罪が多い」のは、警察官が犯罪を生んだのではなく、犯罪が多い地域だから警察官が配置されたという逆向きの関係です。

この3つがどれも否定できて初めて、因果関係を疑ってよい段階に進みます。

すべての手法の根っこにある「反事実」

因果を証明するために本書が立てる、最も大事な概念が反事実です。「もし、あのときやらなかったら、どうなっていたか」という、実際には起こらなかった「たられば」のことです。

ある人がテレビを見せなかったら子どもが有名大学に受かった、という体験談があったとします。これだけでは因果はわかりません。「テレビを見せなかった結果(事実)」と、「もしその子にテレビを見せていた結果(反事実)」を比べる必要があるからです。

でも、同じ人で「やった」と「やらなかった」を同時に観測することはできません。著者はこれを因果推論における根本問題と呼びます。

「因果推論における根本問題」を克服し、反事実を作り出すことこそが、因果推論に基づくさまざまな手法の根幹である。

そこで使うのが、比較可能なグループです。原因の有無以外、結果に影響しそうな条件がそっくりな2グループを用意できれば、片方を反事実の代わりにできます。本書で紹介される手法は、すべてこの「比較可能なグループをどう作るか」の工夫だと考えると、一本の線でつながります。

因果に迫る6つの手法――エビデンスには階層がある

本書の中心は、信頼度の高い順に並ぶ6つの手法です。著者はこれをエビデンス・ピラミッドという階層で整理しています。

1. ランダム化比較試験(RCT)――因果推論の理想形

対象をくじ引きでランダムに介入群と対照群に分けます。ランダムなので2グループは比較可能になり、人の選択による偏り(セレクション・バイアス)も消えます。デンマークの実験では、30〜60歳の男女を介入群約1万2000人と対照群約4万8000人に分けて10年追跡しました。結果、メタボ健診を受けても死亡率に差はありませんでした。日本のメタボ健診には2008〜2014年で約1200億円もの税金が投じられています。ビジネスのA/Bテストは、この手法そのものです。

2. 自然実験――あとから実験のような状況を見つける

人為的な実験ができなくても、観察データの中から実験に近い状況を探します。津川さんたちは、患者をランダムに担当するホスピタリスト(入院患者専門の内科医)に注目し、100万人以上のデータを分析しました。すると女性医師が担当した患者のほうが、30日死亡率が0.4%低いとわかりました。この0.4%は、アメリカが10年かけて下げた死亡率とほぼ同水準です。

3. 差の差分析――自然な変化(トレンド)を引き算する

施策のある側とない側で、それぞれの前後の変化を比べ、その差をさらに引き算します。日本の研究では、認可保育所を増やしても母親の就業率は上がらないとわかりました。祖父母などの私的な保育から、保育所へ乗り換えが起きただけだったのです。デビッド・カードらの研究では、最低賃金を上げても雇用は減らず、企業はコスト増を価格に転嫁して対応していました。

4. 操作変数法――原因にだけ効く変数を使う

結果には直接影響しないが、原因には影響する変数を利用します。スタンフォード大学のマシュー・ゲンコウらは、1948〜52年にテレビ放送免許が凍結された歴史を操作変数に使いました。結果、幼少期にテレビを見ていた子どものほうが、入学後の学力テストの偏差値が0.02高かったのです。テレビは学力を下げるどころか、わずかに上げていました。

5. 回帰不連続デザイン――カットオフ前後のジャンプに注目

合格ラインのような恣意的な基準の、すぐ上とすぐ下を比べます。ヨシュア・アングリストらは、エリート高校にぎりぎり受かった生徒と落ちた生徒を比較しました。学力の高い友人に囲まれても、自分の学力はほとんど変わりませんでした。いわゆるピア効果は見られなかったのです。重岡仁さんは、70歳で医療費の自己負担が3割から1割に下がる制度に注目し、外来患者は10.3%増えるが死亡率は変わらないことを示しました。

6. マッチング法――似た者同士のペアを作る

複数の条件を1つの得点(プロペンシティ・スコア)にまとめ、よく似た人同士を比べます。アラン・クルーガーらは、同じ大学に合格して進学先だけが違った人を比較しました。結果、偏差値の高い大学に行っても将来の収入は上がりませんでした。潜在能力の高い人が偏差値の高い大学を選んでいるという相関関係があるだけだったのです。

ピラミッドの上ほど信頼度が高く、複数のRCTをまとめたメタアナリシスが最上位に立ちます。逆に、自分に都合のいい論文だけ拾うチェリー・ピッキングは戒められます。ただし著者は、最強のRCTでさえ費用や倫理の問題があり、特定の集団でしか検証していないために他へ当てはまるとは限らない外的妥当性の弱さがある、という限界も補論で正直に認めています。

明日から何を変えるか

1. ニュースや通説に、3つの質問をぶつける

「AすればBになる」を見たら、すぐ信じずに「偶然では?」「隠れた第3の要因は?」「逆の因果では?」と3問自問します。健康法も教育法も、これだけで距離が取れます。

2. 前後比較で喜ぶのをやめる

「去年より売上が上がった、キャンペーンのおかげだ」は危険です。市場全体の好景気や、極端な数字の後に平均へ戻る動き(平均への回帰)かもしれません。比較対象、つまり反事実が適切かを問う習慣をつけます。

3. 全社展開の前に、まず小さくA/Bテスト

効果が不確かな施策をいきなり全体に広げず、一部でランダムに分けて検証します。多少のコストはかかっても、無駄打ちを避けられます。

おわりに

本書を読んで一番効くのは、手法の名前を覚えることではありません。「もし、やらなかったらどうなっていたか」を想像する癖がつくことです。

成功者のサクセスストーリーも、事実の部分しか見せてくれません。反事実、つまりその人がそれをやらなかった世界は、誰にもわかりません。だからこそ、安易に真似をする前に立ち止まれます。

数字に強くなるとは、計算が速いことではなく、数字に騙されないことなのだと、この本は教えてくれます。


合わせて読みたい

【コラム#17】数字が苦手な人ほど、数字に騙される──データの「読み方」が判断を変える3つの視点 本書が示す「相関と因果の混同」は、まさに数字の読み方の話。データの数字をどう解釈すれば判断を誤らないか、その視点をさらに広げられます。

学歴が高い人ほど、詐欺に引っかかりやすい 頭が良くても思考の罠にはまる、という話。本書の「3つのチェックポイント」を知っても、信じたい説だけ通してしまう人間の弱さに通じます。

情報が多いほど、判断を間違える データが大量にあっても解釈スキルがなければ意味がない、という本書の警告と響き合います。情報量と判断の質は比例しない理由を知れます。


この記事をシェア:

関連記事

前の記事
藤野英人『投資バカの思考法』が教える、「動かない」ことが最大のリスクになる時代の生き抜き方
次の記事
『最大化の超習慣』堀江貴文さん|長期目標は、ただの足かせである