過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

大統領選挙の話(予測は難しい)

統計リテラシー

つい最近も予測は難しいって書いた気がするけど,最近ニュースを読む度にそのことを思い起こす.つい最近も,アメリカの大統領選挙で,圧倒的にトランプが劣勢という予測結果が報道されてたけど,よくみたら出所はあの538(Five Thirty Eight)だった.538というのはアメリカの大統領選挙の選挙人団の人数なんだけど,この名前からわかるようにルーツは大統領選挙の予測サイトがルーツだった.前回の選挙で大はずれして消滅したかと思ってたけど,まだあるんだね.最新の予測では538人の選挙人のうち356人をバイデンが獲得する見通しとのことで,トランプ大敗なんだけど,さてどうなるんだろ?

因みに,これは前回の大統領選の直前の予測.

2016 Election Forecast | FiveThirtyEight
Nate Silver's predictions and polling data for the 2016 presidential election between Hillary Clinton and Donald Trump

選挙予測というのは,形勢が時とともに変化するダイナミックな予測だけど,多くの場合は時間の経過とともに精度は高まっていくはず.例えば,台風の進路がそう.蓋を開ければ,上記のようにヒラリーが227に対してトランプが304人だった.過半数が270人だから,僅差というわけでもなかった.この事実は何を意味しているかというと,どれだけお金をかけてデータを集めても,高度な統計手法を用いても,予測は難しいんだということです.

日本でも内閣支持率とか選挙の予測とかやってるけど,RDD方式のアンケート調査でせいぜいサンプルサイズも1000人程度だけど,アメリカの大統領選挙の予測ともなると,かけるリソースがけた違いになる.昔住んでいたところがバージニア州のManassasという都市で,ワシントンにほど近いプリンスウィリアム郡の中に位置しているんだけど(正確にはManassas市は独立市として行政機関は郡に属してない),ホワイトハウスの高級官僚の住む街というのが近くに(と言っても車で20分はかかったけど),あった.彼,彼女らの豪邸はみのもんたの豪邸が可愛らしく思えるくらいだった.たとえばこのお宅は6ベッドルームだから,このあたりでは小さいほうだと思う.売りに出てて,邸内外の写真を見ることができるからご参考まで.

この街だけじゃなくてその周囲には政府関係者がたくさん住んでいた.我が家のお隣さんもインド人だったけど,ワシントンに通う政府の役人だと聞いた.役人でも上の人ともなると,選挙で大統領が変わるとごそっと入れ替わるから,街によっては住民も入れ替わると不動産屋が言ってた.街の様子も変わるらしいけど,ちょうどその期間はクリントン政権だったから体験はしていないんだよね.あのころのアメリカは平和だった.

アメリカにとって大統領選挙がいかにビックイベントなのかということはわかるし,それだけにお金をかけて予測する価値があるわけなんだね.だけど,そもそもこの手のアンケート調査って,サンプルが独立じゃないよね.そのことはどう考えてるんだろう?最新の予測結果を見て,考えが変わる人が出てきてもおかしくない.立候補してるほうだって,形勢不利とわかれば,そこから追い上げに懸命になるかも.日本では判官びいきというやっかいな国民感情もあって,選挙の予測なんて意味ないからやめちまえと思ってます.常々選挙はオプトアウトにすべきと思っていて,このことは今度書きます.

356は,あのセイバーメトリックスで有名なネイト・シルバー(統計学者というよりは統計を使うジャーナリストといったほうが正確かな)が立ち上げただけに,確かに予測手法の説明を見ると多くの要素が考慮されていることがわかる.手法は洗練されているのは間違いないけど,どんなにお金をかけてもコイン投げで予測するのとたいして違わないんじゃあね.

日本の総理大臣を予測するほうがまだ難しいよね.少なくとも二択じゃないし.ブログには政治のことは書かないようにしてるけど,前の総理大臣が辞任するとき,次は麻生太郎じゃないかと予想してました.それはなぜかというと,彼は日本のチャーチルと呼ばれた吉田茂の孫だから.戦後に内閣総理大臣を退任した後で再登板した例は,吉田茂と安倍晋三だけという歴史が頭にあったろうと思ったからだけど,外れました.安倍総理の在任が長すぎてその気が失せたのかも.

閑話休題.

さて,データには金をかけてるし,手法も様々な効果も考慮している.なのに,なぜ前回は大はずれしたのか?隠れトランプが大勢いたからだって,言い訳してるみたいだけど,それってデータに信頼性がないってことだけど?今回も状況は全く同じだけど?隠れトランプを含めての予測できなきゃ意味ない.おそらくアンケートに「あなたは誰に投票しますか?」なんてダイレクトに問うてはいけなくて,好きなジャンクフードを選ばせるくらいにしないとだめだと思う.ようするに,まずは平均的なアメリカ人像をモデリングしないとね.

大胆にもトランプ勝利の予測もあって,すいません流れてきた情報なのでソースを辿れないのだけど,ようするにGoogleで”Trump Biden”と”Biden Trump”とをGoogle Trendsで比較した結果が根拠らしい.ちょっと古いけど「ゴジラ対キングギドラ」のように前に正義の味方がくるのと同じですね.深層心理が検索キーに表出するというのは十分あり得ると思います.それでその結果がこちら.

Google トレンド
Google トレンドでは、「"Biden Trump", "Trump Biden"」の検索インタレストを時間別、地域別、人気度別に調べることができます

前回は大外れだったし,ネイト・シルバーが今回は11月3日をどういう気持ちで向かるんだろうとか興味あります.苦労してたてたモデルの汎化力が問われるわけで,正直にいうけど,実験計画を指導していて,こういう状況に遭遇すること珍しくないです.再現実験の結果が信頼区間を外れるとがっくりきます.まあ,そこからが勝負なのが実験計画だし,腕の見せ所でもあるんだけど.

再現実験の結果もそうだけど,実験計画のデータをモデリングするときもドキドキするよね.期待を込めて「モデルのあてはめ」の設定画面で『実行』ボタンをクリックするとき,何か気合のようなものを入れたりしてます.「どうだ」って心の中で叫んでる.そういえば設定画面には『OK』もあるけど,この場合は『実行』が相応しい.(英語では『Run』だけど.)実験計画のデータであれば,その心配はないけど,通常の多変量データだったりすると,「特異性の詳細」レポートが一番上にあるときが一番ガックリくるよね.これも実験計画が好きな理由の一つなんだなぁ.

つまんないことを書いてしまったけど,それではまた.

統計的問題解決研究所

コメント

  1. ぱわーぱふ より:

    すごい豪邸ですね!内装もすごいし、プールに滝があるなんて。最後の方に別の家が載っているのは離れでしょうか?????それにしては離れているし、大きいですよね。アメリカの貧富の差は日本の比ではないって聞きますが、なるほどです〜。

    • Tad より:

      こんにちは.リンク先ご覧になったんですね.全部は見てなかったので気付きませんでしたけど,これはおそらく馬小屋です.厩舎と言ったほうがいいのかな?あの広い芝生で乗馬するなんて夢のような世界ですよね.

  2. ぱわーぱふ より:

    馬…実家よりきれいで大きいと思っていたので何だかショックです!アメリカのお金持ちはケタが違うと思ったら違ったのは次元でしたみたいな…