過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

見習うべきは台湾ではないか?

JMP

Amzonでは,日常必需品の発送を優先しているとかで,先日,岩波新書編集部がTweetされてましたけど,書籍のような生活必需品でないものの在庫切れが目立ってきているようです.拙著も,現在両方とも在庫切れになっていて,『統計的問題解決入門』の方は,しばらく前から入荷時期未定になっていました.絶版になったわけではなく,実は,目出度く第3刷が増刷されたばかりなのです.流通が止まっている今は仕方ありませんね.連休中に勉強したいという方は,オーム社の直販を利用してくださいとのことです.第二刷では色々修正入れましたが,今回は大きな修正はありません.とはいえ,何点か変更した箇所もありますので,そのうちこの場でお知らせいたします.

さて,今週は,先週の続きとしてAppleのMobility Trends Reportsを使って各国の比較をしてみたいと思います.


最初に,データはAppleの特設サイトからCSVをダウンロードしてください.ここでは4月23日付けのデータを使います.先週と同じ手順でテータテーブルを作成してください.今回は,「国ごとの比較」という目的が明確なのでデータの層別化を先に実施します.具体的には「taransition_type_」の「walking」と 「geo_type_」の「country/region」のみ 取り出します.「transit」は欠けている国が多いので「walking」のみを対象としました.「driving」の方が外れ値が少ないのですが,国によって道路事情がかなり違うので,人間の活動の基本である「walking」を対象としました.何れにしても,「driving」もほぼ同じ挙動を示しているので問題はないと判断しています.更に,今回は国同士を比較したいので,「geo_type_」の「country/region」のみを抜き出します.

そのためには「データフィルタ」で「geo_type_」と「taransition_type_」を選択して『追加』し,それぞれ「walking」「country/region」をcontrolキーを押しながら選択します.(Macではcommandキーを押します.)そして,サブセットとして別テーブルにすると63行のテーブルができるはずです.そこから「geo_type_」列と「taransition_type_」列は削除しても構いませんが,後日そのデータを見たときに,「geo_type_」と「taransition_type_」とが固定されていることがわかるように,「非表示,除外」しておく方が無難です.次に,先週と同じように「列の積み重ね」で全ての日にちの列を積み重ねます.「region」列には国の名前が入っているので,更にこれを基準として分割します.これで分析できるデーブルになりました.この次に何をやりますか?

実は答えはありません.とにかく色々やるのが一番なのですが,自分の好きな「データ分析の周回コース」を確立しておくといいです.このデータでは,変数の正体がわかっているし,それぞれの分布はそれほど重要ではないので,いきなり多変量解析に着手してもいいと思います.因みにヒストグラムを描けば,個々の国のMobilityの度数がダブルピークとして観察できます.私の場合は,先ずは「多変量の相関」でしょうか.その上で「相関のクラスタリング」で大まかに多変量間の相関を見ます.

どの国も活動量が時間経過とともに下がってきているという傾向は同じなので,この図のようにそれぞれはほぼ正の相関を示します.その中でも他と状況が異なっている国々が白っぽく表示されています.因みに,この図では「カラーテーマ」を「発散」の「寒色>暖色」に変更しています.完全相関の場合の色が「JMP標準』よりも濃いので,おそらく色弱の方にはこの方が見やすいはずです.

試しに,「主成分分析」もやってみますが,やはり全体の傾向が同じなので,第一主成分のパワーが大きく(84.4%)なります.この図に示した4カ国が他と挙動が大多数の国と異なっています.日本は,対多数の中に埋もれてしまっていますが,青い矢印で示したように,第一,第二主成分の平面には乗らずやはり,少し異なった挙動と示しています.成分3が日本らしさになっているようですが,これが何を意味するのか..

主成分分析では,何かありそうだと直観的に感じれば十分です.この違いを後続する分析で確認していきます.例えば「階層型クラスター分析」はとてもわかりやすい手法です.そのためには,今のテーブルを「転置」する必要があります.それには『転置する列』に全ての国を,『ラベル』に「日付」を割り当てて『OK』です.クラスター分析の設定は,すぐ分かると思いますので省略します.デフォルトではクラスターは7つに分割されますので,赤三角から「クラスターの保存」をしておきます.「クラスターの色分け」もしておきましょうか.

非常に特徴的な国が見つかりましたか?因みにそれぞれのクラスターの平均の「Mobility」を折れ線グラフで描いたのが冒頭のグラフです.このグラフを参考にして,各クラスターの特徴を上げていきます.

クラスター1(対岸の火事だったのが,飛び火して現在もロックダウン継続中)
代表国はフランス,イタリア,この中には,ほぼ収束に向かっているニュージーランドもあります.

クラスター2 (やはり対岸の火事と思ったか,えらい活動的だったのが数日の間に活動停止の事態に.現在もロックダウン継続中)
代表国はスペイン.

クラスター3 (早くから活動停止で延焼を阻止,現在も継続中)
ここには,香港,韓国,シンガポールの3つの国しかありません.いずれの国もうまくやっていると評価されていますが,シンガポールでは外国人労働者の感染が増えて再度感染が数増えている状況です.何れにしても,うまくやってこれたのは早い段階から活動を抑えたことに加え,これらの国では日本ではできない人権侵害が功を奏したとも言えます.それを恐れた精神的なロックダウンの影響がこのクラスターのMobilityに出ているのではないでしょうか.日本の法体制のもとではこれらの国を手本にすることはできません.

クラスター4(大丈夫なの?完全に活動停止中.)
マカオは異彩を放っていますね.メディアがどこどこどこの国をお手本にすべきとか言ってますが,マカオこそコロナ対策では最もうまくいっている国です.おそらく,中国という国を良く知っているからこそ早い段階で対策ができたのだろうと思っています.ただ,人口も高々70万足らずの国で,産業構造も全く異なるので日本が手本とするのは難しいところです.

クラスター5と6(対岸の火事が飛び火して活動を下げていったけど,徐々に活動開始に向かっている.)
似ているので5と6はまとめましたが,代表国はクラスター6がロシア,オーストラリア,6がアメリカ,イギリス,ドイツといった国々です.イギリスは当初から集団免疫に言及していましたし,スウェーデンもこの戦略です.この先どうなっていきますでしょうか.

クラスター7(何考えてんだ?)
ここには日本と台湾しかないですが,基本的に活動量はあまり急激には下がっていません.台湾はうまくやっていると思っていたので意外でしたが,やはり中国という国を良く知っているので早い段階で独自の対策を立てられたのかなと.因みに日本と台湾を比べるとこんな感じです.

日本は三連休中日をピークとするMobolityの増加が特徴的ですね.気が緩んだとか言われてますが,通常の週末とは変わりません.むしろ,その前後で周期が乱れていることに特徴があります.おそらく外出自粛要請を予期した,買い物に出かけた人々の影響でしょうか.日本は災害が多いこともあって,どうも私たちはアワアワしすぎのような気がします.この点,台湾は周期が乱れていないのが見事です.3月28日のピークが少しシフトしてますが,おそらく翌日の青年節(旧革命先烈紀念日)の影響でしょうか.私たち日本も台湾を見習ってもっと冷静に行動すべきではないか.そう思いましたけれど,皆さんならこのデータをどう考察しますか?機会があれば,同じデータを前にJMPユーザーでオンラインミーティングもしたいですね.

もちろん,これは現時点での結果です.時間経過とともにまた別のクラスターを形成するはずです.今後の成り行きをデータをもとに注視していきたいと思います.

それではまた.

統計的問題解決研究所

コメント