過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

久々に本を読む

覚え書き

このところ本を読む時間が取れないでいるですが,ちょうど今書いている本で統計学の初歩を書く必要が出てきたので,昨今はどういう切り口が好まれるのか参考にしようと,「高橋洋一(2018)『統計学超入門』,あさ出版」を読んでみました.統計学の初歩の初歩をこれ以上は噛み砕けないほどに懇切丁寧に解説したというだけあって,確かに易しく書かれてい流ようです.数式をあまり使わずに書かれた,読めばなんとなくわかった気にさせてくれる本は「ごまかし」だと言い切っているところに好感を持って読み始めたのですが...

数式を意識して避けているので,確かにズバリ数式は出てこないのですが,この手の本によくある言葉で数式もどきを示しているので,何が狙いかわかりません.順列や組み合わせ,あるいは標準偏差や正規分布といった既知の数学や統計学の繰り返しにも疲れてしまいます.超入門を読むのは向学心ある社会人のはずですが,今どき平均値や標準偏差を知らない人が本を読むとは思えません.

せっかくなのでブログねたに書評を書こうと思っていたのですが,読み進めていくうちに,色々と首をかしげる点が目に付きます.例えば,P65で正規分布を前提としてグラフの形状を説明しているのですが,グラフの頂点を中央値と呼ぶのは,少なくとも初心者が読む本では間違いを招きかねません.確かに正規分布では最頻値(頂点)は中央にくるわけですが.それと,中心極限定理の説明,間違ってますよね?そんなこんなで時間をかけて読む価値はないと判断し,最後まで10分で目を通した程度なので書評は差し控えます.

著者が冒頭で白状しているように,編集者に口述筆記させた原稿を修正して書いたそうなので,クオリティが低いのは仕方ないのかもしれません.何しろ東大の数学科出身で統数研の非常勤研究をした経歴をお持ちの方なので,こんなはずはないと思いたいです.池上さんの本といいメディアに露出している有名人の書いた本は要注意ですね.統計学を解説した1章から4章まで100ページ足らずの本ですから,このスペースで統計学を解説することの難しさを改めて思い知った次第です.それに比べて今のところの予定では,統計学のために割り当てられるスペースは20ページほどしかありません.ここに統計学を詰め込もうとするのは無謀なのかもしれません.あくまでもJMPの本なのでしかtないですね.ユーザーが補足的に学べるような内容にしたいなとは考えているので,書ける範囲で書くつもりです.

この本で一番得たところは,TVの視聴率調査が6900世帯を対象に行われているという記述でした.私はセミナーで視聴率調査の話をするのですが,そのとき関東地区で600世帯と説明していました.もしかしたら間違えているかもしれないと,調べたら,確かにビデオリサーチは1997年から関東地区の600世帯,約1800人を対象としていたのは間違いないようです.それが2016年に関東地区で900世帯(因みに関西,名古屋の2地区で600世帯,それ以外の地区は200世帯)に増えたようです.何れにしても日本の5800万世帯のサンプリングとしては小さい割合であることに変わりはありませんが,セミナーで間違ったことを言ってしまったようです.

対象世帯数を増やすだけでなく,録画機を使ったタイムシフトなどの視聴方法の多様化や単身世帯の増加という環境の変化に対応したサンプリングに改良することで,予測精度を向上させたいそうです.これらのPM調査だけでなく,他の調査方法も開発しているとか.PMっていうのはPeople Meterの略で,米国で開発された調査世帯のテレビに設置する計測器のことです.調べたら,昔の記事がありました.
個人メータ視聴率調査システム実験に入る
個人メータ視聴率調査システム実験に入る | テレビ | VR Digest plus データでイマを読み解く

忙しい最中にこういう本に当たるとがっかりしますが,気を取り直してこれから「谷本雄治(2018)『テントウムシ大作戦』,汐文社」を読みます.

それではまた.

統計的問題解決研究所

コメント