過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

2019-02

覚え書き

システムを意識しよう

昨日のJMPer’s Meetingさ参加してくださった皆様.どうもありがとうございました.当日は花粉症の影響で喉の調子がよろしくなく,体調的にも今ひとつでしたが,多くの方にお会いできてとても有意義でした.さて,昨日もお話しした「DOEを成功させるためのヒント」について続けます.今週はその2として「システムを意識しよう」ということについて書きます.システムという言葉は,日本語ですとSEに代表されるようにコンピュータ関連の特にソフトウェアに限定して使われることが多いのですが,そもそもは系という訳が与えられている広範囲な概念をも意味します.例えば太陽系はソーラー・システムです.一企業の囲い込みを「...
統計学

DOEは必殺技

今年最初のJMPer's Meetingはいよいよ来週に迫りました.後半のジャパン・セミコンダクターの事例発表が実践編なので,私の担当する前半の基礎編で何をお話しようか今も考えているところです.「JMPerはDOEをやろうよ」ということからは外れない予定なのですが,割とアドリブで話してしまうタイプなので,聞いてくださる方の反応次第では脱線することはあるかもしれません.JMPer's Meetingは既に満席でキャンセル待ちとなっているのですが,ご興味あれば直接連絡ください. 先日SAS社から連絡ありまして,都合でキャンセルされた方から資料配布の予定はあるかとご質問いただいています.理由...
覚え書き

こぎれいなデータ(tidy data)

先週は「不正統計」という言葉に待ったをかけました.不正統計ではなく不法統計と呼ぶべきであると.もっと正確には,不法なデータサンプリングであって,そこに統計の誤用が合わさったということです.この問題の根っこにはデータ軽視があるように思います.更には,正しく統計を使わなければいけないという決意も欠如しているように思います.それは,データは統計分析してこそ意味があるという認識がそもそも欠如しているからでしょう.先週予告したように,このことを実例を元に見ていきます. サンプルデータは学校保健統計調査を選びました.このページの調査の結果の統計表一覧をクリックすると,そこに書いてあるようにe-Statに...
覚え書き

不正統計と統計リテラシー

不正統計の報道で騒がしい昨今ですが,この言葉を聞くたびに「ちょっと違うのではないか」と思うのです.不正統計が何を指しているのかといえば,ご存知のように厚生労働省の毎月勤労統計の調査が正しく実施されていなかったという問題です.毎月勤労統計調査(いわゆる「マイキン」)では従業員500人以上の事業所はその全てが対象になっていますが,東京都内では3分の1しか調査していなかったとのことです. 母集団からサンプリングしてその平均値を母平均の推定値とするという行為そのものは統計学としては全く問題ありません.問題はサンプリングがランダムでなかったことです.日本全国の平均賃金を推定する場合,東京都内でのみ三分...