過去の投稿に画像リンク切れ多数ありご迷惑おかけしています．

統計学

問１の解説

『統計学のやさしい授業』は本日発売になりました．まだここにおいでになる読者の方はいないと思うけど，今後しばらくの間，本書に掲載した練習問題の解説をしていこうと思います．JMPユーザーの方には申し訳ないです．あ，ちなみにJMPというのはSAS社の統計ソフトです．詳しくはこちら．ご存知ない方は値段が気になると思うけど，個人で購入する人はまずいないと思います．サブスクだしね．AdobeのCreative Cloudの数倍はします． JMPをご存知ない人は，無料で使えるPythonとかRとかあるのになんで統計ソフトにお金を払うの？と思うかもしれないけど，まあその価値があるから六本木に立派なオフ...

書籍サポート統計学のやさしい授業

イベルメクチンと信頼区間

「イベルメクチン、新型コロナへの効果確認できず　国際チーム論文発表」という記事が出てました．イベルメクチンについては，データの改竄についてこのブログでも書いた記憶があります．このときから，既に証拠があやふやだと言われていたわけですけど，今回それがRCTによって証明されたことになります．new england journal of medicineに掲載された論文ということで，その影響力は水戸黄門の葵の御紋に匹敵します．何しろ，医学・生物分野での最高峰としてインパクト　ファクター75です．この論文誌に掲載される学者はそれだけで大変なエリートです．世界四大医学雑誌と言われているの...

また抗体検査の話

一段と世の中が騒がしくなってきましたね．そんな中で菅，今日もブログだけは平常運転でいってみたいと思います．そうはいっても，特に書くこともないので，先週に引き続き，時事ネタを強引にJMPと紐付けてるという恒例のチャレンジをしてみます．先週は，横須賀市のコロナ抗体検査の結果の解釈に，統計的でもないのに「統計的に」という枕詞をつけるなと文句を言いました．そもそも「統計的に」という言葉をつける言説には，騙されるなという警告の意味があると解釈しています．さて，最近は，様々な自治体で同じ試みが実施されているようです．数日前のニュースでは宇都宮市でも無症状者を対象に抗体検査を実施したようです． ...

JMP統計学覚え書き

紅茶とインフルエンザ再び

ここのところ冷え込んできましたね．先週もインフルエンザの話をしたばかりですが，今年は例年より流行期入りが早いということです．全国に約5000ある医療機関からのインフルエンザ患者の報告数が定点モニタリングされていて，その平均が1を超えたときが流行期入りの目安です．厚生労働省によれば，都道府県ごとに集計すると，11月17日時点で，31都道県が流行期入りしています．こうなると加速度的に患者数が増えていきます．今年はラグビーのワールドカップが開催されたりして，訪日外国人が多かったことが例年よりも早い流行の原因とみられています．インフルエンザ過去10年間との比較グラフ（11/29更新）を見る...

久々に本を読む

このところ本を読む時間が取れないでいるですが，ちょうど今書いている本で統計学の初歩を書く必要が出てきたので，昨今はどういう切り口が好まれるのか参考にしようと，「高橋洋一（2018）『統計学超入門』，あさ出版」を読んでみました．統計学の初歩の初歩をこれ以上は噛み砕けないほどに懇切丁寧に解説したというだけあって，確かに易しく書かれてい流ようです．数式をあまり使わずに書かれた，読めばなんとなくわかった気にさせてくれる本は「ごまかし」だと言い切っているところに好感を持って読み始めたのですが．．．数式を意識して避けているので，確かにズバリ数式は出てこないのですが，この手の本によくある言葉で数式...

ノンパラメトリック検定に悩む

このところ真夏にしては温度の低い日が続き，その後でいきなり暑くなったりしていて，自律神経も乱れがちな今日この頃ですが，皆様いかがお過ごしでしょうか．私はといえば，引き続き『JMPではじめる＊＊＊＊＊』の執筆で悩んでいます．一連の分析フローの中で，今までの経験を踏まえて，重要だと思うことに重点的にページ配分するという方針を立てているのですが，そうするとどうしても内容がアンバランスになってしまいます．本章の性格からそれでいいのかと考えています．例えばノンパラメトリック検定です．私が持っているJMPの本は古いのばかりですが，例えば，田久，林，小島（2002）『JMPによる統計解析入門』オーム社...

２つの相関係数

毎週土曜日の夜にブログを投稿していますが，このところ用事が立て込んできていることもあって，当面は週末から月曜日の朝までのどこかの時間に投稿することに変更します．おそらく日曜日の夜になることが多いと思いますが，とりあえず本日は今まで通り土曜日に投稿します．さて今日は何を書こうかと思案して，先ほどまで「Spearmanの順位相関係数」はどうやって出力するんだっけと，メニューを探っていたところでしたので，これを目指して書き始めます．以前お話ししているかもしれませんが，今でもわたしの固有技術は計測だと思っています．新人当時は事業部として独立していた計測事業部に配属され，そこで産業分野における計...

正しい棒グラフ

先々週の記事でグラフビルダーの「区間」ドロップゾーンのお話をしたかと思うのですが，そこでこのグラフを使いました．このとき「因みにこの棒グラフそのものは参考までに載せましたが，こういうグラフは書いてはいけません．JMPではデフォルトではこのようなグラフは描けません．なぜだかはお分かりですね．」と書いたのですが，このことにお問い合わせをいただきましたので，本日はその話をさせてください．こうして誰が読んでいるかもわからないブログを毎週書き続けているわけですが，何か反応あると素直に嬉しいですね．こちらのブログでは，コメント欄はページの一番下の目立たないところに移動しましたので，連絡手段と...

こぎれいなデータ（tidy data）

先週は「不正統計」という言葉に待ったをかけました．不正統計ではなく不法統計と呼ぶべきであると．もっと正確には，不法なデータサンプリングであって，そこに統計の誤用が合わさったということです．この問題の根っこにはデータ軽視があるように思います．更には，正しく統計を使わなければいけないという決意も欠如しているように思います．それは，データは統計分析してこそ意味があるという認識がそもそも欠如しているからでしょう．先週予告したように，このことを実例を元に見ていきます．サンプルデータは学校保健統計調査を選びました．このページの調査の結果の統計表一覧をクリックすると，そこに書いてあるようにe-Statに...

不正統計と統計リテラシー

不正統計の報道で騒がしい昨今ですが，この言葉を聞くたびに「ちょっと違うのではないか」と思うのです．不正統計が何を指しているのかといえば，ご存知のように厚生労働省の毎月勤労統計の調査が正しく実施されていなかったという問題です．毎月勤労統計調査（いわゆる「マイキン」）では従業員500人以上の事業所はその全てが対象になっていますが，東京都内では3分の1しか調査していなかったとのことです．母集団からサンプリングしてその平均値を母平均の推定値とするという行為そのものは統計学としては全く問題ありません．問題はサンプリングがランダムでなかったことです．日本全国の平均賃金を推定する場合，東京都内でのみ三分...

初JMP

今年もよろしくお願いいたします．本年最初に何を書こうかとニュースを漁っていたところに目に留まったのがこちらの記事です．Windows 10 tops Windows 7 as most popular OS リリースは3年前でしたのにまだWindows10のシェアはまだ4割にも満たないんですね．あっという間に9を飛ばして10に入れ替わったこともあってWIndows8のシェアが低いのは何となくわかります．8.1が出たときのゴタゴタが尾を引いているのでしょうか．因みに，WIndows9というネーミングが飛ばされたのは，（ Windows95や98であることを認識するために）「Windows9」と...

コミュ力とは何か？

ブログとはそもそも日記のようなものなので，思ったことを書けばいいのでしょうけれど，思ったことをそのまま発信するのは気が引けるものです．結果として誰かを批判するように取られてしまうのを恐れるからです．そんなわけで，あまり時事ネタは取り上げないようにしているのですが，たとえ少しでも統計に関わっていれば話は別です．今週目にとまったのは，順天堂大学の入試問題についてのニュースです．朝日新聞デジタルによれば，「順大入試、女子を一律に減点「コミュ力が高いため補正」」という見出しで以下のように報道されていました．順天堂大（東京都）は１０日、医学部入試をめぐって設置した第三者委員会から「合理的な理由なく...

次のページ

12