過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

統計学

JMP

K値について思うこと

一昨日に開催されたJMPの製薬業界向けWebセミナー「非臨床研究者のための統計解析入門」を聴講しました.私にとって馴染みの薄い分野なので,あまり使わない機能を紹介して頂くのは勉強になります.そもそも非臨床研究というのが聞き慣れない言葉だったのですが,話を聞くと動物などを使った医薬品の薬効や安全性の検証試験である前臨床試験のことなんですね.最近では非臨床試験と呼ばれていることは知りませんでした.非というのは良い響きではないのですが,おそらく英語のNon-clinicalを直訳したのでしょうか.工業分野の実験計画とは大きく異なって,試験の手順や分析方法,信頼性検証に至るまでがガイドラインでガチガ...
JMP

ポストコロナの適者生存

5月,6月と開催されていたJMP On Airも今週で終了となりました.コロナ期間中は自宅で楽しみながら勉強させていただきました.あらためてSAS社の皆様にお礼をしたいと思います.第一回の開催ではまだオンライン視聴に慣れていなかったということもあって,少しドキドキしてスタートを待ったのは良い思い出です.1時間もヘッドセットをつけているのは辛いので,スピーカーから音を出しても邪魔にならない場所に移動して視聴していたのですが,当初は自宅の通信状態が安定せず,時々音声が途切れがちになったりして苦労しました.自宅のWifiは5GHzと2.4GHzを使い分けているのですが,調べるとその切り替えが物理的...
JMPではじめるデータサイエンス

検査の損益に付いて考える

先々週のブログで,PCR検査は検査というよりも,仮説検定と同じテストであるとみなすべきと書きました.もちろん,同じテストだと言っても,確率に基づいた判定ではないという点では,仮説検定とは厳密には違います.ではありますが,試行の結果(イベント)を真実と判断結果の四分割表に割り当てる手法であると緩く考えるとPCR検査の実態をより深く理解することができます.4つの領域は「あたり」と「はずれ」が半々ですが,このうちの2つの「はずれ」が意思決定手法としての評価に特に重要です.仮説検定では,それらを第一種の過誤と第二種の過誤と呼ぶわけですが,この命名では両者の違いがわかりにくいと思いませんか.英語でも,...
JMP

検査とテスト

今日は一日,統計リテラシーのオンライン用スライドを作成していました.オンライン向けにはアニメーションを使うのを避けたり,フォントサイズを小さめにしたりする以外にも,話の間をとるという工夫が必要です.セミナーのコンテンツは使い回す人も多いのですが,私の場合,基本的にスライドはその度に組み直します.今度はどんな相手にどんな話をしようか考えるのが楽しみの一つでもありますし,そもそも同じスライドを使っていると,自分が飽きてしまうのです.今回は,オンライン版として作り直すにあたり,せっかくなので最近の関心事からネタを拾って,コンテンツを更新しています.正直に申し上げると,コロナのことにも飽きてきた(こ...
JMP

A型人間はコロナにかかりやすいのか?

冒頭から如何わしいタイトルで恐縮です.血液型と性格の関係がどうこうという話ではないのでご容赦ください.様々なデマ情報も飛び交っている昨今では,それら情報の裏を取るという必要があり,ここのところ色々な文献を読みまくっています.311の当時を思い出す状況です.あのときも随分と勉強しました.このときの蓄えがなければ,おそらく『JMPではじめる統計的問題解決入門』は執筆していなかったかもしれません.p46の「ネ申エクセルの話」というコラムにも当時のことを書いていますけど,あの頃色々と勉強したことが集積していって,それが書籍として実態化したように思います. さて,ここのところコロナをネタにしていて,先...
統計学

ウィルス感染症対策と統計リテラシー

このブログでは,JMPや統計学,データサイエンスに絡むネタに限定して,基本的に時事ネタは扱わないようにしていましたが,先週に続いて本日も新型コロナウィルス感染症についての雑記となります.統計リテラシーにも少しだけ絡むのでお許しください.(そういえば,以前これからは統計リテラシーを今後は統計思考と呼ぶことにするなんて書きましたが,それでは通じない人が多いので,また統計リテラシーに戻そうと思ってます.) 未だに一部のマスコミでは新型肺炎と呼んでたりしてますが,既にウィルスによる感染症ということが確定しているし,肺炎の症状がない感染者も出ているのですから,新型肺炎という名称を報道で使い続けるのは意...
JMP

新型SERSの流行をJMPでみる

ドラッグストアでマスクが売り切れたりして,世間も騒がしくなってきました.今でもマスコミでは新型肺炎などと呼んでいますが,原因不明の段階ならばともかく,ウイルスが特定された現在は,新型コロナウイルス(因みに正式名称は2019-nCoV)による重症急性呼吸器症候群(Severe acute respiratory syndrome)いわゆるSARSと呼ぶべきでしょうか.特に感染症の場合,病名は重要だと思います.それによって一般人の知識が集積しやすくなるからです.ノロウイルスがいい例ですね.今回の感染症も,新型肺炎などではなくSARSの再来と捉えるべきで,区別する必要があるならば前回のはSERS20...
統計学

統計リテラシーと統計思考

このブログでは「統計リテラシー」という言葉を使ってきました.その名を冠したセミナーなどを実施していて今更なのですが,ここのところ,改めて「統計リテラシー」とは何かと考えています.Googleで『統計リテラシー』と検索すれば,おそらくトップに総務省統計局の『なるほど統計学園高等部』 がヒットすると思います.私見ですが,ここに書かれているのは,統計リテラシーというよりも,むしろデータリテラシーと呼ぶべきものです.試しにこの文章の「統計」を「データ」に置き換えてみてください.なんかしっくりきませんか? 「データは事実をできるだけ客観的に捉えられるように作成されたものでなければなりません。また、デー...
JMP

Box-Cox変換

先週に続いて今週も執筆での悩み事などを書いてみます.今回の書籍では『統計的問題解決入門』よりも初心者を対象にしていますが,その線引きに悩んでいます.先週も検定をどこまで深く学んでいくかの線引きに悩んでいると書きましたが,例えば,「Box-Cox Y変換」を取り上げるべきかどうかで今は悩んでいます. 最良λで目的変数を変換して,正規分布に近づけるという強引さに躊躇うものがあって,最近まで気に留めていなかった手法なのです.先日,最良λではなく(信頼区間内で)半端が出ないλを設定するのでも良いとわかって,少し見方が変わりました.例えば,信頼区間内に0があればλ=0(即ち無変換)とする...
統計学

シロかクロか

しばらく前に書いたグラフの記事「JMPのグラフは地味なのか?」では,陸上女子の100mの世界記録を題材にとりました.そのとき,たまたま陸上女子のキャスター・セメンヤさんの記事を読んでいたというだけの理由だったのですが,いろいろデータを弄っていてジョイナーのドーピング疑惑に気付き,これは面白いかもと思い執筆中の書籍でデータ視覚化のネタとして取り上げることにしました.乞うご期待ください. 競技中の薬物使用は古代ギリシャにもありましたし,ライバルの闇討ちまでしたそうですから,勝つために手段を選ばないアスリートは昔からいたようです.自ら知らずしてドーピングされて組織の犠牲となった選手も...
JMP

JMPで高齢者ドライバー問題について考える

高齢者の交通事故がニュースになりました.自分でも自転車に乗るので真っ二つになったフレームを見たときは冷や汗が出ました.連休間近の事故に犠牲者はもとよりご遺族のご無念痛み入ります.この報道で,改めて高齢者ドライバーへの風当たりが強くなっていますが,JMPerのわたしたちとしては冷静にデータをもとに思考すべきです.警視庁の交通事故統計表をもとに自ら分析されている方もネットで見受けたりしたので,わたしもちょっとやってみました.最初に結論(というか途中結果)を提示します.というのも,bloggerに越してからできるだけ冒頭にグラフィックスを出すことにしているからなのですが.このグラフについては以下で説...
統計学

DOEは必殺技

今年最初のJMPer's Meetingはいよいよ来週に迫りました.後半のジャパン・セミコンダクターの事例発表が実践編なので,私の担当する前半の基礎編で何をお話しようか今も考えているところです.「JMPerはDOEをやろうよ」ということからは外れない予定なのですが,割とアドリブで話してしまうタイプなので,聞いてくださる方の反応次第では脱線することはあるかもしれません.JMPer's Meetingは既に満席でキャンセル待ちとなっているのですが,ご興味あれば直接連絡ください. 先日SAS社から連絡ありまして,都合でキャンセルされた方から資料配布の予定はあるかとご質問いただいています.理由...