過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

Tad

JMP

データ捏造を見破る(続き)

本日は先週の続きです.「パターンを調べる」を使ってデータ捏造の痕跡を調べることができたけど,その際,設定項目の「値」のことろに「先頭文字と末尾文字」というのがあるのに気付いた.これは,もしかしたらデータがBenfordの法則に従っていることを調査できるのかと思ったら,ビンゴでした. Benfordはアメリカの物理学者で,彼が見つけた数値データの先頭の数字の出現頻度についての法則はBenfordの法則と呼ばれてます.データがべき乗則に従うという前提はあるけれど,たいていの実測データでは,先頭の数字の出現頻度は1が最大で,数字が大きくなるに従って低下していくというもの. それ...
統計リテラシー

データ捏造を見破る

イベルメクチンのことを少し前に描いたけど,ここにきて衝撃的なニュースが.なんと,新型コロナ感染症に対するイベルメクチンの薬効をサポートする重要論文が取り下げられたのです.既に,薬効を否定する論文も発表されています.こうなると北里研究所とMeiji Seikaファルマが共同でイベルメクチンを用いた新型コロナ治療薬を創製するなんてきいてたけど,その影響は大きそうですね. この記事を読むと,その理由がデータの信頼性に問題ありということで,しかも一部には捏造も含まれているとか.今まで論文はちゃんとは読んでいなかったので,これを機会に読んでみました.それというのも,このネタは統計リテラシーのセミ...
JMPではじめる統計的問題解決入門

MCDAアドイン更新のお知らせ

MCDAアドインのJMP16対応版が来週からリリースされます.機能には変わりはありませんが,有効期限が延長されているので,従来版をお使いの方も新たにダウンロードをお願いします.切り替えは来週早々からと聞いていますが,念のため来週末くらいのほうがいいかもしれません.ということで,ダウンロードはこちらからどうぞ. MCDAアドイン お申し込みフォーム 因みに『データサイエンス』のみの読書のために補足すると,MCDAアドインとは,『統計的問題解決入門』にバンドル付属したパラメータ設計のアドインです.設定画面はこのようにシンプルですが,ロバスト設計や動特性設計などにも対応しているので,カ...
JMP

バッグプロットとは

夜中に何かの物音でたたき起こされました.家の中を点検したものの,どこから何の音がしたのかもわからず.原因不明のまま床に就くと,今度は外から無線放送が入りました.大雨洪水警報発令とか言ってるのだと思うけど,雨音で良く聞こえません.ああ,そうか,さきほどの物音はiPhoneにアラームメッセージでも入ったんだろうと思ってまた寝入りました. ということで調子がよろしくないので,今日はダウンロードだけしておいた文献でも読むことにします.先日のセミナーで,JMP15から実装されたBagplotを紹介したところ,このグラフはJMPオリジナルなのか?と聞かれて答えられなかったのです.おそらくオリジナル...
JMPではじめる統計的問題解決入門

ステークホルダー

ブログでは世間のことはとやかく言わないことに決めてるので,何かと世間を騒がせているオリンピックについてもスルーするつもりだったけど,こんな記事を読んだので,一言. 会場での酒類の販売を,一時は認める動きがあったりしましたけど,この際,五輪大臣がステークホルダーの存在を念頭に検討する,などと話したということらしいです.ステークホルダーとは,ご存知のとおり教科書的には利害関係者のことです.この大臣は東京大学経済学部経営学科卒業とのことなので当然知っていたはずです. とはいえ,この大臣の頭の中には,ステークホルダー=当事者という認識しかなかったように見受けられます.最近は,株主総会でス...
JMPではじめる統計的問題解決入門

統計リテラシーのネタに悩む

JMP16の新機能を少しずつ勉強してるけど,JMP15から予想以上に変わったことが多くて,戸惑ってます.『統計的問題解決入門』のJMP16対応をこのブログで書いていこうと思ってるけど,かなり大変なことになりそう.今の自分の分析のやり方は当時と結構違っているので,これもアップデートしていきたいと考えてます.それにしても,この本を書いた当時の自分はかなり保守的ですね.今はもっと乱暴というか大胆というか.これが良いことなのかはわかりませんけど.いずれにしても,ここしばらくは余裕がないので,新たに書籍を購入してくださった方も含め,今しばらくJMP16対応はお待ちいただければありがたいです. 特...
JMP

ワクチンは我が身のためならず

JMPや実験計画だけでなく,統計リテラシーを講義することがあります.新人研修の一環であることが多いけど,年配の方も一緒に聞いていただくこともあって,自分としては楽しみなセミナーです.データサイエンスの講座と違って,対象の間口が広くする必要があって,身の回りから題材を取る必要があるのが少し大変です.根底には統計がある題材を選んでいるけど,表面的にはメディア・リテラシーのセミナーのようになってしまう. どうせならメディア・リテラシーも兼ねようと,古いネタは入れ替えるようにしてるので,日常的にStat Spotting(統計情報の定点観測)が欠かせません.ネットでニュースを読むときは,いつも...
JMP

JMP16はじめました

ようやくJMP16をインストールできました.何が変わったのかという情報はカタログレベルでは知っていたし,SAS社主催の新機能紹介セミナーがオンラインで開催されてたので,その第一回だけは聴講しました.だけど,2回目以降は仕事の都合で聴講できず.せっかくオンラインなんだから,参加時間をフレキシブルにしてもらえるとありがたいのですけどね.会社のPCでしかJMPを使えないという人も多いから,勤務時間外の開催は難しいのかもしれません. そんな事情で,今になって実際に操作してみると「おお」と思うことが多々あって,コロナで刺激が少なくなった昨今では久しぶりに興奮しています.『統計的問題解決入門』はJ...
統計リテラシー

基準について考える

コロナ感染拡大の当初であればまだしも,1年以上になるのに今だにお役所のデータの扱いがなってないと思うことがあります.例えば,この記事. 重症者の集計、基準はバラバラ 厚労省が修正して大幅増 リンクを踏みたくない人のために内容を書くと,コロナ重症者の厚労省基準が,(1)集中治療室(ICU)等で治療(2)人工呼吸器を使用(3)体外式膜型人工肺(ECMO(エクモ))を使用ということだったので,今までHCUの患者が集計から抜け落ちてたから,今度から入れた数字を発表するよ.ということらしいです. で,その結果がこれ.大阪の重症者数がいきなり83名も増えたのはこのためです.何も知らない...
統計リテラシー

ステレオタイプとプロトタイプ

うちはAIにして業績が倍になったという人がいたので,AIで何をしたのか聞いたところ,今まで単回帰で予測していた売れ筋予測を重回帰にしたという実際にあった話.以前,話ししたかもしれないけど, AIという言葉がメディアに出るたびに思い出してしまう.AIという言葉の中身を知らないで使う人やメディアが多すぎてうんざりするけど,知っている人でも,儲かるから意識して使っている節がある. 日本人は,AIのようなパワーワードに弱いのでは?などと常々考えてたけど,AIの背後に人間性を感じるのは,日本人に多いのだそうです.それはおそらく,古くは鉄人28号とかジャイアントロボとか,人間性を持ったロボットに親...
JMPではじめるデータサイエンス

密とソーシャルディスタンス

全国的なコロナ流行の影響で運動会を中止にする小学校も出ているそうです.運動会は嫌いな子もいるけど,悲しがってる子もいるだろう.高校だけど,私の母校は運動会が盛んでそれこそ1年のメインイベントだったので,その気持ちは痛いほどわかります. 「棒倒し」とか「100人ラグビー」とか色々と変わった種目があって,その練習は放課後はもちろん,昼休みもやるのですよ.そうなるとお昼ご飯を食べることができないので,当然早弁と言って休憩時間にに弁当を食べるわけです.それもクラス全員が.今にして思えば,バンカラな校風だったですね.共学だったけど,女子も早弁をしていたのが印象に残っています. 運動会を中止...
JMP

STIPS

SAS]社が提供しているSTIPSというオンラインの教育コンテンツがあります.STIPSは,Statistical Thinking for Industrial Problem Solvingの略で「問題解決のための統計的思考」ってベタな訳がついてる.内容はよくできてるんだけど,統計的思考ってのが個人的には引っかかるものがあります.思考しているだけでは,問題解決できないからね. 大阪大学と京都大学の連携人材育成プログラムもSTiPSと言うらしい.こちらは,iが小文字でScience and Technology in Public Sphereの略です.Public Sphereとい...