過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

JMP

JMP

推しのプラットフォーム

12月のSummit Japanでは,昨年よりインタラクティブにしようという試みがあって,私も「Networking with Committee Members」とかいう企画に協力することになりました.記念すべき第一回のSummit Japanで講演したというだけの理由で,Committee Memberの一人なんですよね. 昨年の発表では,事前収録した動画をオンデマンドで視聴するというスタイルだったのですが,今年は,スケジュールに沿ってストリーミングします.ですから,少しはライブ感が出るかもしれません.とはいえ,流石に動画は事前に収録しておくので,何か真のライブイベントをやりたい,...
JMP

パーティションのk分割交差検証(重要)

先週の続きです.結論から先に言うと,パーティションのk分割交差検証はJMP16から廃止されました.先週の記事では不正確なことを書いてしまったので,今日はそれを訂正するとともに,なぜ廃止されたのかという背景や今後の対処法について考えてみます. 最初に,JMP15までのパーティションのk分割交差検証のアルゴリズムについて説明します.実は『JMPではじめるデータサイエンス』のp206に書いてあることは,正しくないことが判明しました.ここに書かれている説明は教科書通りなのでなんの不思議もないし,SAS社からも確かにこの説明を受けていたのだけど,真実はどうやら違うらしい. 理由はど...
JMP

JMP16で「あれっ?」と思ったこと(その2)

先週の続きです.JMP16を使いだして,戸惑ったことのなかで最もインパクトが大きいのが,「パーティション」の「k分割交差検証」がなくなってしまったこと.オーバーフィッティングしやすいからというのが理由だそうです.(詳しい理由は調査中です.)だけど,今一つ納得がいかない.それというのも,JMP Proにはまだ残ってるんです. JMP Proの「モデルのスクリーニング」の「k分割交差検証」にチェックを入れるとこのようにすべてのモデルに対してk分割交差検証がなされます. レポートには「パレート優位を選択」なんてリンクがあるから,それを押すとこの例では上記のように「ニューラルブー...
JMP

JMP16で「あれっ?」と思ったこと

バグフィックス版のJMP16.1がリリースされたので,JMP16をそろそろ使い始めてます.JMP15のときは「JMP15で何が変わったか?」なんて記事を書いた記憶があるけど,JMP16はアーリーアダプターに申し込まなかったから,使うのはほぼ初めてなので,新機能に言及するほど使いこんでいません.毎度のことながら,移行の際にあれっ?と戸惑うこと多々あります.SAS社の方で移行ガイドのようなものを用意してくれるといいんだけど.自分で気が付いたことはこのブログに記録しておきます.というわけで,本日は連続尺度変数のカテゴリ化について. JMP15と変わらず,JMP16でも列メニューの「ユーティリ...
JMP

全員参加の実験計画

今年のSummitのエントリーが締め切られました.正直オンラインだと盛り上がりにかけるので,私も景気付けに何か発表しようと,この一月ばかり悩んでました.コンサルタントと称するならもっと具体的な事例に役立つお話しすべきかもしれないけど,今回はもっと間口を広げた話にします.ご参考までに要旨を下記します. 実験計画の有効性を疑う技術者はいないにもかかわらず,日本の産業分野では,誰もが実施しているという状況ではない.Design of Experimentsの「デザイン」を先人が計画と訳してしまったため,実験計画のテクニカルな側面のみが強調され,あたかも魔法の手法のように理解されていることにそ...
JMP

JMP用のPC

今日は一日中あることに取り組んでいて,今も取り込み中です.ブログはスキップしようと思ったんだけど,日記がら簡単に報告します.何に取り組んでいた(る)かというと,Windows PCの立ち上げです.以前,JMP用のPCを購入するなんてことを書いた記憶があるけど,ついに購入したのです.Windowsの不必要なサービスを停止したりアプリを削除したりといった最低限のセッティングや,SSDの増設やらJMPのインストールで一日費やしてしまいました. メーカーは伏せておきますけど,結局デスクトップにしました.ノートだと17インチでホームポジションが中央に位置しているという条件を満たすものがなかったか...
JMP

データ捏造を見破る(続き)

本日は先週の続きです.「パターンを調べる」を使ってデータ捏造の痕跡を調べることができたけど,その際,設定項目の「値」のことろに「先頭文字と末尾文字」というのがあるのに気付いた.これは,もしかしたらデータがBenfordの法則に従っていることを調査できるのかと思ったら,ビンゴでした. Benfordはアメリカの物理学者で,彼が見つけた数値データの先頭の数字の出現頻度についての法則はBenfordの法則と呼ばれてます.データがべき乗則に従うという前提はあるけれど,たいていの実測データでは,先頭の数字の出現頻度は1が最大で,数字が大きくなるに従って低下していくというもの. それ...
JMP

バッグプロットとは

夜中に何かの物音でたたき起こされました.家の中を点検したものの,どこから何の音がしたのかもわからず.原因不明のまま床に就くと,今度は外から無線放送が入りました.大雨洪水警報発令とか言ってるのだと思うけど,雨音で良く聞こえません.ああ,そうか,さきほどの物音はiPhoneにアラームメッセージでも入ったんだろうと思ってまた寝入りました. ということで調子がよろしくないので,今日はダウンロードだけしておいた文献でも読むことにします.先日のセミナーで,JMP15から実装されたBagplotを紹介したところ,このグラフはJMPオリジナルなのか?と聞かれて答えられなかったのです.おそらくオリジナル...
JMP

ワクチンは我が身のためならず

JMPや実験計画だけでなく,統計リテラシーを講義することがあります.新人研修の一環であることが多いけど,年配の方も一緒に聞いていただくこともあって,自分としては楽しみなセミナーです.データサイエンスの講座と違って,対象の間口が広くする必要があって,身の回りから題材を取る必要があるのが少し大変です.根底には統計がある題材を選んでいるけど,表面的にはメディア・リテラシーのセミナーのようになってしまう. どうせならメディア・リテラシーも兼ねようと,古いネタは入れ替えるようにしてるので,日常的にStat Spotting(統計情報の定点観測)が欠かせません.ネットでニュースを読むときは,いつも...
JMP

JMP16はじめました

ようやくJMP16をインストールできました.何が変わったのかという情報はカタログレベルでは知っていたし,SAS社主催の新機能紹介セミナーがオンラインで開催されてたので,その第一回だけは聴講しました.だけど,2回目以降は仕事の都合で聴講できず.せっかくオンラインなんだから,参加時間をフレキシブルにしてもらえるとありがたいのですけどね.会社のPCでしかJMPを使えないという人も多いから,勤務時間外の開催は難しいのかもしれません. そんな事情で,今になって実際に操作してみると「おお」と思うことが多々あって,コロナで刺激が少なくなった昨今では久しぶりに興奮しています.『統計的問題解決入門』はJ...
JMP

STIPS

SAS]社が提供しているSTIPSというオンラインの教育コンテンツがあります.STIPSは,Statistical Thinking for Industrial Problem Solvingの略で「問題解決のための統計的思考」ってベタな訳がついてる.内容はよくできてるんだけど,統計的思考ってのが個人的には引っかかるものがあります.思考しているだけでは,問題解決できないからね. 大阪大学と京都大学の連携人材育成プログラムもSTiPSと言うらしい.こちらは,iが小文字でScience and Technology in Public Sphereの略です.Public Sphereとい...
JMP

変異株をJMPで見る

今年も去年同様に外出しないで過ごす連休となってしまいました.コロナウィルスの性質は既によく知られていたので,変異株が入り乱れる今の状況は当然予想されて然るべきでした.こうなると,今後の展開は偶然の結果次第なので,Googleだろうが誰であろうが予測不能なはず.この状況は地震と似ている.地震がいつ来るかは基本的に予測不能だから,その不確実性のもとに生活している私たち日本人には,今の状況に対処する素養があるはず.様々なケースを想定した準備と心構えが,今のコロナを乗り切るには重要なんだと考えてます. ということで,今日は時間ができたので,連休明けのセミナーのネタ探しを兼ねてJMPで遊んでます...