バグフィックス版のJMP16.1がリリースされたので,JMP16をそろそろ使い始めてます.JMP15のときは「JMP15で何が変わったか?」なんて記事を書いた記憶があるけど,JMP16はアーリーアダプターに申し込まなかったから,使うのはほぼ初めてなので,新機能に言及するほど使いこんでいません.毎度のことながら,移行の際にあれっ?と戸惑うこと多々あります.SAS社の方で移行ガイドのようなものを用意してくれるといいんだけど.自分で気が付いたことはこのブログに記録しておきます.というわけで,本日は連続尺度変数のカテゴリ化について.
JMP15と変わらず,JMP16でも列メニューの「ユーティリティ>カテゴリ化の計算式の作成」から実行するんだけど.デフォルトでこのようなパネルが開くので「えっ?」となります.JMP15までは水色とオレンジの少しレトロな色調で階級が表示されていたんだけど,ガラリと変わりました.
下に散布図というか蜂群図があるので,赤い線を動かしてマニュアルで階級を決めるには具合がいいですね.多峰性の分布の場合は,効果的なカテゴリ化ができそうです.カットポイントの増減にも対応しているので,これはかなり強力ですね.
だけど,以前のようにオフセットと階級幅で指定するのも手取り早いし,あまり考えないでいいので好きでした.どうすればいいのか赤三角を探したらありました.「等しい幅でカテゴリ化」を実行すると「オフセット」と「幅」を聞いてきます.
赤三角には「ビンの数でカテゴリ化」というのがあって,これはいいですね.これは多用することになりそうです.この設定では,「ビンの数」だけでなく「開始」と「終了」を入力するようになっているのですが,プリセットから分位点やSD単位での位置を選択ですます.このデザインした人はかなりデータ分析に慣れてますね.本当に欲しい機能が備わったと感じます.
他に戸惑ったのは「外れ値を調べる」ですね.設定パネルはこのようになりました.
引数が入力できるようになったのはいいんだけど,「多変量のロバスト推定による外れ値」がなくなってしまったのですね.これは以前にも言及した記憶があるけど,これは痛い.拙著でも4つの中では一番のお勧めと書いたように,引数を入力しなくていいからこの段階での外れ値候補の抽出には便利だったんです.なんといっても,マハラノビスの距離という原理がわかりやすいので,そこが良かったんだけどね.
代わりに入った「ロバスト主成分分析による外れ値」でもいいんだけど,これ外れ値の補完という余計なことをしてくれちゃいます.まあ,多変量の相関プラットフォームの「多変量」レポートの赤三角には従来通り「外れ値分析>Mahalanobisの距離」が残っているので,こちらを使えばいいのだけど.この手法の入れ替えは,「多変量のロバスト推定による外れ値」だと処理時間が異様にかかることがあるからだそうですけど.
おそらく,ここには分析の流儀みたいなものがあるね.一度,あちらの開発スタッフと話をしてみたいもんです.今日は他にも「あれ?」と思ったことがあったんだけど,そちらはどうすれば従来通りに実行できるのか,今探しているところです.
回避策が見つかったら,来週紹介します.それでは.
コメント