過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

JMP16で「あれっ?」と思ったこと(その2)

JMP

先週の続きです.JMP16を使いだして,戸惑ったことのなかで最もインパクトが大きいのが,「パーティション」の「k分割交差検証」がなくなってしまったこと.オーバーフィッティングしやすいからというのが理由だそうです.(詳しい理由は調査中です.)だけど,今一つ納得がいかない.それというのも,JMP Proにはまだ残ってるんです.

JMP Proの「モデルのスクリーニング」の「k分割交差検証」にチェックを入れるとこのようにすべてのモデルに対してk分割交差検証がなされます.

レポートには「パレート優位を選択」なんてリンクがあるから,それを押すとこの例では上記のように「ニューラルブースティング」と「ブースティングツリー」が選択されます.これは便利ですね.今までのモデリングの概念がすっかり変わってしまった.なんていうか,今まではモデリングって,既存知識をもとに作り上げる職人技というイメージを持っていたけど,物力作戦で展開するのも面白い.

だけど,JMP Proを使っている人ってそんなに多くないと思う.だから,JMP標準版(以下JMP Std)から完全になくなってしまったのは困ります.『実行』ボタンを表示するには,設定パネルで「検証データ」を設定する必要が出てくるからです.「検証データ」は,以前は除外行を勝手に検証データに設定するというおせっかいをしてくれたけど,JMP15からこの機能はデフォルトでOFFになりました.

たまたま検証データに外れ値が含まれていたりすると,履歴で赤線の挙動が怪しくなったりするので,今までは「検証データ」を設定せずに「k分割交差検証」してましたが,今後は別のやり方を検討しなくてはならないかも.

それにしても,なぜ JMP Std から削除してしまったのだろう?ステップワイズには残っているんですよ?こういうときはそのなぜを追求すべきです.そこにおそらくJMPの思想があるはずです.そもそもパーティションはマニュアルで『分岐』していくのが対話的と銘打つ本来の姿なので,「k分割交差検証は」邪道と言えなくもない.だけど,「k分割交差検証」を教えると,皆さんそればっかりになっちゃんだよね.

早いし手軽だし,まあ気持ちはわかります.だけど,なくすことはないと思うんだよね.手法として間違っているならばJMP Proからも外すはずだし.拙著にも「k分割交差検証」のことは書いてあるから,JMP16ユーザーのために対処法を来週アップします.そのとき「なぜ」も含めてもう少し詳しいこともお話しできるかもしれない.

こんなとき紙の書籍ってだめだなぁと思う.少なくともソフトの解説書には向かないですね.Adobe CCなど主要ソフトがサブスクに移行する中で,ソフトの改良や変更のサイクルがどんどん短くなってきてる.紙の本ではもう対応できないです.そのうち実験計画の本を書くつもりなんだけど,それはKindle本にしようと本気で考えてます.

「パーティション」は対話的に使って欲しいというメッセージがここにあるなら,不便になったけど賛同はします.そもそも分岐履歴を目で見て項数を判断するのがいいと思ってました.ちょうど因子分析のスクリーブロットで因子数を判断するように.「パーティション」ではそれ以上のことはするなということなのかな?

それでは.

9月27日追記 上記には思い違いがありました.詳しいことはこの次のブログで書きますので,とりあえず上記の説明は一度取り消します.すいません.

統計的問題解決研究所

コメント