過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

モデルのスクリーニング

JMP講演

昨日更新できなかったので,月曜日の今日改めて.このところゆっくりブログも書けない状況でしたが,そろそろ来週あたりからは時間ができるかなという感じになってきました.

Networking with Commitee Membersというオンラインイベントで「推しのプラットフォーム」の企画があると先日お伝えしました.私は「パーティション」についてお話しするつもりとも.実はその収録を昨日やっていました.自宅で収録するともなると,昼間は何やら騒がしいので夜間がいいのですが,いざ実施しようと思っていたら,台風のような暴風雨があったりして延び延びになっていました.

一度収録は終えていたんですが,「モデルのスクリーニング」の「k分割交差検証」について思っていたことと違っていたことがわかり,収録し直す必要があったのです.JMP15までの「パーティション」の「k分割交差検証」が一般的なロジックと異なることは,このブログでもお話ししましたが,今回「モデルのスクリーニング」の「パーティション」に実装されている「k分割交差検証」も,一般的なロジックと異なるようだということです.

どう異なるかというと,検証データが20以下では実行できないということです.例えば,サンプルサイズが100のデータでk=5とすると,「分岐」できません.k=4にすると問題なく,一般的な「k分割交差検証」が実行できます.この理由は,「モデルのスクリーニング」の「k分割交差検証」は「パーティション」に限り,「パーティション」の除外データを検証データとするというロジックを使っているからです.

他のモデリング手法,例えば「ブースティング ツリー」の「k分割交差検証」は検証データのサイズに関わらず実施できるののが不思議なところです.おそらく,JMP16で従来の「k分割交差検証」を廃止する際,代替のロジックを載せる時間的な余裕がなく,既存の除外行を検証データにする,という既存ロジックで代用したからでしょうか.

そう言えば,除外行を検証データにするという機能も廃止されてしまいました.これはオプション扱いになる,JMP15までは邪魔だったので,廃止されても困りませんが.

毎年のように何らかの形で発表していますが,発表する機会がなければ知り得なかったことがあるということに毎回気づきます.世の中に向けて発信することは,自分を磨くためにも重要なんですね.皆さんも.来年のSummitで自分の研究や考え,事例などを発表してみませんか?その気があるならば,助言させていただきますので,お気軽にお問い合わせください.

それでは.

統計的問題解決研究所

コメント