カスタム計画の最適基準について（少し追加）

覚え書き

09.18.202012.08.2017

先日，カスタム計画について質問されました．同じ事前モデルにしても人によって最小実験数が異なるというのです．計画そのものは乱数計算で作成されるので人によって異なるのはそれが仕様なのですが，実験数は変わらないはずです．状況を確認したところ，人によって事前モデルの作成手順が異なっていたためということがわかりました．

このことを理解するためにはカスタム計画の最適基準について知っていることが必要です．本書にも書いたことですが，ほとんど場合はデフォルト設定である「推奨する最適化法」というJMPのおすすめに従っていればいいので，最適化基準の使い分けはもちろん，その存在を意識しなくても大丈夫です．とはいえ，推奨と言っても高度なアルゴリズムが背後にあるというわけではありません．基本はD最適基準が採用されて，「RSM」ボタンを使って事前モデルを作成する場合に限り「I最適基準」で計画が作成されます．二次の交互作用項と二乗項とを個々に追加しても全く同じ事前モデルが作成できますが，この場合はD最適基準で計画が作成されます．このため，同じ事前モデルでもその操作手順によって（基準が）異なった計画ができてしまうのです．この際，基準によって必要実験数が変わることがあります．5因子のフルモデルを「交互作用」「べき乗」のボタンで作成すると，最小が21，推奨が28の実験ができます．一方，「RSMボタン」を使うと最小が21，推奨が27になります．試してみてください．
それではなぜこの違いが出るのかということですが，実験計画をモデル行列として記述して，数理的な観点から眺めるとそれぞれの基準の意味するところは容易に理解できます．（最尤法は理解しているほうがいいですけど．）数式が書きにくいブログで詳細に説明するのは困難なので，乱暴ながらニュアンスだけお伝えします．言葉の定義もあいまいにしているので少々不正確なところもあるのはご了承ください．
まず最適化にはいろいろあるということは最適化設計の場合と全く同じです．何を最適化しているのかという違いがそれぞれの最適化基準の違いです．I最適基準ではJMP流にいうと（相対）予測分散が最適化（最小化）されています．予測分散とは予測値の分散のことで，ここらへんのことはモデルのあてはめのアナロジーで理解できます．この予測分散と誤差分散との比をとって相対予測分散と定義していて，この値は実験データには無関係になります．この場では，実験空間内で計画に固有の値（予測分散）が計算できると理解しておけばそれで十分です．このとき実験空間内での予測分散の平均値を最小化するのがI最適基準です．この平均というところがポイントです．一方，D最適基準は情報行列の行列式を最大化すると書籍には書かれています．まず情報行列とはパラメータ推定の精度向上のための情報を尤度関数の分散で表現したフィッシャー情報量の多次元分布への拡張版です．この情報量とは推定に必要な情報量と理解してください．行列式とは単位ベクトルがその行列によって変換されたベクトルで囲まれた単位体積ですから，それを最大化するということは情報量がより大きい計画によってパラメータ推定精度を高めることを目的としていることになります．
D最適基準とI最適基準の違いを視覚化してみました．この図は3因子のフルモデルで実験数16とした場合です．青丸がD最適の実験点で赤丸がI最適の実験点です．紫色の点は両方に共通している点で，中央の濃い赤丸は中心点で点が重なっていることを示しています．I最適計画には二つある中心点はD最適計画には一つもないことがわかりますね．

言葉だけの説明では限界がありますので，なんとなくという理解でOKです．最適化基準の定義を数式として覚えるよりも，最適化基準の意味するところを理解し，それによって最適化基準を使いわけられるほうが技術者には重要です．本書では入門書であるということを意識して，基準の使い分けは紹介しませんでした．JMPのおすすめはほとんどの場合D最適基準ですから多くの技術者はこれだけを使うことでも構いませんが，少し上級者は使い分けをしてもおもしろいですね．このことでカスタム計画作成の戦略の幅が広がるからです．
現時点での私の考える使い分けの戦略を書いておきます．まずD最適基準はモデルのパラメータの分散を最小化することを第一義にしているのでスクリーニングの目的で使うと有効です．このためには存在が不明な2乗項は事前モデルには入れないかわりに設計因子は可能な限り入れます．モデルのあてはめ精度が気になる場合は「中心点の数」をデフォルトの0から変更します．寄与率の高いモデルができたならばこのモデルで最適化設計に進みます．
しかしながら，このモデルの予測分散（の平均値）はI最適計画によるものよりも大きいはずなので，D最適計画の結果をもとにI最適計画に繋げます．この際，最適解を予測分散が最小になっている実験空間の中心に持ってくると良いです．スクリーニング後なのですべて因子の効果はそれなりにあるはずですから，事前モデルは「RSM」ボタンで作成することになります．おそらくこのような使い分けを想定しているのでJMPの「推奨する最適化法」の仕様は上述のようになっているのではないでしょうか．
この他JMPには交絡最適計画とうのもありますが，これもうまくつかうと大変有効な計画なのでいつか紹介します．更には最適計画には最適化基準としてA最適やG最適などもあって，これらはJMPには実装されていませんが，特にA最適はD最適の回転可能性 (design rotatability)という制約を外した最適基準と理解できるので，事前モデルにおける交互作用の確信度がある程度高い場合などではD最適のかわりに使うことで予測値の分散を低減できると考えています．
世には上述の最適基準の定義を解説した書籍は多くあるのですが実戦的な使い分けを教えてくれる書籍がないので，自らの事例でトライアンドエラーで使い分けを確立していこうと思っています．どなたか一緒にやりませんか？
それではまた．