過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

既存実験計画データを活用する

JMP実験計画

トップの「お問い合わせ」から質問のメールを頂くことがあります.時間があるときは,できるだけ丁寧にお答えしているけど,一般的な内容ならこの場で公開するのもいいかなと.もちろん,具体的な質問内容には触れませんけど.質問の概要は,既存のデータがあって,おそらく実験計画によるデータのようなのですけど,拡張計画を検討されているようで,コメントを求められた次第です.このような状況での考え方について思いついたことを順不動であげてみる.

まず,拡張計画を使う際にはその土台がしっかりしていないとダメです.カスタム計画である必要はないけれど,少なくとも何らかの実験計画のデータでなければ.軟弱な地盤の上にどんなに立派な家を建てても,その家は傾いてしまうからね.カスタム計画でなければ,あるいはカスタム計画であっても他の人が作った計画なら,「計画の評価」でその計画の穴を知ることも大事.その穴を繕うのが拡張計画だから.

先行実験がカスタム計画ならば,なぜ拡張実験しようと思ったのか,その理由も必要な情報です.先行実験が失敗したから,拡張実験するわけだから,失敗の原因は押さえておかなければ.モデルのフィッティングが良くなかったのか,最適解の再現性が良くなかったのか?仮にモデルが問題なくても,再現性が得られなかった場合は,拡張計画を実施するにしても,先行実験(オリジナルの計画)のどこを増強すればいいのか見当がつきにくいです.一方,モデルの寄与率が低くて,交互作用の見落としが推察できる場合,あるいは最適解が得られたとしても端点解(実験空間の境界に位置する)である場合は,拡張計画は有効です.

拡張計画については昔ブログで書いた記憶があるんだけど,英語ではAugment Designだから,拡張計画という訳は誤解を招くかも,と常々思ってる.あ,間違いではないですよ.AR(Augmented Reality)の訳が拡張現実で定着してるしね.だけど,Augmentは,拡張というよりは増強だと思うのです.ネット検索してもすぐわかるけど,Augという語幹は増えるという意味のラテン語から派生してるから.

それは置いといて,既存データから得られたモデルに積項を加えたり,実験空間を「拡張」して,計画の能力を「増強」するのが,拡張計画です.実はJMPの「拡張計画」プラットフォームでは拡張のタイプがいくつかあります.「反復」「中心点の追加」「折り重ね」「軸点の追加」「Space Filling」そして「拡張計画」です.オリジナルの計画の種類によってこれらは適宜使い分ければいいと思うけど,ダイレクトに交互作用を取り込めるから,カスタム計画と一番相性が良いのは間違いない.

拡張計画を前提として,ハイリスクなカスタム計画を立てるなんて戦略も面白い.結果として実験数が少なくて済むこともある.一つ注意が必要なのは,因子を見落としてた,共変量が固定できていなかったという基本的なミスであれば,拡張計画は役に立ちません.先行実験と後続実験とで因子が異なっていて,先行実験にない因子を拡張計画で追加することはできないので.できるのは,交互作用をモデルに取り込むことや,あるいは実験空間を拡張すること.重要な因子が先行実験でかけていたならば,最初からやり直した方がいいです.

もう一つ,拡張実験は,継ぎ接ぎの実験だから,場が変わってしまうことにも警戒してください.実験の場という言い方には注意が必要かも.例えば,半導体の場合,「実験の場」は高度に制御されているものの,下地(積載構造の下層)が変動していることがよくある.こういうのも含めて広い意味で場という言葉を使ってます.このため,拡張実験では,後続実験に先行実験と同じ条件を入れることを考えます.それが難しい場合は,先行実験で最小分散を与える実験条件を求めて,それを後続実験と一緒に実施すると良いです.

あとは,設計因子は追加できないけど,先行実験と後続実験とを層別化することはできる方,いわゆるブロック因子を追加することはできることも覚えておくといいです.こんなふうに.

まだ,他にも思いつくことはありそうだけど...実験数の選び方とか.実験空間を拡張する方針とか.これらは言葉だけでは説明しきれない.少なくともデモ計画でもないと一般化は困難なので,本日はこんなところにしておきます.

それでは.

統計的問題解決研究所

コメント