12月のSummit Japanでは,昨年よりインタラクティブにしようという試みがあって,私も「Networking with Committee Members」とかいう企画に協力することになりました.記念すべき第一回のSummit Japanで講演したというだけの理由で,Committee Memberの一人なんですよね.
昨年の発表では,事前収録した動画をオンデマンドで視聴するというスタイルだったのですが,今年は,スケジュールに沿ってストリーミングします.ですから,少しはライブ感が出るかもしれません.とはいえ,流石に動画は事前に収録しておくので,何か真のライブイベントをやりたい,ということのようです.
双方向のコミュニケーションをしようということなんですが,先日これのテーマを決める打ち合わせがありました.事前候補として,データサイエンスの普及とか,統計的思考についてとか,あげられていました.とはいえ,このテーマに関心があるのは,メーカーで教育を担当されている方くらいではないかという意見が出て,それはそうかもなと思った次第.
そこで,私の方から提案したのが,「推しのプラットフォーム」です.他のJMPerが普段どんな使い方しているのか興味ありませんか.自分が知りたいことは,おそらく皆さんも知りたいだろうと考えました.そこで,Comitteeの方々に普段どんなJMPの機能を使っているのか,推しのプラットフォームを語っていただこうという企画です.
時間は1時間なので,効率よく進行しなければなりません.そこで,最初に数分程度の事前収録動画を流して,各自の推しを説明することになりました.基本顔出ししますが,おそらくZoomのMeetingは使わないので,参加者の方は顔出しなしで大丈夫です.質問も意見も誰からも来ないと間が持ちません.皆さんの参加がなければ成立しないイベントなので,ぜひ積極的に発言をお願いします.
さて,私の推しのプラットフォームはいくつかあるのですけど,今回は話しやすいという理由で「パーティション」を挙げるつもりです.長所をいつくか思いつく限り上げてみます.確か,これらは『JMP ではじめるデータサイエンス』でも書きました.
- シンプルで手軽なので素早く分析できる.
- 結果に曖昧さが少ない.(統計処理に依存しないので安心)
- 誰にとっても結果が理解しやすい.
- スクリーニングにもモデリングにも使える.
- 予測式が作成でき最適化も可能.
- 質的・量的変数ともに扱える
- 二乗項や交互作用の有無も判断できる.
- 交差検証が手軽に利用できる.
- サブセットを作成して,層別分析に直ちに着手できる.
JMPの「パーティション」は便宜上「デシジョンツリー」と同じだと説明してますが,それだけじゃないんです.一番の特徴は,なんと言っても対話的に進めることでデータから技術的知見が獲得できることじゃないかな.データと対峙するという感覚が「パーティション」を前にすると強く感じます.
それと,もう一つ重要なのが,「パーティション」をデータを把握するためのツールとして使う方法です.このことについては,前々回のブログでも書きました.オーバーフィッティングを恐れず,データを切り刻んでいくんです.このように...
単なるモデリング手法なら,こういう荒っぽいことはできないですよね.こんなことやっても.大丈夫という懐の深さが「パーティション」の魅力です.Summitでは,ここらへんの説明を簡単にしようと思います.時間があれば,JMP Proに実装されている改良ロジックにも言及したいな.
それでは,また.
コメント