過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

Discovery Summit Tokyo 2019

JMPではじめるデータサイエンス

Discovery Summit Tokyo 2019では多くのJMPユーザーとお話しできました.日本での開催は6回目で,私はその最初の登壇者の一人として初回から参加していますから,顔なじみの方も大勢いて,大変楽しいひと時を過ごせました.JMPユーザーの皆様,SAS社の皆様,どうもありがとうございました.今回は,拙著の即売会も開催していただきましたが,予想していたよりも多くの皆様にお買い求めいただけたとのことで,大変ありがたく思っています.今後,このブログでは『JMPではじめる統計的問題解決入門』だけでなく『JMPではじめるデータサイエンス』のサポートもしていくので,よろしくお願いします.


最初にお詫びですが,今までブログのTOPページの一番下にコメント欄を設けていたのですが,その設定に問題があったようです.過去にコメントいただいたとしても,それが読めない状態になっていました.そこで先週の記事からは投稿ごとにコメント欄を儲ける設定に変更しました.今までコメントして頂いた方々には大変申し訳なく思っています.過去のコメントも読めない状況なので,お手数ですが質問等を頂いていたならば,改めてコメントを頂ければありがたいです.申し訳ございませんでした.

基本的にコメントは公開しませんが,一般的な内容のご質問に対しては,ブログの場で回答させていただこうと思っています.個別に返事をご希望の方は連絡用のアドレスをお忘れなく.因みに書籍に関する質問等であれば,どちらの本かということと,関連ページも書き添えてください.

今回の即売会では『JMPではじめる統計的問題解決入門』と『JMPではじめるデータサイエンス』の二冊を並べたのですが,「私にはどちらが向いていますか?」という質問が複数の方からあったので,あらためてこの二冊の違いについてお話しします.

『データサイエンス』はJMPを使い始めた方を対象としています.もちろん,以前から使っているけれど,どうもうまく使いこなせていない,と感じている人も対象です.結構細かいことまで書いたので,JMP上級者でもおそらく参考になるかもしれません.JMP15にも対応したので(JMP14.2準拠ですけど)JMP15との違い(本書のカバーする範囲では大きな違いはありませんが)などもある程度把握できるように書きました.

データサイエンスとありますが,そこは統計分析やデータ分析と読み替えてもらっても差し支えありません.とはいえ,データサイエンスとデータ分析は別物として捉えるのが本書の立場です.特に日本ではデータサイエンスというと,ビッグデータを機械学習にかけて収益を上げる技術,という特定の意味に捉えられがちですが,本書ではデータサイエンスの再定義を試みています.

といっても,このように考える方はたくさんいらして,本書にユニークな考えというわけではありません.JMPでなくSASのほうの主催だったのですが,しばらく前まで,ヒルズのSAS Japanのオフィス入口に「なつやすみ 親子でデータサイエンス」というイベントの成果が貼られていたのをご覧になった方も多いかと思います.ソフトベンダーのSAS社がこのようなソフトとは直接関係ないイベントを開催するというのは立派ですね.上記URLにある統計レクチャービデオをご覧になっていただくとわかると思うのですが,まさにデータサイエンスとはこうあるべきと考えます.誤解をおそれずに言いますが,データサイエンスという言葉は昨今少し汚れてしまっていると思います.そこで,純真な小学生になったつもりで,本来のサイエンスとしての役割担うデータサイエンスをJMPを使って学んでいきましょう,というのが『JMPではじめるデータサイエンス』の趣旨なのです.

一方,『統計的問題解決入門』はこれから実験計画をはじめるJMPユーザーのために書きました.実験計画にも様々な種類がありますが,その中でもカスタム計画を取り上げています.基本的に,実務ではカスタム計画さえ知っていれば十分というのが私の意見です.ですから「カスタム計画」と「決定的スクリー二ング計画」以外の計画は知らなくても良いという内容になっているので,実験計画を勉強するためというよりは実務で実験計画をどのように適用するかを勉強するための本,といったほうが正確かもしれません.カスタム計画には基礎データからの情報を取り込むことがコツですから,第一講,第二講でデータ分析を軽く取り上げています.それを大幅に拡充したのが『JMPではじめるデータサイエンス』と考えていただければよろしいかと思います.

書名に入門とついているほうがJMPの入門書ではなく,入門とついていないほうが実はJMP入門書であるという,紛らわしいことになってしまいました.7日間でデータサイエンスを学ぶとかも表紙に書いてありますが,この辺の事情はそのうちお話しします.

本日は時間がきましたのでこれにて.それでは,また

統計的問題解決研究所

コメント