過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

2019

覚え書き

年末雑感

基本的にその日に思ったことを書くブログなので,年末の話題としては相応しくないかもしれませんが,少しお付き合いください. 沢渡あまね(2019)『仕事ごっこ』技術評論社,という本があります.昭和の常識を糾弾していて,並んでいる例は少し極端かなとも思いますが,こういう会社はまだ日本には多いのかもしれません.日本の製造業の凋落が叫ばれて久しく,今年も色々なことを目の当たりにして,その感が強まった一年でした.その理由については様々に分析されていて,どこで読んだか忘れてしまいましたが,夏野剛さんが「iPodをウォークマンの類としか見做せなかった」と言われていて,なるほどと思ったのを記憶しています. ...
JMPではじめるデータサイエンス

練習2で使うファイルについての補足

リリースしてまだ日も浅いのですけれど,オーム社に読者から問い合わせがありました.そこで,本日は『JMPではじめるデータサイエンス』の訂正というか補足についてお知らせします.p72の下から始まる練習2で「学校保健調査」のデータをダウンロードするのですが,そこで説明しているファイル名が実際と異なっているというご指摘でした.早速確認したところ,練習に使うファイルのファイル名は確かに現在のe-Statでは「h30_hoken_toukei_05.xlsx」となっていました.書籍に掲載したファイル名と異なっています.下の図の一番上(表番号5)のEXCELファイルが該当するファイルです. 記録によれば,...
JMPではじめるデータサイエンス

『JMPではじめるデータサイエンス』のサポートについて

『JMPではじめるデータサイエンス』を上梓してちょうど一月経ちました.サポートファイルはオーム社からダウンロードできますので,ぜひ実際にJMPを操作しながら読んできただければありがたいです.PCを使いながら読むことを意識し,そのために本書では図番を使わないという専門書では珍しい書き方,レイアウトを採っています.あの図番というのは紙面を有効に埋めるための出版側の都合で,読者の立場からは目があっちこっち行かさせてただ読み辛いのです.目が上から下へ流れるようにレイアウトするのは紙の書籍では大変でしたが,オーム社に頑張っていただきました. 今回も出版記念講演をSAS社の後援で開催する予定ですので,そ...
統計学

統計リテラシーと統計思考

このブログでは「統計リテラシー」という言葉を使ってきました.その名を冠したセミナーなどを実施していて今更なのですが,ここのところ,改めて「統計リテラシー」とは何かと考えています.Googleで『統計リテラシー』と検索すれば,おそらくトップに総務省統計局の『なるほど統計学園高等部』 がヒットすると思います.私見ですが,ここに書かれているのは,統計リテラシーというよりも,むしろデータリテラシーと呼ぶべきものです.試しにこの文章の「統計」を「データ」に置き換えてみてください.なんかしっくりきませんか? 「データは事実をできるだけ客観的に捉えられるように作成されたものでなければなりません。また、デー...
覚え書き

紅茶とインフルエンザ再び

ここのところ冷え込んできましたね.先週もインフルエンザの話をしたばかりですが,今年は例年より流行期入りが早いということです.全国に約5000ある医療機関からのインフルエンザ患者の報告数が定点モニタリングされていて,その平均が1を超えたときが流行期入りの目安です.厚生労働省によれば,都道府県ごとに集計すると,11月17日時点で,31都道県が流行期入りしています.こうなると加速度的に患者数が増えていきます.今年はラグビーのワールドカップが開催されたりして,訪日外国人が多かったことが例年よりも早い流行の原因とみられています. インフルエンザ過去10年間との比較グラフ(11/29更新)を見る...
JMP

JMPとアクティブ・ラーニング

昨年も同じネタを書いたのでよく覚えているのですが,11月1日は紅茶の日でした.先週はSummit直後だったので書きそびれてしまいましたが,今年も紅茶協会が紅茶はインフルエンザ予防に効果あるというツイートが流れてました.今年は「無責任なこと言うな」とか「誇大広告ではないか」などと言う反応もあって,去年と違ってプチ炎上したので,統計リテラシーを備えた方々が増えてきているのかも知れません.とは言え,これが雑誌や新聞などのメディアに取り上げられると,もはや疑うことをしない方々もネットでは多くいらっしゃるのも事実です. 私は統計リテラシーのセミナーを色々なところでやっているのですが,この紅茶の...
JMPではじめるデータサイエンス

Discovery Summit Tokyo 2019

Discovery Summit Tokyo 2019では多くのJMPユーザーとお話しできました.日本での開催は6回目で,私はその最初の登壇者の一人として初回から参加していますから,顔なじみの方も大勢いて,大変楽しいひと時を過ごせました.JMPユーザーの皆様,SAS社の皆様,どうもありがとうございました.今回は,拙著の即売会も開催していただきましたが,予想していたよりも多くの皆様にお買い求めいただけたとのことで,大変ありがたく思っています.今後,このブログでは『JMPではじめる統計的問題解決入門』だけでなく『JMPではじめるデータサイエンス』のサポートもしていくので,よろしくお願いします. ...
JMPではじめるデータサイエンス

JMPではじめるデータサイエンス

少し前から騒いでいた書籍ですが,いよいよ書店に並びます.『JMPではじめるデータサイエンス』というタイトルで,Amazonでは既に予約可能になっています.データサイエンスとありますが,機械学習の本ではなく前著『JMPではじめる統計的問題解決入門』よりも広範囲のJMPユーザーを対象としています.本書については,書籍がリリースされてからこのブログであらためて紹介する予定です.来週のDiscovery Summit Tokyo 2019に参加なさる方は,即売も予定されていますので,どのような書籍なのかぜひ覗きにきて下さい.特別価格で少しは安く買えるはずです.おそらく,そんな人いないと思いますが,サイ...
覚え書き

JMP15で何が変わったか? その2

「グラフビルダーの機能向上」については先週のブログでは詳細には触れませんでしたので,少し評価してみました.といっても,まだ十分に内容は把握できておりませんので,思い違いとかあるかもしれないことご了承ください.そもそも,JMP15のグラフビルダーの新機能については,色々と公式リリースには書いてありますけど,(少なくとも私が)日常的に使う機能ではないので,気付いていないことも多いと思います. 公式の説明には箇条書きでいくつかの項目が並んでいるので,それらを追っていきます. a) ヒートマップおよび箱ひげ図をカスタマイズする新しいオプション。 この2つのグラフにオプションが加わったとのこと...
覚え書き

JMP15で何が変わったか? その1

JMP 15についての情報が公式にSAS Japanのサイトから発表されています.実験計画や多変量管理図あるいはJSLなど,やや専門的な機能やJMP Proでは興味深い機能が実装されましたが,普通のデータ分析で使うような機能では何が変わったのか.本日はそれを検証して,完全に個人的なABC評価(A:嬉しい,B:まあまあ,C:元に戻して)をつけてみたいと思います.JMP15 Trialでの評価ということと,まだ時間をかけて吟味はしていないので,現時点での一次評価かつ個人的な独断ということでご了承ください. 公式ページの「JMP® 15およびJMP® Pro 15の新機能」の一番下に新機能の概...
覚え書き

ROC曲線

今週もまだ校正でどたばたしております.この段になって,気づくことも色々あって,此の期に及んで泡食っています.前著でも出版後にいくつか修正入れさせていただきましたが,今回もこの場で修正をご報告するつもりです.できるだけそおようなことがないように校正を続けているわけですが,単純なタイポであればともかく,調査が必要な類も多いので苦労しています.いくつか例を挙げてみます. ROC曲線のROCは,Receiver Operating Characteristicの略だと思っていたのですが,執筆中に念のために確認したところ,Googleでトップに上がっていた以下のページに,Receiver O...
覚え書き

台風一過

台風一過の今日はどうお過ごしでしたでしょうか.私はといえば,少し前から騒いでいる校正作業に大忙しです.それというのも,ここにきてJMP15のリリースが間近いことが判明したからです.そもそも,今回の書籍は企画段階でJMP15対応にすべきか悩みました.おそらく,USのSummitでアナウンスがあって,実際にリリースされるのは年明け早々と踏んでいました.出版社とも相談して,それまで待っていても仕方ないとJMP14で執筆開始したのです.本書の出版日にはまだ最新版は14.2だと予測していたのですが,それは見事に外れてしまいました.既にトライアル版はJMP15に切り替わっているので,企業機密ではないと思う...