過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.
覚え書き

執筆中の悩み事など

少しまえから,このブログでもまた人に会う度に,性懲りも無く本を書いていると公言しています.そうでもして外堀を埋めないと挫けてしまうのです.ありがたいことではあるのですが,仕事も忙しくなってきていて,なかなか執筆に時間が割けません.できれば今年のSummitに間に合わせたいなと考えていますので,今月が勝負です.ということで,まあ誰が読んでいるかもわからないこのブログも暫く休載しようとも考えたのですが,執筆で悩んでいることなどを書きつつ頭を整理してみます. 先日行った大阪での一コマ.因みに本文とは全く関係ありません. 『統計的問題解決入門』ではページ数の制限に苦しみました.オリジナルの原稿で...
統計学

シロかクロか

しばらく前に書いたグラフの記事「JMPのグラフは地味なのか?」では,陸上女子の100mの世界記録を題材にとりました.そのとき,たまたま陸上女子のキャスター・セメンヤさんの記事を読んでいたというだけの理由だったのですが,いろいろデータを弄っていてジョイナーのドーピング疑惑に気付き,これは面白いかもと思い執筆中の書籍でデータ視覚化のネタとして取り上げることにしました.乞うご期待ください. 競技中の薬物使用は古代ギリシャにもありましたし,ライバルの闇討ちまでしたそうですから,勝つために手段を選ばないアスリートは昔からいたようです.自ら知らずしてドーピングされて組織の犠牲となった選手も...
覚え書き

実戦はマニュアルでは学べない(京都探訪)

久しぶりに京都に行ってきました.お会いした皆様どうもありがとうございました.新入社員の頃に現地調整員として一月ほど京都に滞在したことがあって,そのとき以来京都はお気に入りの土地です.底意地が悪いとかも聞きますが,おそらくそれは外から侵略者が多くやってくる土地柄ゆえのことでしょう.プラベートでも何回も旅行していますが,私の知っている京都の方々は皆さんとても親切です.私がよそ者だからかもしれませんが. 時間があったので,お気に入りの場所を巡ってみました. 木屋町通に流れる高瀬川は相も変わらず良い風情でした.人気のない先斗町もいい感じでした.昔馴染みの店はもうないのが残念ですが,今度は夜の...
覚え書き

実務のデータ分析における交渉力

以前から予告していたように,本日は分析手法の交渉力についてお話しします.中々時間が取れなかったのですが,ようやく思っていたイラストが描けたので,それもお披露目します.このイラストは書籍に掲載する予定ですが,その際は手直しが入るかもしれません. 版の古い間違った図を入れてしました.後日差し替えます. 実務のデータ分析ではそのゴールに「行動」があります.得られた「情報」をもとに「行動」しなければそのデータ分析は役に立ったとは言えません.そのためには人を動かす必要がありますが,何の根拠もなく人は動きません.メリットとデメリットを秤に載せて,その均衡が破たれたときに人は初めて行動します. ...
覚え書き

オーバーフィッティングとオッカムの剃刀

先日は某社で実験計画についてお話しする機会がありました.関係者の皆様,貴重な体験をさせていただきありがとうございました.時間がない中で詰め込みすぎた感があるので,後日何か疑問が湧きましたらいつでもご連絡ください.大阪の会社だったのであまり馴染みのない大阪の街を歩き回ったのですが,電車の中で大声で話している人がいて喧しかったり,コンビニの前で大勢の人がタバコを吸ってたむろっていたり,おっちゃんが自転車で暴走していたり,久しぶりの大阪は賑やかでした.歴史的な建造物もちらほらあって,重みも感じてよかったです.今まで行ったことがある大阪は大阪大学だったり,SAS社のサテライトだったり北寄りで,今回もど...
覚え書き

JMPとビッグデータ

今週は分析手法の交渉力についてお話ししようと思っていたのですが,この説明には図を描いた方が良いので少しお時間を頂いて次回に回させてください.と言いますのも,某社から実験計画の話をして欲しいとお招きを受けていまして,本日はその準備に追われて時間がないのです.今年初めのJMPer’s Meetingと同じ話でいいと言われてはいるのですが,講演で使ったスライドは基本的に残っていないので,同じ話は二度できないのです.もちろん,大元のスライドは保存しているので,聴講者に合わせて毎回それらを組み替えれば良いのですが,色々と手を加えたくなるのが常です. 今回も実験計画の必要性を訴えるという立場な...
覚え書き

一つを残してあとは捨てろ

先日は今年2回目のJMPer’s Meetingでした.前回は私自身が発表者でしたので緊張したこともあってあっという間でしたが,今回は後ろの席でのんびり拝聴させていただきました.ご講演はAGC株式会社の岡谷さんによる「改善・革新活動のためのEasy Data Science」というタイトルで,昨年のDiscovery Summitでのご発表内容を大幅に膨らませたものでした. 製造現場の担当者とデータ分析の担当者とを繋ぐ仲介者としてのお立場から,実際のご苦労を交えて事例を紹介していただきました.「PSL回帰」とか「主成分分析」のようなどちらかというと高度な手法を多用されていたのは意外でし...
JMP

グラフの話は続くよ

ここ暫くグラフの話が続いていて,そろそろ飽きてきました.違う話題に切り替えたいのですが,前回のお話で訂正しなければならないことがあるので,今週もグラフ背景の続きです.グラフビルダーでグラフ背景に画像を貼り付ける方法をお話しした際,分析プラットフォームのグラフでは貼り付けることはできるけれど,グラフサイズ一杯に引き延ばすコマンドがないので工夫が必要だと書きました.具体的には先に画像サイズを調整するなどの工夫をすれば良いわけです.ですが,JSLを使うとこのようにできることが判明しました. このヒストグラムは「一変量の分布」で作成したものです.参考までコードを以下に示します.あくまでも機能検証...
JMP

JMPのグラフ背景に画像を貼る

先日,某所で質問を受けました.それに関連して,少し前に書いたJMPの棒グラフの色を変える話の続編を「JMPのグラフ背景に画像を貼る」としてお話しします.質問というのは,グラフの背景に描画データにマッチしたグラデーションを入れたいというものでした.今までそのような必要性を感じなかったので,その場ではお答えできなかったのですが,結論から言うとJMPのグラフ背景に画像が張り込めるので,その機能を使えば可能です.このテクニックを応用すると,例えばこんな感じのグラフが書けます. このJMPくんは『統計的問題解決入門』の原稿に使ったそのものの画像なのでサイズが小さく,グラフ全体に引き伸ばしたのでボケてしま...
覚え書き

2つの相関係数

毎週土曜日の夜にブログを投稿していますが,このところ用事が立て込んできていることもあって,当面は週末から月曜日の朝までのどこかの時間に投稿することに変更します.おそらく日曜日の夜になることが多いと思いますが,とりあえず本日は今まで通り土曜日に投稿します.さて今日は何を書こうかと思案して,先ほどまで「Spearmanの順位相関係数」はどうやって出力するんだっけと,メニューを探っていたところでしたので,これを目指して書き始めます. 以前お話ししているかもしれませんが,今でもわたしの固有技術は計測だと思っています.新人当時は事業部として独立していた計測事業部に配属され,そこで産業分野における計...
覚え書き

連休の過ごし方

連休中はいかがお過ごしでしたでしょうか.毎週ブログを書いてはいますが,いつもJMPや統計に関わっているだけの日常ではありません.あまり訪れる人もいないと思うので本日は軽く連休中に何をしているかについて書いてみます. 子供の頃から石が好きで,小学生のときに当時としては大冒険だった長瀞に鉱物採集に友達を誘って出かけたりしていました.学生時代も地球物理学を専攻することを真剣に検討しましたが,当時は気象関係の研究室しかなかったので断念.結局,固体物理の研究室に入ったのですが,最初に読まされた論文が「鉄の相転移」に関するものでした.ご存知のように地球はほとんどが鉄でできているわけなので,地球物理には...
JMP

JMPで高齢者ドライバー問題について考える

高齢者の交通事故がニュースになりました.自分でも自転車に乗るので真っ二つになったフレームを見たときは冷や汗が出ました.連休間近の事故に犠牲者はもとよりご遺族のご無念痛み入ります.この報道で,改めて高齢者ドライバーへの風当たりが強くなっていますが,JMPerのわたしたちとしては冷静にデータをもとに思考すべきです.警視庁の交通事故統計表をもとに自ら分析されている方もネットで見受けたりしたので,わたしもちょっとやってみました.最初に結論(というか途中結果)を提示します.というのも,bloggerに越してからできるだけ冒頭にグラフィックスを出すことにしているからなのですが.このグラフについては以下で説...