過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

不整脈の話

JMP

先週NY州のクオモ知事のことを少し持ち上げて書いたら,情報隠蔽の疑惑が持ち上がったようです.だから時事ネタ(というほどのものではないけど)を書くのは避けてたんだった.政治に関するネタも同類ですね.コロナもデータとしてみるのは面白いんだけど,コロナについて論評すると,グループ分類されてしまうのが怖い.経済を回そうという派閥とコロナ撲滅を優先する派閥に強制的に判別されてしまう風潮.

いえいえ,私はそのどちらでもないんですけど.どこかの政治家がブレーキを踏みつつアクセルを踏むというようなこと言ってたけど,それはみんなが疲弊するからやめて欲しいとは思います.ドライビングテクニックにヒール・アンド・トーというのがあるけど,絶妙のタイミングでアクセルとブレーキを踏み分けるようなことは必要ですよね.やはりこのブログでは,時事ネタもときには織り交ぜて,JMPや統計ネタを中心に書いていくのが相応しいです.

ちょうど今週は,以前から不思議に思っていたことが判明したので,そのご報告.セミナーでよく使うJMPのサンプルデータに「Arrhythmia.jmp」というのがあります.これは有名なUCI(カリフォルニア大学アーバイン校)の機械学習用のデータセットから引用したデータなんです.Arrhythmiaというのは不整脈のことで,心電図の波形データがその不整脈の病態をクラス分類した所見とともに示されてます.このデータを使って「外れ値を調べる」とか「欠測値を調べる」とかの練習をしてもらうんだけど.いつも,この講義をしてて,不思議に思っていることがあったんです.

それは「温度」列と「モデル化変数」列がなぜこのような変数名になっているのかということ.ここのところ,UCIのオリジナルデータでは「T」と「P」とだけ書かれている.これが何を意味するのかはAttribute Informationにも書かれてないんだけど,少しでも心電図を知っている人なら,それぞれ「T波の電気軸のベクトル角度」「P波の電気軸のベクトル角度」であろうことは想像できる.

心筋の興奮による電気変化を記録したのが心電図だけど,心臓は立体的だから実は電気変化も立体的なんです.ということは,心起電力は大きさと方向を持ったベクトル量として表現され,このベクトルの向きが心臓電気軸です.心電図を読むには電気軸を読むのが大切です.細かいことは脱線するから省くけど,「T」も「P」も実は角度ということだね.

だから「温度」という訳には首を傾げてた,ちゃんと列コメントには「T波のベクトル角度」と書いてあるし.角度と書くつもりで温度にタイプミスしたのかもと推察できる.それならなんで「T波のベクトル角度」がモデル変数になるんだろ?というのが前々からの疑問.今週ついにその理由を聞くことができました.

結果から言うと,弘法も筆の過ちだったようです.日本語版のローカライズを担当されている方はとても優秀な方で,米国SAS社でも「ジーニアス」と呼ばれているくらいの方なんですけど,見逃してしまったみたいですね.誤植やタイプミスが排除しきれないことは,拙著の出版で痛いほど身に染みてます.最終原稿は印刷物に赤を入れて直接神田のオーム社に持って行ったっけ.時間ギリギリまで校正したかったのです.電車の中で3か所もミスを見つけて,絶望したのを覚えてます.不可抗力なのにうるさいこと言ってしまったかなと少し後悔してましたが,JMP16.1で修正してくださるとのお返事を頂き,それを聞いて安心しました.

因みに,この「Arrhythmia.jmp」は昨年のサミットオンラインでジョン・ソールさんも使われていました.あのときは,「J」列に欠測値が多いから分析から除外する...と言うようなことを言われていましたね.ですが,この「J」はJ波を意味していて,健常者にはJ波が観測できないことの方が多いことを踏まえると,欠測値が多いからといって単純に除外するのは待ってください.この場合の欠測値には「欠測している」と言うとても大きな意味があるからです.これは実験計画でも問題になることなので,そのうち書きます.(忘れなければ)

心電図に見られるP波,Q波.R波,S波,T波のなかで,QRS群は心臓のポンプ機能を反映してます.このQRS群とSTの接合部がJ点で,ここが0.1mV以上持ち上がる所見がJ波なんです.J波の存在から致死性不整脈を予知できる場合もあるけど,難しいのはJ波は健常者にも見られること.いずれにしてもJ波の危険度を見極めることができれば,ハイリスク被験者をスクリーニングできると考えられているそうです.

脱線してしまいました.それでは今日はここまで.

統計的問題解決研究所

コメント