過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

統計学の用語はなんか変?

覚え書き

その分野を新たに学ぼうとするものにとって用語は大変重要です.ほとんどの学問が西洋から入ってきた日本では,用語を訳するのに先人は大変な苦労をしたものです.オランダ語で書かれた解剖学書の「ターヘル・アナトミア」を翻訳した前野良沢・杉田玄白の悪戦苦闘は有名ですね.江戸末期から明治にかけての学問の世界では,自らの勉強だけでなく,その学問を後の世のものに伝えるために用語を作る必要がありました.この当時の先輩たちの努力をわたしたちは受け継いでいるのです.物理や自然といった抽象的な言葉では漢字固有の造語能力が活躍したのは言うまでもありませんが,個々の学問分野に固有な用語にも先人の工夫を感じることが多々あります.

 わたしが昔から感心しているのが岩石と鉱物の呼び分けです.両者の違いをご存知でしょうか.子供の頃からなぜか鉱物が好きで,小学生ときに秩父の長瀞に鉱物採集に出かけるほどだったので知っているのですが,鉱物とは単一の化学的組成よりなる物質で,岩石は鉱物が混ざり合って構成されている物質のことです.例えば,花崗岩は主に石英と長石という鉱物で組成されています.英語ではそれぞれGranite,Quartz,Feldsparと言います.もう一つ例を挙げます.安山岩は主に斜長石,輝石,角閃石から構成されています.英語ではそれぞれAndesite,Plagioclase,Pyrozene,Amphiboleです.ここで気づいたことはありませんか.わたしは英語圏の人は鉱物名を覚えるのに一苦労するだろうなといつも思っていました.石灰岩や水晶や石英などの例外はありますが,日本語では基本的に岩石は何々岩,鉱物であれば何々石という名前が付いているのです.英語では岩石には何々iteがついているものが多いのですが,わたしのお気に入りの緑泥片岩はGreen schistです.一般人にはそれが岩石なのかでさえ名前だけからでは分かりません.一方,日本語の命名はシステマチックなので,初学者にには大変ありがたいものです.岩石学あるいは鉱物学を日本にもたらし,その用語を後の世の人々のために苦労して訳した先人には感謝しています.

前置きが長くなりましたが,これに比べて統計学の用語の訳は初学者に優しくないと常々感じています.例を挙げるときりがないのですが,例えば「検定」は「test」の訳としては大げさです.QC検定というのがありますが,検定の意味はどこかの足切り基準で合格・不合格を判別することです.統計では,帰無仮説が棄却されるか否かを検定と呼んでいるわけではなく,あくまでも平均の差があるかないかという命題が検定の対象です.ここで帰無仮説が棄却されれば対立仮説を採択する,というように論を運ぶことになりますが,棄却できない場合は何の結論も下せないことはご存知の通りです.(サンプルサイズを大きくするなどして検出力をあげようという結論は出せますが.)従って,統計的検定には合格だけを判別するという非対称性があるので,日本語の検定とは意味合いが違うのです.testの良い訳が日本語にないのであれば,テストのままにしておくべきだったとわたしは考えます.テストであればその命題(の正しさ)に点数をつけて評価するという意思決定の意味合いも出てきます.

ついでに帰無仮説と対立仮説という言葉も通例に倣って使いましたが,どう訳せば「Null Hyposeses」が「帰無仮説」に,「Alternative Hyposeses」が「対立仮説」になるのかが理解できません.Null は「ゼロ」ですから,そこからプログラミングでは「何もない」という意味として使われています.本来はラテン語のnot any(何も)が由来なので,価値のないものということです.帰無仮説を「棄却できない場合は自分の研究が無に帰する仮説」などという解説も見かけますが,シャレのようにしか聞こえません.単に仮説あるいは最初に立ててみる仮説,あるいはシンプルにゼロ仮説というような用語の方が検定における立場の違い(差があることが嬉しいのかないことが嬉しいのか)を包含できるので初学者を惑わせなくて良いように思います.もう少し意訳して統計的仮説というのも良い訳ですね.対立仮説に至ってはAlternativeには対立という意味はないのでおそらく間違いです,そこになるのは別の価値観を持って取って代わるものという意味です.確かに二者択一のという意味もありますから,帰無仮説が棄却されたら対立仮説が採択されるという意味に解釈することもできなくはありませんが,帰無仮説は棄却できなかったときの対立仮説の立場が微妙になってきます.このとき対立仮説が採択できるわけではないのですから,やはり帰無仮説として対立するものではないのです.更には対立仮説は無数にあるというニュアンスもこの日本語には出ていません.わたしはAlternative Hyposesesの訳としてはAlternative Medicineを代替医療と訳するように,代替仮説と訳するのが良いと考えています.

しかしながら,学問の世界では一度決まったことは大きな不都合がなければ基本的に変わりません.初学者の立場としてはその用語を日本語として解釈するのではなく,その裏にある真の意味を理解する必要があります.このことが日本の統計学習者にとって大きなハンディキャップとなっているように感じています.この点,わたしはアメリカ赴任中に統計に興味を持って勉強を始めたので幸運でした.

最近,統計学を初学者向けに向けに統計の基礎を教える機会が増えてきたのですが,初学者には伝統的な統計用語の背後の意味を捉えた用語を対応けて教えるようにしています.

統計的問題解決研究所

コメント