PORTAL TOKYO
  デル株式会社

科学者の眼(66)
自動判定機

  徳田 雄洋 東京工業大学名誉教授


 目の前に提示されたものが2種類のうちのどちらの種類に属しているかを判定する問題は2値分類問題と呼ばれている。判定問題の中で基本的でかつ重要な問題である。個人のレベルでも組織のレベルでも、日々頻繁に行われている。多少まちがえてもあまり影響の出ない場面から、まちがえることが決して許されない場面までさまざまである。

 人間の行う2値分類の判断を自動判定機で代用できると便利である。しかし自動判定機作りには、予想外に大変な試練が待ち構えている。この様子を、宝くじの当選者か非当選者かを判定する架空の自動判定機の場合で考えてみよう。以下対象とする宝くじの当選率は1000人につき1人、つまり1/1000とする。 

 まずは、素朴な手法を試してみよう。提示された人に対して、ランダムに1/2の確率で当選判定を出し、1/2の確率で非当選判定を出すのである。もし1万人の人がいれば、当選者は10人で、非当選者は9990人である。当選者10人のうち、5人に当選判定を出し、5人に非当選判定を出す。非当選者9990人のうち、4995人に非当選判定を出し、4995人に当選判定を出す。したがって当選判定をもらった合計5000人の中で本当の当選者は5人で、この自動判定機の判定精度は0.1%というきわめて低い値になる。 判定結果をランダムに出力しているので、この判定精度も仕方がないと思われる。

 そこで自動判定機の性能をがんばって向上させてみる。その結果、当選者の99%には正しく当選判定を出し、当選者の1%には誤って非当選判定を出し、非当選者の99%には正しく非当選判定を出し、非当選者の1%には誤って当選判定を出すようになったとする(このことを判定の忠実度が99%とここでは呼ぶことにしよう)。同じく1万人の人がいれば、当選者は10人で、非当選者は9990人である。
  今度は当選者10人のうち、9.9人に正しく当選判定を出し、0.1人に誤って非当選判定を出し、非当選者9990人のうち、9890.1人に正しく非当選判定を出し、99.9人に誤って当選判定を出すことになる。つまり当選判定をもらった合計109.8人の中で本当の当選者は9.9人で、この自動判定機の判定精度は9%という予想外に低い値になる。

 そこで判定の忠実度99%をもっと向上させてて99.9%にしてみる。こうするとようやく自動判定機の判定精度は50%に到達する。先の判定精度0.1%や9%の自動判定機と比べると判定精度はかなり向上したが、やはり判定精度50%では実用レベルをクリアしているとはいいがたい。そこでさらにがんばって判定の忠実度を99.99%に向上させてみる。こうするとようやく判定精度90.9%となり、当選判定10個につき、ほぼ9個は当選者を正しく、ほぼ1個は誤って示すようになる。

 自動判定機の性能は、目的とする当選率に十分見合った判定の忠実度を実現しないと、出力された判定のみで判断を下すことはきわめて難しいことがわかる。

 

     
「科学者の眼」indexページ
   
Copyright©2017 PortalTokyo.Inc. All rights reserved.