PORTAL TOKYO
  デル株式会社


科学者の眼(16)
検索の悪魔

  川合 慧 放送大学教授


  昨年の2008年7月に,マイクロソフトが一つの発表をしました.別に新しいソフトの発表ではなく,「外来語カタカナ用語末尾の長音表記の変更」です.要するに,今後は(たとえば)"ユーザ"ではなく"ユーザー"とする,という変更です.

  語尾の長音問題は,技術系の文章を書く場合には常に問題となってきました.ある雑誌ではcomputer, userを"コンピュータ","ユーザ"と書いて全然問題がないのに,別の単行本では全部"コンピューター","ユーザー"に直される,といったことが頻繁に起きます.個人の趣味以外に,何か規準はないのでしょうか.実はないことはないのですが,「いろいろある」のが問題を複雑にしているのです.

  科学技術系の分野では,忙しいのでしょうか,語尾長音はつけない傾向があります.日本工業規格(JIS)の用語もその流儀です.つまり"コンピュータのユーザがプリンタを使う"わけです.ところが世の中には内閣告示という偉そうなものがあって,平成3年6月に出された告示第二号には「長音は,原則として長音符号(ー)を用いて書く」とあります.つまり"コンピューターのユーザーがプリンターを使う"ことになります.この告示の注3には,「英語の語末の-er, -or, -arなどに当るものは,原則としてア列の長音として長音符号「ー」を用いて書き表す」とあるのですが,さらに「慣用に応じて「ー」を省くことができる」という文もあります.例として,"エレベーター","ギター","コンピューター","マフラー"に続けて"エレベータ","コンピュータ","スリッパ"が示されています.要するにきちんとは決められていないのですね.これに沿った変更をしようというのがマイクロソフトの発表だった訳です.

  この小文は「つけるべきか,つけざるべきか」で悩むためのものではありません.このような「慣用」とか「一般的使用」という場合にすぐ頼りたくなるWeb検索についての話です.用語などについてAとBという案がある場合に,「Web検索したらAが2000件,Bが500件だったので,Aを使おう」という議論がよく行なわれます.このやり方は,どのくらいの根拠があるものなのでしょうか.
 
  試しに"データ"と"データー"でやってみました.ある時点でやった結果は"データ"が146,000,000件,"データー"が248,000,000件で,長音符号つきの勝ち,のように見えます.他には,"コンピュータ"が47,600,000件,"コンピューター"は21,200,000件で,今度は長音符号なしが多くなりました.あと"ユーザ"が33,600,000件,"ユーザー"が123,000,000,"プリンタ"は8,950,000件,"プリンター"は4,710,000件,などなどです.まあ,勝ったり負けたり,というところでしょうか.ここで注意しなければならないのは,以上の検索はすべて引用符(")で用語を囲んでいることです.これをやらないと,例えば"コンピューター"で検索してもその部分文字列である"コンピュータ"を拾ってしまうので,件数が大幅に増加してしまいます.

  ある本を書くときにDiophantine方程式の用語が問題となりました.これは,ざっくり言うと整数係数の不定方程式で,解くのが難しい部類の方程式です.この方程式自体は非常に面白いので,興味のある人は調べて見て下さい.ここでの問題はDiophantineの訳語,というか,もとの人名Δι?ψαντο?(ギリシャ語)あるいはDiophantus(英語)を表わすカタカナ綴りをどうするか,ということになります.まあ,ふつうは"ディオファントス"または"ディオファンタス"なのですが,"ディアフォンタス"ではないか,と言う説もありました.早速検索です!"ディオ/ディア","ファン/フォン","タス/トス"と二択が3個ありますから,8通り全部やってみます.

ディオファンタス   1,320
ディオファントス   6,830
ディオフォンタス   295
ディオフォントス  110,000
ディアファンタス   2,260
ディアファントス   3,640
ディアフォンタス   409
ディアフォントス   60,200

  "ディオフォントス"が優勝しました.ではこれを選びますか?
 ここで引用符に思い至らなかった人は,検索の素人と言ってもいいでしょう.そうです,この結果は引用符で囲んでいない検索結果なのです.それでは引用符つきの結果を示しましょう.

ディオファンタス   1,320 → 686 ( 404)
ディオファントス   6,830 →6,810 (7,810)
ディオフォンタス   295 → 4 ( 3)
ディオフォントス  110,000 → 17 ( 15)
ディアファンタス   2,260 → 0 ( 0)
ディアファントス   3,640 → 0 ( 0)
ディアフォンタス   409 → 0 ( 0)
ディアフォントス   60,200 → 2 ( 2)

  今度は"ディオファントス"がダントツの1位,"ディオファンタス"が2位です.なお,括弧内は約半年後にやった結果です.結構変動していますが,"ディオファントス"の優位は変らないようです.それでは最初の"ディオフォントス"の優勝は何だったのでしょうか.その理由は部分文字列"フォント"です.ここだけマッチしたものも全部拾っているので,当然といえば当然の結果ですね.

  今は何でも検索の時代です.「ググる」というのも一般用語化しています.ただし,正しい使い方をしないと痛い目に合うことも多くなってきました.気軽な検索の結果をもとに何かを決めたり言ったりするのは,ちょっと,というか,絶対に考え直した方がいいでしょう.

 

ANAの旅行サイト【ANA SKY WEB TOUR】旅作割引キャンペーン・沖縄

「科学者の眼」indexページ
Copyright©2009 PortalTokyo.Inc. All rights reserved.