2018年07月30日

●「AIのコンテスト/ローブナー賞」(EJ第4816号)

 5月7日にスタートした今回のテーマは、今朝で60回になり
ます。しかし、まだ書くことがたくさんあるので、あと10回程
度は続ける予定です。
 折からのAIスピーカーのブームに関連して、ここでもう一度
「チューリングテスト」に話を戻します。アラン・チューリング
がこのテストの構想を論文に書いたのは1950年のことです。
それから40年が経過した1990年になって、このテストは、
「ローブナー賞」という名称を冠した一種の競技会として、現在
まで連続して開催されています。その第1回の大会は1991年
11月に行われています。この競技会の趣旨は、AIの研究を発
展させることを目的としています。
 毎回、世界中から多くの「チャット・ボット」が出品され、そ
の出来栄えを競っています。「ローブナー賞」は毎年開催されて
いますが、2014年になってはじめてコンピュータが勝利を収
めています。しかし、「ローブナー賞」には大きな問題があり、
それを批判する学者も多く、これが果して真のAIの発展に寄与
するかどうかは疑問です。
 「ローブナー賞」のルールを確認しておきます。壁の向こうに
は、コンピュータと人間がいます。そして壁のこちら側にテスト
をする人たちが複数います。この状態で会話するのですが、会話
は音声ではなく、ディスプレイ上に文字で示されます。しかも、
時間はたったの5分です。これで判定ができるのでしょうか。
 このコンテストは、AIコンピュータがいかに人間を騙せるか
を競うものです。しかも、判定も100%ではなく、10人中3
人の判定者がコンピュータを人間と判断する──コンピュータ側
からいうと、判定者の30%を騙した時点でコンピュータの勝利
になります。つまり、かなり判定基準が甘いということです。
 そうであるのに、約24年間、コンピュータが勝利することは
なかったのです。時間が5分間と短いのも、あまり長く対話する
と、コンピュータにとって不利なので、時間を短くしているのだ
と思うし、音声ではなく、ディスプレイ上での文字の対話になっ
ているのも同じ理由と思われます。この競技ではじめてコンピュ
ータが勝利したときも、かなりモメたのです。そのときの状況に
ついて説明します。
 2014年6月のことです。英国のレディング大学で開催され
た「チューリング・テスト/2016」で、13歳のユージーン
・グーツマンという少年の設定の「ユージーンくん」と称するプ
ログラムが、人間と間違えられたのです。「ロープナー賞」のは
じめての受賞ということになります。
 しかし、この判定に多くの批判が殺到します。はじめて、ルー
ルが甘すぎることに気が付いたのでしょう。しかも「ユージーン
くん」は、ウクライナ在住で、英語は母国語でないので、あまり
得意ではないという条件付きです。しかし、「ユージーンくん」
は自分が分かる質問には流暢に答えを返し、分からない質問をさ
れても、巧みに話題を切り替え、少し皮肉めいたユーモアを交え
た対応をしたそうです。
 これは、アイフォーンの「シリ」のレベルと考えられます。シ
リは既にこの時点で、わからないときでも、気の利いた返事を返
しており、このプログラムとよく似ています。シリは、2011
年のアイフォーン4Sから標準機能になっており、2014年で
あれば、「ユージーンくん」が相当巧みな対話をしても不思議で
はないからです。
 しかし、既に述べているように、これはコンピュータが質問の
意味を真に把握して対話をしているのではなく、「人間らしくみ
える対話」をしているに過ぎないのです。いい替えると、人間を
騙す対話をしているわけです。つまり、それらしく見せているに
過ぎないということです。
 これに関して既出の小林雅一氏は、コンピュータが「人間らし
くみえる対話」をしても、それが真のAIの発展に結びつくとは
思えないとして、その理由を次のように述べています。
─────────────────────────────
 その理由は、ローブナー賞のような競技会では、どの参加チー
ムも勝負を最優先するあまり、肝心のAI技術を向上させること
よりも、もっと低レベルの手練手管に注力してしまう嫌いがある
からです。たとえばAIプログラムが短気で陰険な人間に扮して
あからさまに人間(判定者)を挑発するような答えを返す。逆に
やたらと愛想が良かったり、どうでもいいようなことを饒舌に喋
りまくったりする。このように、いかにも人間らしいパーソナリ
ティを作り出すことによって、壁の反対側にいる判定者を騙そう
とする傾向があるようです。
 が、そういった表面的な工夫によって欺かれてしまう判定者が
少なくないことは、(テストを考案したチューリング氏の意に反
して)会話程度のことでは、AIコンピュータが真の知能、まし
てや人格などを有しているか否かを判定するには不十分と言える
かもしれません。         ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 実際AIと人間との対話は、AIが本当に意味がわかっていな
くても、かなり流暢にできるようになっています。それに加えて
AIは、ウェブサイトからも情報は読めるので、何かわからない
ことをAIに尋ねるレベルのことは十分対応可能です。その限り
において、AIスピーカーは人間の役に立っており、だから、売
れているのです。
 しかし、とくにテーマのない雑談をしたり、カウンセリングな
どの真の相談相手としては、まだまだそのレベルに達しておらず
「弱いAI」のままです。しかし、カーツワイル氏のいうように
もし指数関数的に技術が進化すれば、ある日突然、可能になると
いうことは、十分あるといえます。「強いAI」にはなっていな
いのです。     ──[次世代テクノロジー論U/060]

≪画像および関連情報≫
 ●『機械より人間らしくなれるか?』─人間らしさの測り方
  ───────────────────────────
   チューリングテストというものをご存じだろうか?「機械
  には思考が可能か」という問いに答えを出すために、数学者
  のアラン・チューリングが1950年に提案した試験のこと
  である。審判がコンピュータ端末を使って姿の見えない「2
  人」の相手に5分間ずつチャットする。一方は、本物の人間
  (サクラ)、一方は<AI(人工知能)。チューリングは、
  2000年までにコンピュータが5分間の会話で30%の審
  判員を騙せるようになり、「機械は考えることができると発
  言しても反論されなくなる」と予言した。
   その予言は、いまだ実現していない。だが毎年毎年、数々
  の腕自慢たちが「最も人間らしいコンピュータ」の称号を手
  にすべく、我こそはと名乗りをあげてきた。本書の著者も、
  チューリングテストの中でも、最も有名な大会であるローブ
  ナー賞に参加した人物である。
   しかし、著者が目指したのは「最も人間らしいコンピュー
  タ」の称号ではなかった。この大会にはもう一つ興味深い称
  号も存在するのである。審判員から最も得票を集め、さらに
  その自信度も最も高いサクラに贈られる称号、「最も人間ら
  しい人間」賞の方であったのだ。本書は、そんな人間らしさ
  を追求した著者の挑戦記でもある。https://bit.ly/2LlYl8u
  ───────────────────────────
●図の出典/http://noexit.jp/tn/doc/chu.html

チューリングテストの仕組み.jpg
チューリングテストの仕組み
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス: [必須入力]

ホームページアドレス:

コメント: [必須入力]

RDF Site Summary