2018年06月11日

●「教師なし学習で『猫の概念』獲得」(EJ第4782号)

 すっかり、世間一般にAI(人工知能)という言葉が定着した
感があります。つい5年くらい前であれば、AIは専門用語であ
り、エンジニアしか知らなかった言葉です。したがって、書いて
いると、話がどうしても難しくなります。しかし、どうせ知るの
であれば、多少詳しいところまで、踏み込んで知る方があとあと
まで役に立ちます。
 どうしてコンピュータが人間と同じように見たり、聞いたりで
きるのでしょうか。ついこの間まで、コンピュータはモノのかた
ちを認識できなかったのです。ここに一枚の写真があったとしま
す。人が写っています。人間なら、すぐそれが人の写真であり、
女性の写真であるかがわかりますが、コンピュータは何の写真か
ぜんぜんわかりません。コンピュータが把握できるのは、無数の
小さいピクセル(画素)の集合体にしか見えないのです。それを
具体的な画像としてコンピュータに認識させる技術が「ディープ
ラーニング」です。
 添付ファイルを見てください。AIには、構造的にデータを入
力する「入力層」と、結果としてデータを出力させる「出力層」
があります。中間部には「隠れ層」という層がいくつもあります
が、データはそれらのいくつもの層を通過するごとに、少しずつ
具体的なかたちとしてとらえ、最終的に完全なかたちとなって出
力されます。そういう多くの層を通過することから「ディープ」
と呼ばれるのです。
 この画像認識について、早稲田大学ビジネスファイナンス研究
センター顧問の野口悠紀雄氏は次のように解説しています。
─────────────────────────────
 画像認識の場合、画像を多数の小さな部分(ピクセル)に分け
数値化したデータを、ニューラルネットワークの最初の層に人力
する。そこから第2層にデータが渡される際、各ニューロンの値
に異なる値(重み)を掛けた値を次の層の特定のニューロンに送
る。以降、同様にして最後の層までデータが渡され、最終的な出
力が生成される。
 何十万枚、あるいは何百万枚もの画像を読み込む学習によって
正しい答えを出せるようになるまで重みの値を調整する。現在で
はエラー率が5%まで低下しており、人問の画像認識能力とほぼ
同じになつている。対象によっては、人間より速く正確に認識で
きる。                ──野口悠紀雄氏論文
        「ディープラーニングの驚くべき威力と限界」
  『超整理日記/週刊ダイヤモンド』/2018年5月12号
─────────────────────────────
 コンピュータが画像を認識できるということは、手書きを含む
文字はもちろんのこと、モノの形状を認識できるので、宅配、郵
便などの物品の仕分け作業の分野などで、AIは、大いに役に立
つことになります。
 医療分野においても、AIの需要は高いのです。日本は医療機
械のCTとMRIの台数では、それぞれ世界第1位と2位ですが
それを撮影し診断する放射線医の数が圧倒的に不足しています。
したがって、AIを使えば、CTやMRIの画像の診断に役立て
ることができます。しかも、診断を重ねるごとに、判断の精度は
向上していくことになります。
 2012年6月のことです。グーグルとスタンフォード大学の
共同研究チームの開発したニューラルネットワークが、AIの歴
史に残る成果を発表します。ユーチューブの動画から「猫」の概
念を獲得したという発表です。「猫の概念の獲得」というのは、
コンピュータが、猫が写っている画像を見分けられるようになっ
たということを意味します。
 この場合、重要なのは、コンピュータに猫の特徴を教えていな
いということです。特定の何かが写っている動画を与えたのでは
なく、任意のユーチューブ動画で学習させただけです。実験内容
を少し詳しく述べます。
 具体的にいうと、ユーチューブにアップロードされている動画
からランダムに取り出した「200×200ピクセルサイズ」の
画像を1000万枚用意し、1000台のコンピュータを使って
9つの層のニューラルネットワークで、ディープラーニングによ
る学習を行わせたのです。
 AIは、さまざまなモノが写っている1000枚の画像を学習
し、パターン分析を行い、グループ分けを行ったのですが、その
なかで猫については認識できるようになったということです。そ
れは、おそらく動画には猫が一番多く写っていたのではないかと
思われます。実際にネット上には、おびただしい数の猫の動画が
溢れています。
 いわゆるニューラルネットワークの「機械学習」には、次の2
つの学習法があります。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 1の「教師あり学習」とは、文字通り人間が先生になって、つ
きっきりで、コンピュータに教えることです。たとえば、猫とは
どういうかたちをしているかについて、その特徴点を教え込み、
複数の動物の写真のなかから、正確に猫の写真を選ばせるように
する方法です。しかし、この方法では、AIはいつまで経っても
人間を超えることはできません。
 これに対して2の「教師なし学習」は、人間の助けなしにコン
ピュータに独力で学習させる方法です。多くのデータのなかから
自律的に学習させる方法です。グークルとスタンフォード大学の
共同研究チームは、これを達成させたのです。
 実は、猫だけではなく、自動車、椅子、人の顔などの概念も同
時に認識していたそうです。いずれにしても、この快挙によって
AIは人間に大きく一歩近づいたといえます。
          ──[次世代テクノロジー論U/026]

≪画像および関連情報≫
 ●パスポートをかざすだけで入国審査/「顔認証ゲート」
  ───────────────────────────
   法務省は2018年6月8日、国内で初めて成田空港で、
  11日から運用を開始する顔認証技術を活用した「顔認証ゲ
  ート」を公開した。パスポートをかざすだけで入国審査がで
  きるシステムで、事前手続きは不要となる。本格運用によっ
  て、出入国手続きの時間の短縮が期待される。利用者の多い
  中部、関西、福岡空港でも、年内に導入される予定。
   顔認証ゲートでは、ICチップが内蔵されたパスポートを
  機械にかざしチップの顔写真データと、自動化ゲートのカメ
  ラで撮影した顔をコンピューターで照合。同一人物か確認し
  顔が一致すればゲートが開く。
   対象は身長135センチ以上の利用者。法務省によると、
  他人を誤って入国させる確率は0・01%以下という。パス
  ポート発給時と顔が大きく変わっていなければ10秒ほどで
  終了する。マスクや帽子を着用していると注意を促すメッセ
  ージが機械に表示される。
   現行の出入国審査では、審査官がパスポート写真と本人を
  見比べて確認する手続きが一般的だった。昨年10月から羽
  田空港国際線ターミナルで帰国者を対象に3台が先行導入さ
  れていたが、本格導入は成田が初めて。今月11日から第2
  第3ターミナル、18日から第1ターミナルの上陸審査場で
  運用を開始する。        https://bit.ly/2sQYTaa
  ───────────────────────────

ニューラルネットワーク/ディープラーニング.jpg
ニューラルネットワーク/ディープラーニング
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
RDF Site Summary