2018年06月13日

●「どのように画像の特徴を掴むのか」(EJ第4784号)

 そもそも「ディープラーニング」は、何がきっかけになって、
注目されたのでしょうか。
 「画像認識コンテスト/ILSVRC」という国際的なイベン
トがあります。このコンテストは毎年行われ、世界中の一流大学
や研究機関がエントリーして、独自のアルゴリズムを競い合う技
術競技です。ILSVRCは、次の言葉の略です。
─────────────────────────────
  ILSVRC
  ImageNet Large Scale Visual Recognition Challenge
─────────────────────────────
 2012年のILSVRCのことです。そのとき、1200万
画素・1000カテゴリの画像認識の問題に対し、ジェフリー・
ヒントン教授率いるチームが圧勝しました。このとき、使われた
のがディープラーニングです。勝敗は、画像認識エラー率で競う
のですが、他チームの平均エラー率が26%だったのに対し、ヒ
ントン教授率いるチームのエラー率は16%だったのです。この
結果には、世界中が驚愕したのです。以来、ディープラーニング
は世界中で有名になったといえます。
 さて、「ディープラーニング」は、機械学習の一つです。6月
11日のEJ第4782号で述べたように、機械学習には次の2
つがあります。再現します。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 画像認識の場合、人間であれば、その画像の特徴というべきも
のを無意識に掴んで、それが、どういう画像であるかを判断しま
す。ディープラーニングの場合は、どのように把握するのでしょ
うか。日本のAI研究の第一人者である松尾豊東大准教授は、こ
れについて次のように述べています。
─────────────────────────────
 例えば、画像の場合、画像の中から特徴量を自動的に切り出す
ことができる。特徴量とは、簡単なものだと、エッジの検出、角
の検出、などのようなものから始まり、それが組み合わさること
によって「顔がある」「これは人間の顔」「これは猫の顔」など
という高次の特徴量へとつながっていく。そうすることで高次の
特徴量も自動的に取り出すことができるのです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 ここで松尾准教授のいう「特徴量」という言葉について、知る
必要があります。特徴量とは特徴を数式化したものをいいます。
アルファベットを例に上げます。AIは、その形状からアルファ
ベットというものを次の3つのパターンに分類して認識します。
─────────────────────────────
  1.中心から縦に引いた線を境にして左右の形が等しい
    A、H、I、M、O、T、U、V、W、X、Y
  2.中心から横に引いた線を境にして上下の形が等しい
    B、C、D、E、H、I、O、X
  3.上記「1」と「2」の条件を両方とも満たしている
    H、I、O、X
                  https://bit.ly/2l5zCWF
─────────────────────────────
 どういう仕組みで、画像の特徴量を把握するのかというと、そ
こには、「オートエンコーダ」というものを使うのです。松尾准
教授は、次のように述べています。
─────────────────────────────
 オートエンコーダーというものを使います。従来の機械学習な
ら、「教師あり学習」、「教師なし学習」という分け方をするこ
とが多かったのですが、ディープラーニングは「教師なし学習」
だが、一見すると「教師あり学習」のような扱いをするのです。
 どういうことかと言うと、例えばコンピューターに画像のデー
タを与えた場合、コンピューターは画像の一部を消して、その一
部を残った部分から当てなさいという問題に変えるのです。そう
すると、画像を与えただけで、たくさんの擬似的問題を作ること
ができる。それをニューラル・ネットワークで解かせていくと、
ニューラル・ネットワークの隠れ層にあたる部分に特徴量が自動
的に獲得されてくるという仕組みです。そして、それは画像の一
部を見て、残りを当てるということにおいて重要な特徴量なので
画像を端的に表わす特徴量が自動的に選ばれるというわけです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 松尾准教授は凄いことをいっています。例えば、「1」という
字を認識しするとき、AIはその一部を消して、自分で自分に問
題を出します。例えば、「1」の画像の下半分を消して、画像が
何であるか、ニューラルネットワークに問い合わせます。
 右に横線が出ると「L」、左が空いた弧がくれば「5」と、縦
に線が伸びれば「1」になります。画像の隠す部分を変えて、い
くつも問題を作り、ニューラルネットワークを通して正解を得る
仕組みになっています。
 ディープラーニングで思考するニューラルネットワークは、本
来「教師なし学習」です。しかし、AI自体が自身に対して問題
を出し、答えさせることによって、正解率を高めるメカニズムは
一種の「教師あり学習」ともいえる──松尾准教授はそのように
いっているのです。
 覚えるということは試行錯誤の繰り返しです。赤ちゃんが手当
たり次第に周りにあるものに触ったり、叩いたり、口に入れたり
してそれがどういうモノか理解していくプロセスがディープラー
ニングのなかに内蔵されているようです。AIについて知れば知
るほど、人間の脳がいかによくできているかを知らされることに
なります。     ──[次世代テクノロジー論U/028]

≪画像および関連情報≫
 ●松尾豊東京大学准教授とのインタビュー
  ───────────────────────────
  金丸:お忙しいなかお越しいただきありがとうございます。
  今日は六本木に今年3月オープンした『ビフテキのカワムラ
  六本木店』をご用意しました。こちらは神戸に本店があって
  銀座にもお店があるんですが、とにかく予約が取れないんで
  すよ。
  松尾:そうなんですか。そんなお店にお招きいただき、あり
  がとうございます。最高級の神戸牛が味わえると聞いて、楽
  しみにしてきました。
  金丸:松尾先生のご専門は、人工知能(AI)です。ここ最
  近、AIのニュースを聞かない日はありませんし、先生のこ
  とはメディアでもよく拝見しています。
  松尾:ありがとうございます。
  金丸:先生とは経済産業省のプロジェクトでご一緒していま
  す。いまAIのなかでも、ディープラーニングという新しい
  技術が注目されていますが、どういうものなのか簡単に教え
  ていただけますか?
  松尾:ディープラーニングとは、人間の脳の神経回路をまね
  た「ニューラルネットワーク」を使って、人間の脳と同じよ
  うな情報処理を行う技術です。これまでコンピュータに画像
  を認識させるには、たとえばネコなら「目が丸い」「耳がと
  がっている」というようなネコの特徴を人間が入力しなけれ
  ばなりませんでした。それがディープラーニングの技術によ
  り、コンピュータに大量の画像データを読み込ませることで
  コンピュータ自らが学習し、その特徴を見出せるようになり
  ました。            https://bit.ly/2kZXTNu
  ───────────────────────────

松尾豊東京大学准教授.jpg
松尾豊東京大学准教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス: [必須入力]

ホームページアドレス:

コメント: [必須入力]

RDF Site Summary