2018年06月08日

●「人間の脳について知る必要がある」(EJ第4781号)

 ニューラルネットワーク(NN)で注目すべき話題が小林雅一
氏の本に出ています。小林雅一氏は、KDDI総研リサーチフェ
ローです。AIの関連書籍のなかでは、数も多く、ダントツで分
かりやすい本であると思います。
 ある研究チームが、NNを使って機械翻訳システムを開発する
に当たり、手始めに英語と中国語を学習させたのです。これらの
2ヶ国語の語学力が一定のレベルに達した後で、今度はスペイン
語を学習させてみたところ、なぜか、中国語の語学力が一段と向
上したといいます。
 どうして、スペイン語を学習させると、中国語の語学力が向上
したのか、そのメカニズムは、そのシステムを開発したエンジニ
アもわかっていません。NNの神経回路網は複雑であり、その思
考回路については、開発エンジニアにとってブラックボックス化
しつつあります。それは、人間の思考回路に少しずつ近づいてい
ることを意味します。
 人間の「脳」をシミュレートする以上、人間の脳自体の研究が
必要になります。しかし、脳には現代の科学でもわかっていない
ことがまだたくさんあります。そのため、神経科学者たちはさま
ざまな実験を行っています。
 ある動物実験の話を紹介します。これも小林雅一氏の本からの
情報です。大脳には「聴覚野」と呼ばれる領域があります。これ
は、人間が耳からの音声情報を理解するための領域ですが、「視
覚野」と比べると、不明なことが多く、あまりよく解明されてい
ません。視覚野とは、大脳皮質における視覚に関する領域のこと
をいいます。
 ある神経科学者は、動物の耳から聴覚野へとつながる神経のラ
インを切断し、目から出ているラインを聴覚野につないでみたそ
うです。当然その動物は視力を失います。しかし、その後、不思
議なことが起きたのです。その動物は視力を取り戻し、モノを見
ることができるようになったのです。
 こうした実験を重ねて神経科学者たちはひとつの仮説を立てた
のです。小林雅一氏は次のように解説しています。
─────────────────────────────
 これら一連の実験結果を基に、神経科学者たちは大胆な仮説を
立てました。それは「視覚」「聴覚」「触覚」「味覚」など、人
間の様々な知覚能力に通底する基本的なメカニズムがある、とい
うものです。これに従えば、脳は目や耳から人力された生々しい
初期情報を、段階的に抽象化して、徐々に上位の概念を形成して
いきます。彼らは、このメカニズムを自分連なりに考えて、具体
的なアルゴリズムへと転化し、これを「スパース・コーディング
(Sparse Coding)」と命名しました。英語の「Sparse」 は「少
量の」という意味で、ここでは「大量の情報から、抽象化に必要
な本質的情報だけを、少しずつ抜粋すること」を指しています。
これによって隠れ層をより多層化しても、現実的な時間内で情報
処理ができるようになりました。  ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 難しい言葉が出てきました。「スパース・コーディング」とは
一体何でしょうか。
 米カルフォルニア大学バークレー校にブルーノ・オネスホーゼ
ン氏という教授がいます。計算論的神経科学(コンピューテーシ
ョナル・ニューロサイエンス)の分野で業績を上げている学者で
す。このオネスホーゼン氏が同大学のデービス校で、准教授をし
ていた頃の話です。
 オネスホーゼン教授は、脳の視覚野の一部の「V1」の研究の
第一人者ですが、動物の目から入力された視覚情報を脳にどのよ
うに処理されるかを解明する仮説を立てたのです。
 難しい話になりますが、視覚情報は目から入り、大脳皮質の一
番後ろにある第一次視覚野(V1)に送られます。サルやヒトで
は傾き、動き、奥行きなどの情報は、V1ではじめて抽出され、
さらに前方の大脳皮質に送られます。私たちが物の位置や形を認
識するとき、V1からその前方の大脳皮質に送られる情報が重要
な働きをしていると考えられます。ちなみに、このV1が壊れる
と、目が見えなくなります。
 V1に入ってきた目からの視覚情報は、無数のピクセル/画素
の集まりです。この状態では、それが何であるかは不明ですが、
V1で段階的にかたちを作り、認識にいたるのです。これについ
て、小林雅一氏は、次のように解説しています。
─────────────────────────────
 脳の視覚野は、このピクセル情報からいくつかの特徴ベクトル
(物体の輪郭を構成する線)を自動的に抽出します。そしてこの
ベクトルをいくつか組み合わせて、「目」や「耳」のようなパー
ツ(部品)を描き出し、それが終わると今度はこれらのパーツを
組み合わせて、「猫」や「人」の顔など最終的な対象物を描き出
している。要するに脳の視覚野は、そのように段階的に対象物を
認識しているというのです。         ──小林雅一著
   『AIの衝撃/人工知能は人類の敵か』/講談社現代新書
─────────────────────────────
 目から入った視覚情報、仮に人の顔であるとします。それらは
視覚野「V1」に入った最初の段階では、無数のピクセルの集ま
りにすぎません。その中から特徴的なパーツ(ベクトル)を抽出
し、そのうえで、それらを組み合わせて、段階的に顔を形成して
いくのです。
 そのプロセスには一定のルールのようなものがあるので、それ
をコンピュータで処理可能なアルゴリズムに転化させることがで
きます。オネスホーゼン氏は、そのことを「スパース・コーディ
ング」と名付けたのです。この場合、ひとつひとつのベクトルは
脳のニューロン一個一個に対応します。
          ──[次世代テクノロジー論U/025]

≪画像および関連情報≫
 ●人工知能を語る前に、脳について知りたい
  ───────────────────────────
   たった1つの学習理論とは脳が物事を学習する際には、そ
  の処理対象に応じた活動をするわけではなく、全ての処理対
  象に対して唯一の学習方法を使っているという考え方です。
  これは理論と名付けられている通り、そういう考えがあるだ
  けで、まだ確実にそうだと証明されているわけではありませ
  ん。しかし、1つの考え方として認められているものでもあ
  ります。特に人工知能関連では「スパース・コーディング」
  というものが有名です。スパースコーディングとは、ある処
  理を行うときに、なるべく少ない神経活動で済ませられるよ
  うに学習が行われるという考え方です。
   視神経を切断すると、当然視力を失います。視力を失った
  状態で、その切断した視神経を聴覚を処理している脳の神経
  に接続した場合にどうなるでしょうか。もしも音の処理と光
  の処理が異なるものであるならば、視覚の信号を聴覚の脳の
  領域に与えた所で何も起こらないはずです。しかし驚くこと
  に次第に視覚が取り戻されていったのです。すなわち視覚の
  信号を聴覚に使われていた脳の領域で処理することができた
  のです。これは、脳の視覚と聴覚に関する信号の処理構造は
  本質的な差異がなく、ある統一された学習によって意味のあ
  る情報として獲得しうると考えられます。
   視覚の情報処理機構を、アルゴリズムとして実装した場合
  に、実際に画像処理として有効であるのは何となく当たり前
  のかなと思います(もちろん工学に応用できるという点で有
  意義)。            https://bit.ly/2Jehick
  ───────────────────────────

視覚野/V1.jpg
視覚野/V1
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
RDF Site Summary