2018年06月19日

●「人工知能最大の難問フレーム問題」(EJ第4788号)

 ディープラーニング革命によって、AI(人工知能)に関わる
難問が次々と解決されています。画像認識、文字認識、音声認識
などが急速にクリアされています。しかし、AIには根本的に解
決できない難問があります。それは「フレーム問題」です。
 フレーム問題とは何か──これは基本的に人間と機械の違いに
直面する難しい問題です。まずは、フレーム問題とは何かについ
て、雑賀美明氏の著書から引用します。
─────────────────────────────
 フレーム問題というのもあります。
 これは、1969年にジョン・マッカーシーとパトリック・ヘ
イズが指摘した人工知能研究の最大の難問です。今からしようと
していることに関係のある事柄だけを選び出すことが、実は非常
に難しいと言う問題です。周りの環境から、何が関係あって、何
が関係ないかを調べるために、無限の計算が必要になって人工知
能が止まってしまうことを「フレーム(枠)問題」と言います。
 人工知能は、チェスやオセロのような閉じられたルールの枠の
中では有効に働きますが、現実の世界のように開かれた世界に飛
び出すと、情報を処理しきれずに動きが停止してしまいます。コ
ンピュータには有限の処理能力しかないので、何も動作できずに
止まってしまうのです。    ──雑賀美明著/マルジュ社刊
      『人工知能×仮想現実の衝撃/第4次産業革命から
                  シンギュラリティまで』
─────────────────────────────
 フレーム問題について、身近の事件から探っていくことにしま
す。このところ新幹線でのトラブルが相次いでいます。6月9日
の新幹線「のぞみ265号」での乗客殺傷事件、これに続く14
日の「のぞみ176号」による人身事故など。とくに人身事故で
は、運転手はトンネル内で異音を聞いているのに、小動物である
と思ってそのことを運転指令に報告せず、列車を停止しなかった
のです。これは明らかに業務規則違反です。こんなことはあって
はならないことです。
 このケースとはまるで違いますが、車に乗っていてフロントガ
ラスに何かがぶつかったとします。そういうことはよくあること
です。小石が跳ねたかもしれないし、何らの虫がぶつかったかも
しれない。そういう場合、人間の運転者であれば、車を止めるこ
とはないはずです。人間なら、何がぶつかったか見当がつくし、
それが運転継続に支障をきたすことではないかわかるからです。
 ところが、この車がAIによる自動運転車であった場合、仮に
ぶつかったものが虫であっても、急停車するはずです。AIには
ぶつかったものが虫なのか、小石なのか、人なのかを判断できな
いからです。しかし走っているのですから、フロントガラスには
いろいろなものがぶつかりますが、そのたびに、車が止まってし
まったら、不便きわまりないことになります。
 このように、人間なら簡単にできることが、AIにはできない
し、逆に人間なら到底できないことが、AIなら短い時間で正確
に仕上げてしまうことが多いのです。このことは、フレーム問題
と関係があります。
 5月25日付/EJ第4771号で「マイシン」というエキス
パートシステムをご紹介しました。この「マイシン」について、
中島秀之東京大学大学院特任教授がフレーム問題との関連で、次
のように対談で述べています。
─────────────────────────────
――エキスパートシステムというのは、まるで人間のエキスパー
ト(専門家)のように、与えられた知識から推論して複雑な問題
を解くよう設計されたAIのことですね。医療系のエキスパート
システムだったマイシンは、伝染性の血液疾患の患者さんを診断
していたと聞いたことがあります。
中島:そうです。マイシンは、感染症の診断が、トップクラスの
   医者には負けるけれど、人間のインターンよりは優れてい
   ました。さまざまな医学知識を取り込んで、いろんな推論
   を展開するのは、AIの得意分野です。ところが、マイシ
   ンのようなAIは、一部の例外を除いて、結局、実用化さ
   れませんでした。
――なぜですか?
中島:大きな理由の1つは、感染症を調べるためにいろいろ検査
   するとき、「子どもに注射を打つ検査をあんまりやると、
   痛がるからだめだよ」という知識が、医学書には書いてい
   なかったからです。
――つまり、マイシンは、検査に必要となれば、子どもにも注射
をバンバン打つよう指示してしまったわけですね?
中島:そうです。「子どもが注射を嫌う」というのは、人にとっ
   ては常識です。しかし、AIであるマイシンには、わから
   ない。じゃあ、AIに読ませる医学書に「子どもは注射が
   嫌い」と書けば済むのかというと、そういう常識の類は、
   ほかにもいっぱいあるわけです。
                  https://nkbp.jp/2JYiG2m
─────────────────────────────
 「マイシン」というエキスパーシステムには、感染症の検査に
必要な医学知識やノウハウはすべて入れてあるのですが、医師は
それだけで診断するわけではありません。それに人間であれば誰
でも持っている「常識」に基づいて診断を下すのですが、AIは
それを持っていないのです。
 それなら、それらの「常識」をAIに与えればよいということ
にはならないのです。人間の持っている知識は、驚くほど多く、
人間自身も自分がどれだけの知識や情報を持っているか意識して
おらず、人間はそれらを基にして総合的に判断を下しているので
す。そういう知識をAIに学習させることは困難です。こういう
ことから、フレーム問題は起きてくるのです。これについては、
明日のEJでももっと詳しく取り上げて考えてみます。
          ──[次世代テクノロジー論U/032]

≪画像および関連情報≫
 ●人工知能の大半は、ないものを「ない」と認識できない
  ───────────────────────────
   例えば、会社の歓迎会で花見を開催したとしましょう。ブ
  ルーシートに並べられた缶ビールを見て、「どうしてキリン
  ビールはないの?」「私はよなよなエールが好きなのに」と
  文句を言われた経験はありませんか?一見、自然な会話に見
  えますが、人工知能にこれを言わせようとすると非常に大変
  です。
   まず、日本で販売されている全ての缶ビールを学習させた
  (覚えさせた)上で、目の前に置かれた缶ビールのラベルを
  1つ1つ認識させれば、どのビールがあって、どのビールが
  ないかが分かります。しかし、重み付けなどを行って1つだ
  けを選ばせるといった制御をしない限り、「キリンビールが
  ない」とは言わずに、そこにないビールを全て列挙すること
  になるでしょう。
   その人工知能が「花見で買ってきていないビールすぐ認識
  する君」のような超特化型のAIならよいですが、人間のよ
  うな汎用的思考を持った、いわゆる「汎用人工知能」が認識
  しようとすると、実現性は一気に低くなります。日々新たな
  商品が生まれる、全ての缶ビールを学習させるなど事実上不
  可能だからです。これがもし、ハイボールや缶酎ハイも加え
  ることになったら・・・と考えればキリがありません。
                  https://bit.ly/2JUkHJt
  ───────────────────────────

中島秀之東京大学大学院特任教授.jpg
中島秀之東京大学大学院特任教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月18日

●「3つの『認識』は可能になるのか」(EJ第4787号)

 現代のAI(人工知能)は、ニューラルネットワークのディー
プラーニングが主流になっています。このディープラーニングは
「革命」といわれます。なぜ、革命なのでしょうか。それは、次
の3つのことが可能になりつつあるからです。
─────────────────────────────
        1.3つの認識が可能になる
        2.運動ができるようになる
        3.言語の意味が理解できる
─────────────────────────────
 上記「1」の「3つの認識」とは何でしょうか。1つは「画像
認識」、2つは「文字認識」、3つは「音声認識」です。ひとつ
ずつどこまでできるようになっているか考えることにします。
 「画像認識」については、これまでは悪戦苦闘していたのです
が、「グーグルの猫」が認識できるようになり、AIは明らかに
ブレークスルーを成し遂げたのです。画像を認識するということ
は、その特徴点を見分けるということです。猫を見分けるために
動画から取り込んだ1000万枚の画像を解析し、1000台も
のコンピュータで3日かけて学習し、やっと認識したのです。
 画像認識がうまくいけば、「文字認識」と「音声認識」はクリ
アできるのです。実際に現在のAIは、まだ課題はあるものの、
文字認識も音声認識もできるようになりつつあります。
 上記「2」の「運動ができるようになる」は、ロボットの開発
に応用され、少しずつ実現しつつあります。これには、自動運転
車の問題も含みます。自動運転車は現在進んでいるように見えま
すが、まだまだ多くの難題を抱えています。
 上記「3」の「言語の意味が理解できる」は、翻訳や通訳に応
用できますが、実はこれが一番難しいのです。ペッパーなどのロ
ボットは、人の言葉を理解し、それに対応した行動をとりつつあ
るように見えますが、ペッパーは相手の声と自分が発する声の見
分けがつかないのです。そのため、ペッパーなどのコミュニケー
ションロボットは、自分が話すときは、マイクはオフになってい
るのです。なぜなら、ロボットは自分が話す音を認識してしまう
と、それに対しても答えようとする無限ループに陥ってしまうか
らです。そのため、ロボットが話すときは、マイクは自動的にオ
フになります。
 「ディープマインド」という英国の人工知能企業があります。
2010年にディープマインドテクノロジーとして起業されたの
ですが、2014年にグーグルに買収され、ディープマインド社
になったのです。
 このディープマインド社が開発したのが、碁のAIアルゴリズ
ム「アルファ碁」です。2016年3月、「アルファ碁」は、世
界トップレベルの韓国のイ・セドル九段に4勝1敗で勝利し、世
界的に有名になります。
 このディープマインド社のCEOであるデミス・ハサビス氏は
ゲームの世界では、「DQN」という汎用学習アルゴリズムの天
才的開発者として知られています。
─────────────────────────────
             「DQN」
           Deep Q-Network
 DQNは画像認識に多く用いられる深層学習と強化学習(Q学
習)を組み合わせたアルゴリズムにより動作し、ゲームのルール
を教えていない場合でも、どのように操作すれば高得点を目指す
ことができるのかを判断することができる。
        ──ウィキペディア https://bit.ly/2ina8Ef
─────────────────────────────
 「DQN」は、どのようなゲームにも適用できる画期的な汎用
学習アルゴリズムで、ゲーム画面の出力信号と「高いスコアを出
せ」という指令のみで動くといわれます。つまり、「高得点を出
せ」と命令すると、得点を上げるメカニズムを超スピードで学習
し、そういう結果を出してくるのです。
 DQNは、49種類のゲーム中、43種類で従来のAIによる
得点を上回り、29のゲームでは、プロゲーマーと同等またはそ
れ以上のパフォーマンスをみせたといわれます。
 ディープマインド社は、このDQNをベースに「アルファ碁」
を開発したのです。「アルファ碁」は、イ・セドル九段を破った
ことで、「名誉九段」の称号が与えられていますが、その後につ
いて次の話があります。
 韓国に「東洋囲碁」というインターネット囲碁サイトがありま
す。2016年12月29日から31日にかけて、その囲碁サイ
トに「マジスター/Magister」というIDの棋士が現れ、世界ラ
ンクトップの中国のケ・ジェ九段や韓国ランキング1位のパク・
ジョンファン九段など、世界トップ級の棋士と対局しています。
結果は30戦全勝です。
 2017年1月1日から5日にかけて、中国で韓国と同じよう
なことが起きたのです。中国の囲碁サイト「野狐囲碁」に「マス
ター/Master」と名乗るID棋士が現れ、世界トップ級棋士とさ
らに30戦戦い、全勝しています。韓国の「東洋囲碁」と中国の
「野狐囲碁」の戦績を合わせると、60戦60勝、勝率100%
ということになります。
 実は、デミス・ハサビ氏は、マジスターIDもマスターIDも
「アルファ碁」の進化型であることを明かしています。今後の公
式戦に備えて、テストを行ったのです。もはや囲碁とか将棋の世
界では、AIに人は勝てないといっても過言ではないようです。
 しかし、将棋にしても囲碁にしても、すべての情報が開示され
ているゲームです。しかし、ポーカーや麻雀などは、相手の手は
隠されていてわからないゲームです。そういうゲームで、AIが
勝利を収めたという話はありません。したがって、AIによって
すべてのゲームが支配されたということにはならないのです。し
かし、ビジネスというゲームには、AIは無限の活用の余地があ
ります。      ──[次世代テクノロジー論U/031]

≪画像および関連情報≫
 ●囲碁の最強人工知能「アルファ碁」の仕組みとは?
  ───────────────────────────
   2017年5月27日、人類最強の呼び声が高い棋士ケ・
  ジェにグーグル社傘下のイギリスの人工知能企業のディープ
  マインド社が開発する「アルファ碁」が勝利しました。
   27日の対局に先立ち23日、25日にも「アルファ碁」
  はケ・ジェを相手に勝利し、ケ・ジェは人工知能を相手にま
  さかの全敗を喫したのです。囲碁は元々、AI(人工知能)
  にとって、もっとも難しいゲームの一つとされていました。
  最強棋士を破る囲碁AIは、どのようにして、生まれたので
  しょうか?
   2015年10月、碁のヨーロッパ王者であるファン・フ
  イ2段に5戦5勝を収め、続く2016年3月には、21年
  間のプロキャリアで18回に渡って世界王者になった経歴を
  持つイ・セドル9段に4勝1敗で勝利しました。
   敗北はとてもハードなことだった。アルファ碁と対局する
  前は、僕は「きっと勝てるだろう」と考えていた。最初の対
  局の後には戦術を変えて挑んだのだけど、それでも負けてし
  まった。人間には時に大きなミスをするという問題がある。
  なぜなら、僕たちは人間だからだ。時には僕たちは疲れてい
  るし、時には「何が何でもゲームに勝ちたい」と望んで、大
  きなプレッシャーを感じる。でも、プログラムはそうじゃな
  い。まるで壁のようにプログラムはとても強く、安定してい
  る。この違いは、僕にとってはとても大きなものなんだ。僕
  はアルファ碁がコンピューターであることを元々知っていた
  けれど、もしも誰一人としてその事実を僕に伝えていなかっ
  たら、僕は対局相手のことを少々奇妙だがとても強い本物の
  人間のプレイヤーだと感じただろうね。
                  https://bit.ly/2tfyKlI
  ───────────────────────────

中国最強棋士と対局する「アルファ碁」.jpg
中国最強棋士と対局する「アルファ碁」
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月15日

●「ワトソンの無期限無料試用の狙い」(EJ第4786号)

 2017年10月27日に、日本IBMは、ワトソンについて
次のアナウンスを行っています。
─────────────────────────────
 IoTのシステム構築には試行錯誤がつきもので、PoC(概
念検証)などでは試作や検証に時間がかかる傾向がある。そうし
た課題に対し、日本IBM、同社のAIプラットフォームである
ワトソンなどを開発者が無料で、かつ無期限に利用できるサービ
スを2017年10月27日から開始した。  ──日本IBM
─────────────────────────────
 このIBMのサービスは「IBMクラウド・アカウント」と呼
ばれます。これまでは、無料試用トライアルは30日に限定され
ていたものが、無期限に無料で利用できるようになったのです。
AIを試してみたい企業や個人のデベロッパーにとって、またと
ないチャンスが訪れたといえます。なぜ、IBMは、このかなり
思い切ったサービスに打って出たのでしょうか。
 これには、諸説がありますが、AI(人工知能)の分野におい
て先行していたはずのIBMが、優秀な人材を集め、集中的にA
Iに投資を行っているグーグルやマイクロソフト、フェイスブッ
クなどから遅れをとっているからであるといわれています。確か
に、これまでにIBMは莫大なコストをワトソンに注いでいます
が、目立った成果を上げられないでいるからです。
 それに、IBMはワトソンをグーグルなどで開発を進めるAI
とは別のビジネスシステムとして位置づけようとしているフシが
あります。10月27日のユーザーイベントで基調講演をしたエ
リー・キーナン日本IBM代表取締役社長は、世界を変える6つ
の技術として、@AI、AIoT、Bブロックチェーン、C量子
コンピュータ、Dニューロモーフィックコンピュータ(脳型コン
ピュータ)、E世界最小コンピュータの6つを上げ、コンピュー
タが現在、人間の生活を大きく革新しつつあると述べたうえで、
AIについて次のように述べています。
─────────────────────────────
 AIには、人々の生活を直接的に助けるAIと、ビジネスを支
援するAIがある。ワトソンはビジネスを助けるAIである。限
られたゲーム盤の上でさらにルールが固定化されたゲームとビジ
ネスの世界は大きく異なる。AIをビジネスで活用するためには
業界用語や文脈、ワークフローをAIが理解できないと難しい。
ワトソンは、すでに医療現場で医者の診断を支援するサービスを
開始しており、ビジネスの世界で実績がある。他のAI技術では
そういう実績はまだない。      https://bit.ly/2t6IQFG
─────────────────────────────
 これでわかるように、IBMは、ワトソンをグーグルなどが主
導する、いわゆるAIとは別のものであるとしているようです。
ワトソンは既に業務に役立つレベルに達しており、さらに多くの
成功事例を生み出そうとして「IBMクラウド・アカウント」を
スタートさせたものと考えられます。
 その成功事例を担っているのは、ワトソンの展開において日本
のパートナーとしてIBMに協力してきたソフトバンクグループ
です。10月27日のユーザーイベントで、日本IBMエリー・
キーナン社長に続いて登壇したソフトバンクの代表取締役社長兼
CEOの宮内謙氏は、EC(電子商取引)の市場規模が200兆
円以上になっているが、これからの10年間は、それよりももっ
と大きな変化が起きるとして、テクノロジーによる企業の成長戦
略の可能性について、次のように述べています。
─────────────────────────────
 成長戦略を描くうえで、考えなければいけない3つの経済変化
として、「コネクテッドエコノミー」
    「シェアリングエコノミー」
    「スコアリングエコノミー」を挙げる。
 コネクテッドエコノミーは、通信により人と人がつながり、場
所も時間を選ばないコミュニケーションができるようになったこ
とで生まれる価値を示す。今はこれがさらに広がり、人だけでな
くモノもつながることができる。
 さらにこのコネクテッドエコノミーを土台として、完全にモノ
の管理が行えるようになったことで、シェアリングエコノミーが
生まれた。カーシェアリングや自動車シェアリングなどのほか、
ウーバーなどの自動車配車サービスなどもこれに当たる。
 さらに、あまり注目されていないが、今後重要になることにス
コアリングエコノミーがある。コネクテッド化により、モノの完
全な管理が可能となることで、例えばシェアされた自動車をどの
ような使い方をしているのかが把握できる。
そこで利用者がスコアリングされるような状況が生まれる。これ
らはさらにさまざまな産業に広がっていき、新たなチャンスを生
み出すだろう。           https://bit.ly/2t6IQFG
─────────────────────────────
 ソフトバンクでは、AIを活用した革新的企業との協業や出資
などを展開しています。その分野としては、セキュリティ、ライ
ドシェア、医療、自動運転、ロボット、半導体、室内農業、産業
IoTなど、多方面に及んでいます。
 日本IBMは、「IBMクラウド・アカウント」のサービス開
始を機会にワトソンのユーザーを一挙に増やすことを計画してい
ます。日本IBM三澤智光取締役は次のように述べています。
─────────────────────────────
 ワトソンの国内での展開は既に350社以上におよんでいるが
日本語APIを自由に触りたいという声が非常に多かったので、
今回「IBMクラウド・アカウント」を用意した。より多くの開
発者にさまざまな形で触れてもらうことが重要だと考えている。
 ──日本IBMクラウド事業本部長/三澤智光取締役執行役員
                  https://bit.ly/2JO4GVe
─────────────────────────────
          ──[次世代テクノロジー論U/030]

≪画像および関連情報≫
 ●「IBMクラウド・アカウント」の価値
  ───────────────────────────
   今回リリースされた「IBMクラウド・アカウント」は、
  利用期間に制限がない。使用料金が発生することがないため
  クレジットカードなどの登録も不要だ。これまでのフリート
  ライアルは30日間の期間限定だったが、今度はじっくり試
  すことができる。また、学生などでクレジットカードを所持
  していない人とっても利用のハードルが下がったことは大き
  な意義がある。
   しかし、有料プランと比較した場合、当然ながらいくつか
  の制約が存在する。利用可能な組織・地域とも各1つ。CF
  メモリが256MB、主要サービスはライトプランのみで、
  インスタンスもプランごとに1つといった機能面の制限。そ
  して、10日間の開発停止でアプリが停止し、30日間の活
  動停止でサービスが削除される。これらの制限は実際の開発
  において、どれほどの障壁となるのか。また、無料化におけ
  る社会的な意義や今後、どんな可能性を秘めているのか。
   川合氏は「ストーリーAI」と呼ばれる、物語における感
  情の動きをビジュアライズするAIの開発者。現在はアルゴ
  リズムの強化と商用化に向けたサービス開発を行っている。
   「私が開発するストーリーAIは、物語における感情の振
  れ幅と時間軸(X軸)と感情軸(Y軸)でビジュアライズし
  表現するものです。物語の登場人物たちがストーリー中にど
  のような感情を抱いているのかをテキストから理解し、物語
  の盛り上がりを判断するアルゴリズムをつくりました」。
                  https://ibm.co/2lcG7ad
  ───────────────────────────

宮内謙ソフトバンク社長兼CEO.jpg
宮内謙ソフトバンク社長兼CEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月14日

●「IBMワトソンはどんなマシンか」(EJ第4785号)

 IBMが開発した「ワトソン」という名前のコンピュータがあ
ります。今やAI(人工知能)とワトソンは同義語として語られ
るほど有名な存在です。実は、当のIBMは、ワトソンについて
次のようにいっているのです。
─────────────────────────────
 ワトソンとAI(人工知能)は目指すゴールが決定的に違う
                       ──IBM
─────────────────────────────
 「ワトソン」という名前を聞くと、アーサー・コナンドイルの
推理小説『シャーロック・ホームズシリーズ』の登場人物で、名
探偵シャーロック・ホームズの友人のワトソン博士を想起する人
が多いと思います。小説でのワトソンは、いろいろな場面でホー
ムズにアドバスする役割であり、AIコンピュータ「ワトソン」
の役割にぴったりですが、まったく関係がありません。
 ワトソンの名は、IBMの事実上の創立者であるトーマス・J
・ワトソンから取られています。創立者ではありませんが、初代
社長で、1914年から1956年までIBMのトップとして、
IBMを世界的大企業に育て上げた人物であり、IBMを代表す
るコンピュータの名前を冠するのに相応しい人物です。
 ところで、なぜ「ワトソン」とAIとは目指すところが違うの
でしょうか。キーワードは次の言葉です。
─────────────────────────────
  IBMの「ワトソン」は、コグニティブシステムである
─────────────────────────────
 コグニティブ(cognitive) とは、日本語で「認識」とか「認
知」のことであり、コグニティブシステムとは、ある事象につい
てコンピュータが自ら考え、学習し、自らの答えを導き出すシス
テムを意味します。「コグニティブ・コンピューティング」とも
いわれています。
 米IBM基礎研究所バイスプレジデントで、ディープラーニン
グの応用や神経細胞のシナプスのように働く新しい「シナプス・
チップ」の研究を牽引するダリオ・ギル氏は、コグニティブシス
テムについて、次のように説明をしています。
─────────────────────────────
 AIの技術が、コグニティブシステムに使われていることは間
違いないが、AIとコグニティブシステムは「ゴール」が違う。
AIは、科学分野における技術であり、人間ができることのイミ
テーションを目指している。一方、コグニティブシステムは人間
が中心。人がより良い作業が行えるようにサポートするものだ。
 コグニティブシステムは、学習能力を持った点が大きな特徴。
これまでのようにルールを書かなくても、システム側が事例を通
じて学習することが可能だ。ソフトウェアの世界を抜本的に変え
ることになる。普通、コンピュータというのは、購入した日が最
も性能が高い日であるが、コグニティブシステムは最もパフォー
マンスが悪いのが購入した日。学習することで、日に日に性能が
向上する。その学習の成果をもとに、コグニティブシステムは、
人間が持っている専門知識を補完するものだ。私は、コンピュー
タが人を置きかえるという考え方は根本的に間違っていると思っ
ている。    ──ダリオ・ギル氏 https://bit.ly/2l5bFPd
─────────────────────────────
 ワトソンは、自然言語処理ができるマシンですが、早押しの人
気クイズ番組「ジョパディ!」で優勝しています。当時のワトソ
ンには音声認識機能は搭載されておらず、問題は文章で出題され
シリンダーでボタンを押す装置を用いて回答したことがわかって
います。
 現在では、ワトソンにはかなり強力な音声認識機能が装備され
ており、日本のメガバンクのコールセンターでも、ワトソンが使
われています。文字は解読できるし、人の会話を聞き取り、文章
化できる能力も持っています。しかも、知識のソースを与えれば
ワトソンは、自動的に機械学習できる能力も持っています。
 ダリオ・ギル氏はこうもいっています。現在のコンピュータは
現存する2・5エクサバイトのデータのうち、80%のデータの
意味が理解できない。これらは、SNSなどによって発信されて
いる自然言語のデータですが、人間にとってもこれらのデータは
あまりにも分量が多いので処理できない。ワトソンのコグニティ
ブシステムは、これらの80%のデータを読んで、理解できるよ
うにするものである、と。
 これらのことから、ワトソンとは、自動学習でき、豊富なデー
タから、高度な推論のできるエキスパートシステムではないかと
思われます。既にIBMは、ワトソンによる「コグニティブビジ
ネス」を展開していますが、課題は多くあるようです。
 しかし、IBMのワトソンについて、松尾豊東大准教授は、次
のように絶賛しています。
─────────────────────────────
 IBMのワトソンがすごいのは、自然言語処理に優れていると
ころだ。コンピューターが扱えるデータが爆発的に増えていると
いっても今はまだ紙に書かれた情報が山のようにある。書籍をス
キャナで読み取って、文字を認識したとしても、コンピュータに
は、その書籍の内容がどういうものなのかは理解できない。どの
部分が書籍のタイトルで、どれが著者名かということさえも、そ
のままでは分からない。
 ところがワトソンは、コンピューター向けに作られていない文
字情報を、コンピューターに理解できるような形に変えるところ
でさまざまな工夫がされているのだという。クイズ番組「ジョパ
ディ!」に出演したワトソンは、書籍や百科事典、ウィキペディ
ア上の情報など、2億ページ分のテキストデータ(70GB程度
約100万冊の書籍に相当)をスキャンして取り込んでいた。
       ──松尾豊東大准教授 https://bit.ly/2LFgAl9
─────────────────────────────
          ──[次世代テクノロジー論U/029]

≪画像および関連情報≫
 ●ワトソンで苦戦のIBMが狙う「AIでの反撃」
  ───────────────────────────
   人工知能(AI)分野ではグーグルやマイクロフト、フェ
  イスブックらが優秀な人材をかき集める一方、IBMのよう
  な古くからの大手は苦戦を強いられている。
   IBMは、莫大な費用を同社のAIのワトソンに注いでい
  るが、目立った成果をあげられていない。健康情報メディア
  「Stat」は先日、ワトソンのガン治療分野への導入が遅延し
  ている状況を詳細にレポートした。
   IBMは大学の研究機関とともに、この状況への対処を始
  めた。2017年9月7日、IBMは、マサチューセッツ工
  科大学(MIT)と実施するAI研究プロジェクトに、今後
  10年間で2億4000万ドル(約260億円)を出資する
  とアナウンスした。「MIT-IBM Watson AI Lab」と 呼ばれる
  このプロジェクトは、100名の研究者らを4つのAI領域
  の研究に割り当てる。
   その4領域とはニューアルゴリズム、ハードウェア、ソー
  シャルインパクト、ビジネス活用だ。アルゴリズム開発にお
  いて同プロジェクトは、マシンラーニング(機械学習)の一
  分野であるディープラーニング(深層学習)に続く新領域に
  注力する。「今回の提携で、ディープラーニングを超える新
  たなアルゴリズムの発見に向けた基礎研究を開始する」とM
  ITのエンジニアリング部門学部長は述べた。
   研究チームが特に注力するのは、人間による監視や手作業
  によるデータのタグづけ無しで実行可能なAIアルゴリズム
  のトレーニングだ。現状のディープラーニングのトレーニン
  グには、人間の目視による確認が必須で、個々のデータにラ
  ベルづけを行う必要がある。例えば車の画像データがあれば
  これは車だと教えてやる必要があるのだ。
                  https://bit.ly/2Mix7MR
  ───────────────────────────

ダリオ・ギル米IBM基礎研究所副社長.jpg
ダリオ・ギル米IBM基礎研究所副社長
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月13日

●「どのように画像の特徴を掴むのか」(EJ第4784号)

 そもそも「ディープラーニング」は、何がきっかけになって、
注目されたのでしょうか。
 「画像認識コンテスト/ILSVRC」という国際的なイベン
トがあります。このコンテストは毎年行われ、世界中の一流大学
や研究機関がエントリーして、独自のアルゴリズムを競い合う技
術競技です。ILSVRCは、次の言葉の略です。
─────────────────────────────
  ILSVRC
  ImageNet Large Scale Visual Recognition Challenge
─────────────────────────────
 2012年のILSVRCのことです。そのとき、1200万
画素・1000カテゴリの画像認識の問題に対し、ジェフリー・
ヒントン教授率いるチームが圧勝しました。このとき、使われた
のがディープラーニングです。勝敗は、画像認識エラー率で競う
のですが、他チームの平均エラー率が26%だったのに対し、ヒ
ントン教授率いるチームのエラー率は16%だったのです。この
結果には、世界中が驚愕したのです。以来、ディープラーニング
は世界中で有名になったといえます。
 さて、「ディープラーニング」は、機械学習の一つです。6月
11日のEJ第4782号で述べたように、機械学習には次の2
つがあります。再現します。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 画像認識の場合、人間であれば、その画像の特徴というべきも
のを無意識に掴んで、それが、どういう画像であるかを判断しま
す。ディープラーニングの場合は、どのように把握するのでしょ
うか。日本のAI研究の第一人者である松尾豊東大准教授は、こ
れについて次のように述べています。
─────────────────────────────
 例えば、画像の場合、画像の中から特徴量を自動的に切り出す
ことができる。特徴量とは、簡単なものだと、エッジの検出、角
の検出、などのようなものから始まり、それが組み合わさること
によって「顔がある」「これは人間の顔」「これは猫の顔」など
という高次の特徴量へとつながっていく。そうすることで高次の
特徴量も自動的に取り出すことができるのです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 ここで松尾准教授のいう「特徴量」という言葉について、知る
必要があります。特徴量とは特徴を数式化したものをいいます。
アルファベットを例に上げます。AIは、その形状からアルファ
ベットというものを次の3つのパターンに分類して認識します。
─────────────────────────────
  1.中心から縦に引いた線を境にして左右の形が等しい
    A、H、I、M、O、T、U、V、W、X、Y
  2.中心から横に引いた線を境にして上下の形が等しい
    B、C、D、E、H、I、O、X
  3.上記「1」と「2」の条件を両方とも満たしている
    H、I、O、X
                  https://bit.ly/2l5zCWF
─────────────────────────────
 どういう仕組みで、画像の特徴量を把握するのかというと、そ
こには、「オートエンコーダ」というものを使うのです。松尾准
教授は、次のように述べています。
─────────────────────────────
 オートエンコーダーというものを使います。従来の機械学習な
ら、「教師あり学習」、「教師なし学習」という分け方をするこ
とが多かったのですが、ディープラーニングは「教師なし学習」
だが、一見すると「教師あり学習」のような扱いをするのです。
 どういうことかと言うと、例えばコンピューターに画像のデー
タを与えた場合、コンピューターは画像の一部を消して、その一
部を残った部分から当てなさいという問題に変えるのです。そう
すると、画像を与えただけで、たくさんの擬似的問題を作ること
ができる。それをニューラル・ネットワークで解かせていくと、
ニューラル・ネットワークの隠れ層にあたる部分に特徴量が自動
的に獲得されてくるという仕組みです。そして、それは画像の一
部を見て、残りを当てるということにおいて重要な特徴量なので
画像を端的に表わす特徴量が自動的に選ばれるというわけです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 松尾准教授は凄いことをいっています。例えば、「1」という
字を認識しするとき、AIはその一部を消して、自分で自分に問
題を出します。例えば、「1」の画像の下半分を消して、画像が
何であるか、ニューラルネットワークに問い合わせます。
 右に横線が出ると「L」、左が空いた弧がくれば「5」と、縦
に線が伸びれば「1」になります。画像の隠す部分を変えて、い
くつも問題を作り、ニューラルネットワークを通して正解を得る
仕組みになっています。
 ディープラーニングで思考するニューラルネットワークは、本
来「教師なし学習」です。しかし、AI自体が自身に対して問題
を出し、答えさせることによって、正解率を高めるメカニズムは
一種の「教師あり学習」ともいえる──松尾准教授はそのように
いっているのです。
 覚えるということは試行錯誤の繰り返しです。赤ちゃんが手当
たり次第に周りにあるものに触ったり、叩いたり、口に入れたり
してそれがどういうモノか理解していくプロセスがディープラー
ニングのなかに内蔵されているようです。AIについて知れば知
るほど、人間の脳がいかによくできているかを知らされることに
なります。     ──[次世代テクノロジー論U/028]

≪画像および関連情報≫
 ●松尾豊東京大学准教授とのインタビュー
  ───────────────────────────
  金丸:お忙しいなかお越しいただきありがとうございます。
  今日は六本木に今年3月オープンした『ビフテキのカワムラ
  六本木店』をご用意しました。こちらは神戸に本店があって
  銀座にもお店があるんですが、とにかく予約が取れないんで
  すよ。
  松尾:そうなんですか。そんなお店にお招きいただき、あり
  がとうございます。最高級の神戸牛が味わえると聞いて、楽
  しみにしてきました。
  金丸:松尾先生のご専門は、人工知能(AI)です。ここ最
  近、AIのニュースを聞かない日はありませんし、先生のこ
  とはメディアでもよく拝見しています。
  松尾:ありがとうございます。
  金丸:先生とは経済産業省のプロジェクトでご一緒していま
  す。いまAIのなかでも、ディープラーニングという新しい
  技術が注目されていますが、どういうものなのか簡単に教え
  ていただけますか?
  松尾:ディープラーニングとは、人間の脳の神経回路をまね
  た「ニューラルネットワーク」を使って、人間の脳と同じよ
  うな情報処理を行う技術です。これまでコンピュータに画像
  を認識させるには、たとえばネコなら「目が丸い」「耳がと
  がっている」というようなネコの特徴を人間が入力しなけれ
  ばなりませんでした。それがディープラーニングの技術によ
  り、コンピュータに大量の画像データを読み込ませることで
  コンピュータ自らが学習し、その特徴を見出せるようになり
  ました。            https://bit.ly/2kZXTNu
  ───────────────────────────

松尾豊東京大学准教授.jpg
松尾豊東京大学准教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月12日

●「ヒントンのカブセルネットワーク」(EJ第4783号)

 ジェフリー・ヒントン氏──1947年の英国生まれの科学者
であり、今やAI(人工知能)、なかんずくニューラルネットワ
ークの権威であり、ディープラーニングの世界では、最も影響力
を持つ人物の一人といわれています。ヒントン氏は、トロント大
学教授という籍を持ちながら、グーグルの研究員をしており、世
界のAI技術を牽引しています。
 小林雅一氏によると、ヒントン教授は、コンピュータ基礎理論
のひとつである「ブール代数」を発明した数学者、ジョージ・ブ
ールの子孫といわれます。ジョージ・ブールは数学の世界に「論
理」を取り入れた人物であり、AIと密接な関係があります。
 当時、数学は「数」や「図形」を扱う学問で、「論理」は哲学
の分野であると考えられていました。しかしブールは論理や推論
を数学的に考えられるのではないかという発想を持ち、1844
年の論文において「演算」を記号で表し、その記号同士の計算を
考えたのです。これがプール代数です。
 ヒントン教授の凄いところは、2度にわたる「AIの冬」を経
てもAIの研究を続けたことです。そして、やっと2012年6
月にグーグルとスタンフォード大学のAI研究チームは、動画の
なかから「猫」を認識したのです。
 しかし、これにはディープラーニングに与えるデータの前処理
というものが必要です。しかも、大量のデータを与える必要があ
ります。2012年の快挙のときでも、ユーチューブからランダ
ムに選んだ動画から、一定のピクセルサイズの画像を1000万
枚も準備していますが、これが前処理です。
 この1000万枚の画像のなかに偶然最も多く写っていたのが
「猫の画像」であり、AIは「猫」を認識できたのです。もう少
し詳しくいうと、その画像のなかに、さまざまな角度からの猫の
画像が入っていたからであるということができます。
 人間の子供であれば、「これが猫だよ」と教えられれば、どの
ような角度からでも、すぐ「猫」だと認識できます。他のどのよ
うな猫に関しても同じです。しかし、ニューラルネットワークで
は、画像のピクセルがほんの少し動いただけでも画像を全然別の
ものと認識してしまいます。そういう誤差が起きないように、た
くさんの画像を認識させる必要があります。
 これに関してヒントン教授は、2017年10月に「カプセル
ネットワーク」という名の論文を発表しています。その原文のU
RLは、次の通りです。
─────────────────────────────
             Geoffrey E. Hinton
      Dynamic Routing Between Capsules
                  https://bit.ly/2xXEB4P
─────────────────────────────
 これによって、AIの画像認識率が格段に向上したのです。こ
れまでのニューラルネットワークの最高時の精度を実現でき、そ
の誤答率はニューラルネットワークの最低時の半分のレベルまで
減少したといわれます。
 「カプセルネットワーク」とは何でしょうか。
 この「カプセル」という概念がかなり難解です。カプセルネッ
トワークについて解説しているサイトによると、カプセルについ
て次のように説明しています。
─────────────────────────────
 「カプセル」とは、むき出しの仮想ニューロンの小さな集合体
で、猫の鼻や耳のような、ある物体の異なるパーツと、空間にお
けるそれらの相対的な位置を探知するよう設計されている。多数
のカプセルによるネットワークは、新たな場面について、「実は
すでにある場面を違う視点から見たものだ」と理解し、その気づ
きを利用する。           https://bit.ly/2HALKYj
─────────────────────────────
 添付ファイルを見てください。人の顔を認識するときに、従来
のニューラルネットワークでは、それが目なのか、鼻なのか、口
なのかにしか着目していないのです。ちょうど、左の画像のよう
に認識しています。
 これに対し、カプセルネットワークでは、右の画像のように、
それらの特徴がどのような関係で配置されているかまで含めて認
識します。つまり、カプセルネットワークでは、目や鼻や口や耳
の特徴を独立的にとらえるだけでなく、それらがどのような位置
関係で配置されているかまで認識します。
 ひとつひとつのカプセルにつまったニューロンが個々の特徴に
着目するだけでなく、それぞれの位置関係まで把握するのです。
ここにカプセルネットワークの名前の由来があります。
 ヒントン教授のこの最新の論文にについては、発表されたばか
りであり、その成果をうんぬんするには、まだ早いかもしれませ
んが、確実に従来のニューラルネットワークを前進させるもので
あり、各方面から多くの賛辞が寄せられています。
─────────────────────────────
◎ローランド・メミセヴィッチ/モントリオール大学教授
  与えられたある量のデータから、既存のシステムよりも多く
 の理解を得られる。
◎ゲイリー・マーカス/ニューヨーク大学教授
  ヒントンの最新の業績は、歓迎すべき新たな風の息吹を象徴
 しています。AI分野の研究者たちは、脳にもともと組み込ま
 れている仕組みを積極的に真似るべきです。視覚や言語といっ
 た必須の能力を身に付けるために役立つのですから。
  新たに登場した体系が、どこに行き着くかはまだ分かりませ
 ん。でも、これまでのAI研究が固執し、はまり込んでしまっ
 ていた轍から抜け出す方法を見つけたという点において、ヒン
 トンは素晴らしい成果を挙げたといえるでしょう。
                  https://bit.ly/2HALKYj
─────────────────────────────
          ──[次世代テクノロジー論U/027]

≪画像および関連情報≫
 ●深層学習を根底から覆すカプセルネットワークの衝撃
  ───────────────────────────
   現在の深層学習ブームのきっかけを作ったのが、トロント
  大学のジェフリー・ヒントン教授であることには誰も疑問を
  抱かないでしょう。ヒントン教授らのグループはそれまで目
  覚ましい成果がなかなか出なかった画像認識という分野に深
  層畳み込みニューラルネットワークという新しいアイデアで
  取り込み、目覚ましい成果を挙げたことで、グーグルはヒン
  トン教授の設立した企業DNNリサーチを買収し、今のディ
  ープラーニングブーム旋風が世に巻き起こりました。だいた
  い、この手のニューテクノロジーブームというのは、2、3
  年で落ち着くのが常です。
   しかし、稀にブームで終わらずに、本物のイノベーション
  になる技術があります。たとえば、モバイル・インターネッ
  ト、リアルタイム3Dコンピュータグラフィックス、スマー
  トフォンなどです。
   スマートフォンの場合、なにもアイフォーンが最初ではあ
  りませんでした。アイフォーンのプロトタイプのようなもの
  が1990年代後半からいくつも登場しては消えていったの
  です。人工知能分野のなかでも、特にニューラルネットワー
  クはスマートフォンと似ています。過去に何度も注目を集め
  ブームになりながら、いまひとつ定着できずイノベーション
  に昇華できなかったもののひとつです。
                  https://bit.ly/2kWUFdI
  ───────────────────────────
 ●添付ファイル画像出典/https://bit.ly/2prgd4T


カプセルネットワークとは何か.jpg
カプセルネットワークとは何か
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月11日

●「教師なし学習で『猫の概念』獲得」(EJ第4782号)

 すっかり、世間一般にAI(人工知能)という言葉が定着した
感があります。つい5年くらい前であれば、AIは専門用語であ
り、エンジニアしか知らなかった言葉です。したがって、書いて
いると、話がどうしても難しくなります。しかし、どうせ知るの
であれば、多少詳しいところまで、踏み込んで知る方があとあと
まで役に立ちます。
 どうしてコンピュータが人間と同じように見たり、聞いたりで
きるのでしょうか。ついこの間まで、コンピュータはモノのかた
ちを認識できなかったのです。ここに一枚の写真があったとしま
す。人が写っています。人間なら、すぐそれが人の写真であり、
女性の写真であるかがわかりますが、コンピュータは何の写真か
ぜんぜんわかりません。コンピュータが把握できるのは、無数の
小さいピクセル(画素)の集合体にしか見えないのです。それを
具体的な画像としてコンピュータに認識させる技術が「ディープ
ラーニング」です。
 添付ファイルを見てください。AIには、構造的にデータを入
力する「入力層」と、結果としてデータを出力させる「出力層」
があります。中間部には「隠れ層」という層がいくつもあります
が、データはそれらのいくつもの層を通過するごとに、少しずつ
具体的なかたちとしてとらえ、最終的に完全なかたちとなって出
力されます。そういう多くの層を通過することから「ディープ」
と呼ばれるのです。
 この画像認識について、早稲田大学ビジネスファイナンス研究
センター顧問の野口悠紀雄氏は次のように解説しています。
─────────────────────────────
 画像認識の場合、画像を多数の小さな部分(ピクセル)に分け
数値化したデータを、ニューラルネットワークの最初の層に人力
する。そこから第2層にデータが渡される際、各ニューロンの値
に異なる値(重み)を掛けた値を次の層の特定のニューロンに送
る。以降、同様にして最後の層までデータが渡され、最終的な出
力が生成される。
 何十万枚、あるいは何百万枚もの画像を読み込む学習によって
正しい答えを出せるようになるまで重みの値を調整する。現在で
はエラー率が5%まで低下しており、人問の画像認識能力とほぼ
同じになつている。対象によっては、人間より速く正確に認識で
きる。                ──野口悠紀雄氏論文
        「ディープラーニングの驚くべき威力と限界」
  『超整理日記/週刊ダイヤモンド』/2018年5月12号
─────────────────────────────
 コンピュータが画像を認識できるということは、手書きを含む
文字はもちろんのこと、モノの形状を認識できるので、宅配、郵
便などの物品の仕分け作業の分野などで、AIは、大いに役に立
つことになります。
 医療分野においても、AIの需要は高いのです。日本は医療機
械のCTとMRIの台数では、それぞれ世界第1位と2位ですが
それを撮影し診断する放射線医の数が圧倒的に不足しています。
したがって、AIを使えば、CTやMRIの画像の診断に役立て
ることができます。しかも、診断を重ねるごとに、判断の精度は
向上していくことになります。
 2012年6月のことです。グーグルとスタンフォード大学の
共同研究チームの開発したニューラルネットワークが、AIの歴
史に残る成果を発表します。ユーチューブの動画から「猫」の概
念を獲得したという発表です。「猫の概念の獲得」というのは、
コンピュータが、猫が写っている画像を見分けられるようになっ
たということを意味します。
 この場合、重要なのは、コンピュータに猫の特徴を教えていな
いということです。特定の何かが写っている動画を与えたのでは
なく、任意のユーチューブ動画で学習させただけです。実験内容
を少し詳しく述べます。
 具体的にいうと、ユーチューブにアップロードされている動画
からランダムに取り出した「200×200ピクセルサイズ」の
画像を1000万枚用意し、1000台のコンピュータを使って
9つの層のニューラルネットワークで、ディープラーニングによ
る学習を行わせたのです。
 AIは、さまざまなモノが写っている1000枚の画像を学習
し、パターン分析を行い、グループ分けを行ったのですが、その
なかで猫については認識できるようになったということです。そ
れは、おそらく動画には猫が一番多く写っていたのではないかと
思われます。実際にネット上には、おびただしい数の猫の動画が
溢れています。
 いわゆるニューラルネットワークの「機械学習」には、次の2
つの学習法があります。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 1の「教師あり学習」とは、文字通り人間が先生になって、つ
きっきりで、コンピュータに教えることです。たとえば、猫とは
どういうかたちをしているかについて、その特徴点を教え込み、
複数の動物の写真のなかから、正確に猫の写真を選ばせるように
する方法です。しかし、この方法では、AIはいつまで経っても
人間を超えることはできません。
 これに対して2の「教師なし学習」は、人間の助けなしにコン
ピュータに独力で学習させる方法です。多くのデータのなかから
自律的に学習させる方法です。グークルとスタンフォード大学の
共同研究チームは、これを達成させたのです。
 実は、猫だけではなく、自動車、椅子、人の顔などの概念も同
時に認識していたそうです。いずれにしても、この快挙によって
AIは人間に大きく一歩近づいたといえます。
          ──[次世代テクノロジー論U/026]

≪画像および関連情報≫
 ●パスポートをかざすだけで入国審査/「顔認証ゲート」
  ───────────────────────────
   法務省は2018年6月8日、国内で初めて成田空港で、
  11日から運用を開始する顔認証技術を活用した「顔認証ゲ
  ート」を公開した。パスポートをかざすだけで入国審査がで
  きるシステムで、事前手続きは不要となる。本格運用によっ
  て、出入国手続きの時間の短縮が期待される。利用者の多い
  中部、関西、福岡空港でも、年内に導入される予定。
   顔認証ゲートでは、ICチップが内蔵されたパスポートを
  機械にかざしチップの顔写真データと、自動化ゲートのカメ
  ラで撮影した顔をコンピューターで照合。同一人物か確認し
  顔が一致すればゲートが開く。
   対象は身長135センチ以上の利用者。法務省によると、
  他人を誤って入国させる確率は0・01%以下という。パス
  ポート発給時と顔が大きく変わっていなければ10秒ほどで
  終了する。マスクや帽子を着用していると注意を促すメッセ
  ージが機械に表示される。
   現行の出入国審査では、審査官がパスポート写真と本人を
  見比べて確認する手続きが一般的だった。昨年10月から羽
  田空港国際線ターミナルで帰国者を対象に3台が先行導入さ
  れていたが、本格導入は成田が初めて。今月11日から第2
  第3ターミナル、18日から第1ターミナルの上陸審査場で
  運用を開始する。        https://bit.ly/2sQYTaa
  ───────────────────────────

ニューラルネットワーク/ディープラーニング.jpg
ニューラルネットワーク/ディープラーニング
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月08日

●「人間の脳について知る必要がある」(EJ第4781号)

 ニューラルネットワーク(NN)で注目すべき話題が小林雅一
氏の本に出ています。小林雅一氏は、KDDI総研リサーチフェ
ローです。AIの関連書籍のなかでは、数も多く、ダントツで分
かりやすい本であると思います。
 ある研究チームが、NNを使って機械翻訳システムを開発する
に当たり、手始めに英語と中国語を学習させたのです。これらの
2ヶ国語の語学力が一定のレベルに達した後で、今度はスペイン
語を学習させてみたところ、なぜか、中国語の語学力が一段と向
上したといいます。
 どうして、スペイン語を学習させると、中国語の語学力が向上
したのか、そのメカニズムは、そのシステムを開発したエンジニ
アもわかっていません。NNの神経回路網は複雑であり、その思
考回路については、開発エンジニアにとってブラックボックス化
しつつあります。それは、人間の思考回路に少しずつ近づいてい
ることを意味します。
 人間の「脳」をシミュレートする以上、人間の脳自体の研究が
必要になります。しかし、脳には現代の科学でもわかっていない
ことがまだたくさんあります。そのため、神経科学者たちはさま
ざまな実験を行っています。
 ある動物実験の話を紹介します。これも小林雅一氏の本からの
情報です。大脳には「聴覚野」と呼ばれる領域があります。これ
は、人間が耳からの音声情報を理解するための領域ですが、「視
覚野」と比べると、不明なことが多く、あまりよく解明されてい
ません。視覚野とは、大脳皮質における視覚に関する領域のこと
をいいます。
 ある神経科学者は、動物の耳から聴覚野へとつながる神経のラ
インを切断し、目から出ているラインを聴覚野につないでみたそ
うです。当然その動物は視力を失います。しかし、その後、不思
議なことが起きたのです。その動物は視力を取り戻し、モノを見
ることができるようになったのです。
 こうした実験を重ねて神経科学者たちはひとつの仮説を立てた
のです。小林雅一氏は次のように解説しています。
─────────────────────────────
 これら一連の実験結果を基に、神経科学者たちは大胆な仮説を
立てました。それは「視覚」「聴覚」「触覚」「味覚」など、人
間の様々な知覚能力に通底する基本的なメカニズムがある、とい
うものです。これに従えば、脳は目や耳から人力された生々しい
初期情報を、段階的に抽象化して、徐々に上位の概念を形成して
いきます。彼らは、このメカニズムを自分連なりに考えて、具体
的なアルゴリズムへと転化し、これを「スパース・コーディング
(Sparse Coding)」と命名しました。英語の「Sparse」 は「少
量の」という意味で、ここでは「大量の情報から、抽象化に必要
な本質的情報だけを、少しずつ抜粋すること」を指しています。
これによって隠れ層をより多層化しても、現実的な時間内で情報
処理ができるようになりました。  ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 難しい言葉が出てきました。「スパース・コーディング」とは
一体何でしょうか。
 米カルフォルニア大学バークレー校にブルーノ・オネスホーゼ
ン氏という教授がいます。計算論的神経科学(コンピューテーシ
ョナル・ニューロサイエンス)の分野で業績を上げている学者で
す。このオネスホーゼン氏が同大学のデービス校で、准教授をし
ていた頃の話です。
 オネスホーゼン教授は、脳の視覚野の一部の「V1」の研究の
第一人者ですが、動物の目から入力された視覚情報を脳にどのよ
うに処理されるかを解明する仮説を立てたのです。
 難しい話になりますが、視覚情報は目から入り、大脳皮質の一
番後ろにある第一次視覚野(V1)に送られます。サルやヒトで
は傾き、動き、奥行きなどの情報は、V1ではじめて抽出され、
さらに前方の大脳皮質に送られます。私たちが物の位置や形を認
識するとき、V1からその前方の大脳皮質に送られる情報が重要
な働きをしていると考えられます。ちなみに、このV1が壊れる
と、目が見えなくなります。
 V1に入ってきた目からの視覚情報は、無数のピクセル/画素
の集まりです。この状態では、それが何であるかは不明ですが、
V1で段階的にかたちを作り、認識にいたるのです。これについ
て、小林雅一氏は、次のように解説しています。
─────────────────────────────
 脳の視覚野は、このピクセル情報からいくつかの特徴ベクトル
(物体の輪郭を構成する線)を自動的に抽出します。そしてこの
ベクトルをいくつか組み合わせて、「目」や「耳」のようなパー
ツ(部品)を描き出し、それが終わると今度はこれらのパーツを
組み合わせて、「猫」や「人」の顔など最終的な対象物を描き出
している。要するに脳の視覚野は、そのように段階的に対象物を
認識しているというのです。         ──小林雅一著
   『AIの衝撃/人工知能は人類の敵か』/講談社現代新書
─────────────────────────────
 目から入った視覚情報、仮に人の顔であるとします。それらは
視覚野「V1」に入った最初の段階では、無数のピクセルの集ま
りにすぎません。その中から特徴的なパーツ(ベクトル)を抽出
し、そのうえで、それらを組み合わせて、段階的に顔を形成して
いくのです。
 そのプロセスには一定のルールのようなものがあるので、それ
をコンピュータで処理可能なアルゴリズムに転化させることがで
きます。オネスホーゼン氏は、そのことを「スパース・コーディ
ング」と名付けたのです。この場合、ひとつひとつのベクトルは
脳のニューロン一個一個に対応します。
          ──[次世代テクノロジー論U/025]

≪画像および関連情報≫
 ●人工知能を語る前に、脳について知りたい
  ───────────────────────────
   たった1つの学習理論とは脳が物事を学習する際には、そ
  の処理対象に応じた活動をするわけではなく、全ての処理対
  象に対して唯一の学習方法を使っているという考え方です。
  これは理論と名付けられている通り、そういう考えがあるだ
  けで、まだ確実にそうだと証明されているわけではありませ
  ん。しかし、1つの考え方として認められているものでもあ
  ります。特に人工知能関連では「スパース・コーディング」
  というものが有名です。スパースコーディングとは、ある処
  理を行うときに、なるべく少ない神経活動で済ませられるよ
  うに学習が行われるという考え方です。
   視神経を切断すると、当然視力を失います。視力を失った
  状態で、その切断した視神経を聴覚を処理している脳の神経
  に接続した場合にどうなるでしょうか。もしも音の処理と光
  の処理が異なるものであるならば、視覚の信号を聴覚の脳の
  領域に与えた所で何も起こらないはずです。しかし驚くこと
  に次第に視覚が取り戻されていったのです。すなわち視覚の
  信号を聴覚に使われていた脳の領域で処理することができた
  のです。これは、脳の視覚と聴覚に関する信号の処理構造は
  本質的な差異がなく、ある統一された学習によって意味のあ
  る情報として獲得しうると考えられます。
   視覚の情報処理機構を、アルゴリズムとして実装した場合
  に、実際に画像処理として有効であるのは何となく当たり前
  のかなと思います(もちろん工学に応用できるという点で有
  意義)。            https://bit.ly/2Jehick
  ───────────────────────────

視覚野/V1.jpg
視覚野/V1
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月07日

●「ニューラルネットワークとは何か」(EJ第4780号)

 今日からは「脳科学に基づくAI」について、考えていくこと
にします。AI(人工知能)というのは、基本的には人間の脳の
働きと同じことをコンピュータに行わせるテクノロジーのことで
す。このような考え方に基づいてAIを定義すると、次のように
なります。
─────────────────────────────
 AI(人工機能)とは、インプットに対して、人間がするよ
 うなアウトプットを行う装置のことである。
─────────────────────────────
 コンピュータの性能が低い時代のAIは、少ない計算量で、人
間らしい振る舞いをさせる、たとえば、インプットに対するアウ
トプットの「ルール」を予め人間が決めておいたり(ルールベー
スのAI)、あるいは、インプットされた情報を統計確率的推論
によるアルゴリズムで精度の高いアウトプットを得る(統計・確
率的なAI)などが、これまで試みられてきています。
 しかし、インプットとアウトプットの間のブラックボックスの
部分を、人間自身がコンピュータに与えている限りにおいては、
いつまで経ってもAIが人間を超えるアウトプットを出せる存在
になることは困難です。コンピュータ自らが、自動的に知識を獲
得し、人間のように思考して、人間のようにアウトプットする存
在になって、はじめて人間を超えることができるのです。
 そうであるとすると、AIの研究は、原点に戻って人間の脳を
シミュレートする「脳科学に基づくAI」にならざるを得ないの
です。事実これまでのAIの歴史はそうなっています。
 仕事というものを人間がやれるかやれないかで分けて、AIと
の関係を考えてみます。
─────────────────────────────
       1.人間しかできなかったこと
       2.人間にはできなかったこと
─────────────────────────────
 本来AIやAIを組み込んだスマートマシンは、上記「2」の
「人間にはできなかったこと」を可能にし、結果として人間の能
力を拡張することを目的としています。
 たとえば、人間が一生かかっても参照できない量の学術文献や
判例などの法律文書をすべて読んで分析し、最適の解釈や判断を
示してくれたり、過去の犯罪記録の分析から犯罪の発生現場や内
容を予測し、それに基づいて指定された地域のパトロールを強化
することで検挙率を増やすことにより、犯罪の発生率を下げると
いったことなどが上げられます。
 これに対して、どんな強力なコンピュータでもAIでは処理で
きない上記「1」の「人間しかできなかったこと」はたくさんあ
ります。自動車の運転や企業における一般的事務作業、人との応
対業務や営業業務などがそれに当たります。AIでこれらを可能
にすることができれば、それらをAIに置換することによって、
人間の能力を効率化することができます。
 しかし、現代のAIは、上記「1」と「2」の両方ともできる
ようになりつつあります。これらのカギを握っているのが「脳科
学に基づくAI」の実現です。
 「脳科学に基づくAI」のニューラルネットワークとは何かに
ついて考えます。
 ニューラルネットワークは、神経回路網を意味する言葉で、人
間の知能をつかさどる脳を構造を模倣することで、その振る舞い
を再現しようとするタイプのAIです。科学ライターの大和哲氏
は、ニューラルネットワークを次のように定義しています。
─────────────────────────────
 ニューラルネットワークは、簡単に言うと、コンピュータ内で
データとして、インプットが入ってからアウトプットが出てくる
まで、その間に重みづけのグラフが構築されていて、「問題」と
して入力されたデータは、適切なルートを通って「回答」である
アウトプットを出力します。
 ここで言う“重み”とは、情報にとってどれだけ重要かを表し
た数値だと考えるといいでしょう。そして、ニューラルネットワ
ークの特徴は、このルートを通る間、情報がグラフ中の経路の重
み自体を、さらに軽くしたりあるいは重くしたりと、調整にも使
われる点です。つまりニューラルネットワークは、「経験から学
習する」人工知能であることが特徴のひとつです。
                  https://bit.ly/2xH3e5M
─────────────────────────────
 これだけではピンとこないと思いますが、脳科学に基づくAI
の構造は次のようなものです。初期のニューラルネットワークで
ある「パーセプトロン」には情報の入力層と出力層から成る2層
であったのに対し、現在のニューラルネットワークは、入力層と
出力層の間にいくつもの「隠れ層」といわれるものがある多層構
造になっているのです。これが「ディープ(深層)」といわれる
ゆえんです。
 多層にすると、入力層からインプットされた情報は、出力層か
らアウトプットされるまで、いくつもの隠れ層にインプットされ
何らかの処理をこ施されてアウトプットされることの繰り返しで
最終的に出力層からアウトプットされます。そのようにいくつも
の層を経過することによって、初期情報が何らかの上位概念を形
成していくと考えられるのです。
 人間の場合、目や耳から入力された情報がアウトプットされる
までの処理のプロセスはいわゆるブラックボックスであり、脳が
どのような処理を行ったかは不明です。これに対してこれまでの
AIは、インプットからアウトプットまでの推論プロセスは説明
できるのです。ブラックボックスではないのです。これでは人間
を超えることはできないのですが、ニューラルネットワークでは
その意思決定プロセスはわからなくなってきています。それだけ
現代のAIは、人間の脳に大きく近づいてきているといえます。
          ──[次世代テクノロジー論U/024]

≪画像および関連情報≫
 ●数学知識もいらないゼロからのニューラルネットワーク入門
  ───────────────────────────
   これまでに人工知能(AI)関連の記事を読んだことがあ
  る人であれば、ほぼ間違いなく”ニューラルネットワーク”
  という言葉を目にしたことがあるだろう。ニューラルネット
  ワークとは、大まかな人間の脳の仕組みを模したモデルで、
  与えられたデータを基に、新しい概念を学習することができ
  る。機械学習の一分野であるニューラルネットワークこそ、
  長く続いた”AI冬の時代”を終わらせ、新時代の幕開けを
  告げたテクノロジーなのだ。簡単に言えば、ニューラルネッ
  トワークは業界の根底を覆すような、現存するテクノロジー
  の中でもっともディスラプティブな存在だ。
   そんなニューラルネットワークに関するこの記事の目的は
  読者のみなさんがディープラーニングについて会話ができる
  ようになるくらいの理解を促すことにある。そのため、数学
  的な詳しい部分にまでは入らず、なるべく比喩や、アニメー
  ションを用いながらニューラルネットワークについて説明し
  ていきたい。
   AIという概念が誕生してからまだ間もない頃、パワフル
  なコンピューターにできるだけ多くの情報とその情報の理解
  の仕方を組み込めば、そのコンピューターが”考え”られる
  ようになるのでは、と思っている人たちがいた。IBMの有
  名な「ディープブルー」をはじめとするチェス用のコンピュ
  ーターはこのような考えを基に作られていた。
                  https://tcrn.ch/2Ja4UtU
  ───────────────────────────

ニューラルネットワーク.jpg
ニューラルネットワーク
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月06日

●「パーセプトロン/その正体を知る」(EJ第4779号)

 「パーセプトロン」──AIの話をするときは、必ず出てくる
キーワードです。パーセプトロンについては、もう少し書く必要
があります。不明な点がたくさんあるからです。
 実はAI(人工知能)の研究は、「ルールベースのAI」から
始まったわけではないのです。最初はコンピュータで何とか「人
工の脳」を作ろうとしたのです。
 1943年のことです。米国の神経生理学者のウォーレン・マ
カロック氏と論理学者のウォルター・ピッツ氏が、共同で次の論
文を発表したのです。
─────────────────────────────
    ウォーレン・マカロック/ウォルター・ピッツ著
      『神経活動に内在するアイデアの論理演算』
                     1943年
─────────────────────────────
 人間の脳は、ニューロンという神経細胞が複雑に絡み合い、全
体でネットワークを形成しています。これが、神経回路網、すな
わち、ニューラルネットワークです。
 マカロックとピッツ両氏は、基本単位であるニューロンの振る
舞いを「ステップ関数」と呼び、それを数式によって表現したも
のを「形式ニューロン」と呼んだのです。つまり、数学モデルの
話なのです。しかし、これはシステムにはなっていません。
 この先駆的研究を引き継いだのが、コンピュータ科学者のフラ
ンク・ローゼンブラット氏です。彼はこの形式ニューロンを複数
組み合わせて、情報の入力層と出力層から成るきわめてシンプル
な人工的ニューラルネットを開発し、「パーセプトロン」と名付
けたのです。
 上記のように、この形式ニューロンは数式であり、それを組み
合わせたニューラルネットも数学的な産物です。しかし情報の入
力層と出力層を持っているので、一応システムになっています。
何らかの情報を入力し、計算結果として出力情報を得ることがで
きるからです。したがって、パーセプトロンとは、そういうこと
ができるハードウェアではなく、ソフトウェア的な数学モデルで
あるということができます。
 このパーセプトロンがマービン・ミンスキー氏とシーモア・パ
パート氏によって否定されたことは昨日のEJでふれましたが、
具体的には次のようにいったのです。
─────────────────────────────
 パーセプトロンは、原理的、かつ致命的な問題を抱えているた
め、いくつかの単純な論理計算、たとえば、排他的論理和をコン
ピュータ上に実現できない。    ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 ここでいう「排他的論理和」とは何でしょうか。
 Aという円とBという円が一部重なっているとします。その重
なった部分は、AでもありBでもある部分ですが、その部分を排
除するというのが排他的論理和です。集合の問題です。これを小
林雅一氏は、次のようにわかりやすく説明しています。
─────────────────────────────
 「排他的論理和」とは・・・
 たとえば、母親が小さな子供に向って、「チョコかプリンのど
ちらかは食べていいけど両方は駄目よ」と言うようなものです。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、小さい子供でもわかる「排他的論理和」ですが、パー
セプトロンにはわからないということで、パーセプトロンの信用
は失墜したのです。
 しかし、今になって考えてみると、この単純な人工脳パーセプ
トロンがベースになり、ニューラルネットワークとして、AIは
息を吹き返したのです。2006年頃のことです。その立役者は
英国のコンピュータ科学者、ジェフリー・ヒントン氏です。彼こ
そ「ディープラーニング」の命名者です。AIは、人工脳への挑
戦にはじまり、50年以上の年月を重ねて再び脳の研究に戻った
のです。ここまでのAIの歴史を辿ると次の4段階になります。
─────────────────────────────
    1.パーセプトロンAI ・・ 1950年代
    2.ルールベースのAI ・・ 1980年代
    3.統計・確率的なAI ・・ 1990年代
    4.脳科学に基づくAI ・・ 2000年代
─────────────────────────────
 最初は、何とか人間の脳を人工的に作り出したいと考えたので
す。その結果、パーセプトロンが考案されます。これによって世
の中は一時騒然となったのです。しかし、それが小さい子供の脳
にすら、はるかに及ばないとわかって、多くの投資家は資金を引
き上げ、1回目の「AIの冬」に突入します。
 続いて、高性能コンピュータの開発を前提として、コンピュー
タに多くの知識を与えることによって、推論により人間の脳を模
倣する「エキスパートシステム」ブームになります。「ルールベ
ースのAI」の時代です。
 しかし、やがて、コンピュータに知識を与えること(知識の獲
得)の困難性が露呈します。人間の持つ知識の多いことと、つね
に新しい知識が増えるので、知識の獲得が極めて困難であること
が明らかになり、AIは2回目の「AIの冬」に突入します。
 1990年から2000年にかけてインターネットが普及し、
ウェブサイトが激増します。それを知識ベースとして利用し、グ
ーグルの統計学エンジニアが中心になって「統計・確率的AI」
が台頭します。その結果、検索の精度が飛躍的に向上するととも
に、機械翻訳などの他のAIの精度も向上します。しかし、この
「統計・確率的なAI」の限界も明らかになり、再び人工脳の開
発が始まるのです。 ──[次世代テクノロジー論U/023]

≪画像および関連情報≫
 ●ベイジアンネットワーク/AIの歴史/後編
  ───────────────────────────
   ベイズ理論をベースにしたベイジアンネットワークは19
  80年頃に研究が始められました。これは統計・確率論的な
  アプローチによるAI技術です。
   ベイズ理論とは、観測を繰り返すごとに確率を修正して正
  解に近づけるという考え方であり、それをもとにしたベイジ
  アンネットワークは因果関係を確率で表現するグラフィカル
  モデルです。
   ある事象に対する原因の確率と結果の確率をノードとし、
  それらをエッジで繋いだ形で表現されます。観測によって得
  た新たな情報をベイジアンネットワークに投入するとそれぞ
  れの確率が変化し、その確率に基づいて推論を行います。ベ
  イジアンネットワークには原因から結果を推論することも、
  結果から原因を推論することも可能であるという特徴があり
  ます。ベイジアンネットワークはネットショップでのお勧め
  商品紹介、健康診断結果からの疑わしい病気の推定、スパム
  フィルタ、ウェブ侵入検知など、様々な分野での実用例があ
  ります。そして現在でも、ビッグデータ活用の手法の一つと
  して利用されています。
   統計・確率論的なAIに対しては、「統計と確率が基本に
  あるため、それは知性や知能ではない」という批判がありま
  す。膨大なデータの解析結果から単語の辞書的な意味を確率
  的に知ることはできるが、その単語の本当の意味を理解する
  ことはできません。人間の知能そのものを作るということを
  目的とした場合、統計・確率論的なAIはいつか限界に達す
  ると予想されます。       https://bit.ly/2HgYKlU
  ───────────────────────────

パーセプトロン理論.jpg
パーセプトロン理論
posted by 平野 浩 at 00:00| Comment(1) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月05日

●「人工脳『パーセプトロン』の理論」(EJ第4778号)

 現在のAI(人工知能)の中心は「ディープラーニング(深層
学習)」です。そのディープラーニングが何であり、どのように
役立つのかを知るためには、どうしてそこにいたったのか、AI
の歴史を知る必要があります。新しい技術を理解するには、その
技術が生まれた背景を知ることが不可欠だと考えています。
 グーグルは、検索精度の向上を図るため、「セマンティック検
索」の実現を目指し、その結果、自動的に作り出された「ナレッ
ジ・グラフ(知識ベース)」によって、検索の精度の大幅向上に
成功しています。これは、統計確率的AIの精度の向上に寄与し
たことになりますが、このナレッジグラフにストックされた知識
の件数は、2012年の時点で実に6億件を超えています。
 このナレッジグラフの構築作業は、グーグル開発による機械学
習プログラムによって日夜休むことなく続けられ、それは単に検
索精度の向上のみならず、機械翻訳など、AI全体の精度の向上
に貢献しつつあります。現在、グーグルがAIにおいて主導権を
握りつつあるのは、このナレッジグラフの存在と無関係ではない
といえます。
 しかし、1950年代から「ルールベースのAI」の実現を目
指してきた古典的AI派の学者や研究者たちは、統計確率的AI
の研究者たちに対して、次の疑問を突き付けています。
─────────────────────────────
 しかし、我々にも言いたいことがある。君達のように統計、確
率に従うAIは、人間の思考プロセスと明らかに別種のものだ。
そのような方法で、いずれ人間の知能や知性をコンピュータ上に
再現できると本気で信じているのか?つまり、今は結果を出して
いるからいいが、その先に未来はあるのか?
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 確かに統計確率知的AIは、ウェブサイトの検索や機械翻訳な
どの精度を大きく向上させたものの、それは、AIの一里塚に過
ぎないのです。このような状況の下で浮上してきたたのが「ニュ
ーラルネットワーク」です。最近この言葉をよく聞きますが、ニ
ューラルネットワークとは何でしょうか。これを真正面から取り
上げると、複雑な数式の世界に入ってしまうので、それを避けて
なるべく簡単な説明を試みます。
 ニューラルネットワーク(以下、NN)とは、機械学習や神経
科学などの分野で扱われる計算モデルの一種といってよいでしょ
う。この名前から想像されるように、脳の神経回路から知見を得
たモデルであり、「ニューロン」と呼ばれる最小の計算単位を、
ネットワーク状につなげた構成をしています。現在、話題になっ
ている「ディープラーニング」は、このNNを利用しています。
はっきりしていることは、NNは、機械学習の一分野であるとい
うことです。
 NNというと、ごく最近の技術のように思うかもしれませんが
大変長い歴史があります。そもそもAIの研究は、1956年の
ダートマス会議からはじまったのですが、その次の年である19
57年に「パーセプトロン」というシステムの概念が話題になっ
たのです。これは、米国のコンピュータ科学者であるフランク・
ローゼンプラットという学者が考案した概念です。
 簡単にいうと、人間の視覚と脳の機能をモデル化したもので、
それでいて、パターン認識を行い、シンプルなネットワークであ
りながら、自力で学習する能力を持つという理論です。
 この「パーセプトロン」についてネットで調べると、いずれも
数式を使った非常に難しい解説が出てきます。そこで、ここでも
分かりやすい小林雅一氏の解説を引用します。
─────────────────────────────
 パーセプトロンは、脳内におけるニューロンとシナプスによる
信号伝達メカニズムを極度に単純化したシステムでしたが、それ
でも幾つかの基本的な図形、たとえば三角形と四角形の違いを学
習し、それらを分類することができました。このように、コンピ
ュータが自力で学習することのインパクトは大きく、当時の米国
では『ニューヨーカー』のような知識人向けの一流雑誌が、「こ
れが今後進化すれば、いずれは人間のように感じ、記憶し、考え
る機械が生まれるだろう」と激賞するほどでした。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、パーセプトロンは、コンピュータに図形を認識させよ
うとしたのです。今日でいうところのNN、すなわち、ニューラ
ルネットワークの原型になるような先進的な理論であったという
ことができます。
 ところが、このパーセプトロン理論に対して、ダートマス会議
のメンバーの一人であるマービン・ミンスキー氏と南アフリカ生
まれの数学者、シーモア・パパート氏の2人は、次の論文を書い
て、この理論の限界を指摘したのです。
─────────────────────────────
     マービン・ミンスキー/シーモア・パパート共著
  『パーセプトロン/計算機科学への序論』/1969年
─────────────────────────────
 この論文では、パーセプトロンには致命的な欠陥があり、この
理論では、今後どのように改良しても限界があることを指摘して
います。実は、ミンスキー氏らとしては、パーセプトロンに反論
したのではなく、問題点を指摘しただけなのですが、それでもこ
の2人の学者の指摘は正鵠を射ており、これによってパーセプト
ロンに対する世間の期待は一気にしぼんでしまったのです。
 このときから実に20年以上の歳月を経て、パーセプトロン理
論ではない別の考え方に基づくパーセプトロンのネックを解決す
る新理論が提案されたのです。それがNN、ニューラルネットワ
ークです。     ──[次世代テクノロジー論U/022]

≪画像および関連情報≫
 ●人工知能「冬の時代」が到来/牧野武文氏
  ───────────────────────────
   1963年に、ミンスキーは、シーモア・パパートと知り
  合った。この南アフリカ生まれの数学者は、数学の学士号を
  とるためにイギリスのケンブリッジ大学で学んでいた。その
  ときにパーセプトロンに興味をもったが、パーセプトロンの
  機能については、ミンスキーを同じように限定的なものでは
  ないかという疑いを持った。
   パパートが、MITを訪れ、ミンスキーと面会すると、二
  人の考えはたちまち一致した。パーセプトロンがあまりに魅
  力的に見えすぎるため、人工知能研究者が誤った道に進もう
  としている。パーセプトロンを追求しても、それは袋小路に
  なっているのだ(現在のディープラーニングの基礎となって
  いるのもパーセプトロンだが、それには飛躍的な進化が必要
  だった)。
   パパートは、MITの数学科の教職を得て、さらにミンス
  キーのAI研の研究員となることで、ミンスキーといっしょ
  にパーセプトロンの限界を探る研究を始めた。パパートとと
  もに導きだした結論は、パーセプトロンは線形分離可能な問
  題しか学習できないということだった。線形分離可能という
  は、直線で集団をわけることができるような事象のことだ。
                  https://bit.ly/2J9EuZj
  ───────────────────────────

フランク・ローゼンブラット氏/パーセプトロン.jpg
フランク・ローゼンブラット氏/パーセプトロン
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月04日

●「AI導入によるグーグル検索技術」(EJ第4777号)

 元グーグルのCEOのエリック・シュミット氏は、次のような
ことをいっています。
─────────────────────────────
 文明の始まりから21世紀初頭までに生産された情報量は、約
5エクサ・バイト(エクサは10の18乗)だが、これと同じ情
報量が現代社会では、たった2日間で生産される。
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 「エクサ」といってもピンとこないと思います。百万を意味す
る「メガ」、10億を意味する「ギガ」までは誰でも知っていま
すが、その先は、「テラ」(兆)「ペタ」(千兆)ときて、次が
「エクサ」(百京)になります。
 このように、現在、ウェブ上の情報が加速度的に増加している
のです。グーグルは基本的には検索エンジンの会社ですが、この
ような情報の爆発的増加は、検索というものを一段と困難にしま
す。それは、本当に探したい情報以外のノイズが、劇的に増える
ことを意味するからです。たとえると、今までは砂場に落ちた指
輪を探す程度だったものが、現在では、砂漠に落ちた指輪を探す
レベルに検索困難度が上昇してしているのです。
 そこでグーグルは、検索エンジンにAIを導入し、人間の要求
するウェブサイトを、高速で、一発検索することに成功したので
す。これを「セマンティック検索」といっています。それは日々
その精度を増しつつあります。
 グーグルは、いわゆる知識を人間がコンピュータに与えている
限り、AI開発の意味はないと考えていたのです。すべての機械
は、人間を単純な繰り返し作業、マニュアル・レーバーから解放
し、ラクをさせることに目的があります。そのためには、何とか
コンピュータが、自動的に学習して知識量を増やし、それをベー
スに判断させることができないかと工夫したのです。その結果、
できたのが「ナレッジグラフ」という知識ベースです。このグー
グルのセマンティック検索について、小林雅一氏は、次のように
解説しています。機械が学習するプロセスがよくわかります。
─────────────────────────────
 グーグルのセマンティック検索では、そのシステムが自動的に
ナレッジ・グラフ(知識ベース)を構築していきます。グーグル
の機械学習システムは、ウェブ上にある無数のホームページを読
み漁り、それらを統計的に分析することによって得た知識を、あ
る種の知識体系の上にマッピングしていきます。たとえば、「東
京」というのは90%の確率で地名らしい。「日本」というのは
95%の確率で国名らしい。そして「東京」は85%の確率で日
本の首都らしい。(中略)システムはこれらの確率事象を照合し
それらが互いに矛盾していないことを確認します。このようにし
て作られる「知識の関係」リストがオントロジーで、それらが大
量に積みあがったものが知識ベース、つまりナレッジ・グラフな
のです。            ──小林雅一著の前掲書より
─────────────────────────────
 上記にある「オントロジー」とは、エキスパートシステムの世
界で使われる概念で「知識の表現」に当たります。対象世界にか
かわる諸概念を整理して体系づけ,コンピュータにも理解可能な
形式で記述したものをいいます。
 2回目の「AIの冬」の後、ベイズ理論をベースとする統計確
率的AIが発展します。その創始者のジュディア・パール氏の弟
子たちの多くは、グーグルをはじめとするシリコンバレーの企業
に入社し、AIの発展に貢献しています。なかでもグーグルに入
社した統計学を専門とする研究者は、セマンティック検索や機械
翻訳の分野でも活躍をします。
 グーグルの機械翻訳チームは、ウェブ上から、オリジナルの文
書とそれが別の言語の訳文の文書のペア──たとえば、英語の原
文とフランス語の訳文など──をかき集め、それをグーグルの強
力なサーバー・コンピュータに読み込ませて、知識ベースを構築
したのです。これは、比較的簡単な作業です。
 これは、コンピュータにとって、自学自習用のテキストになり
ます。コンピュータは原書と訳文を突き合わせて、ベイズ理論に
基づく推論をし、たとえば、上記の例であれば、英文を与えると
フランス語に翻訳するし、フランス語から英訳も、ほぼ正確にこ
なしたのです。ここで重要なことは、推論型AIが重視した文法
や構文を完全に無視したことです。これによってさらに精度が向
上し、ウェブサイト上の翻訳として使われています。
 英語を日本語に訳すのは、まだそこそこではあるものの、精度
は確実に向上しています。このグーグルの機械翻訳の技術の凄さ
については、小林雅一氏の次のエピソードによって、十分証明さ
れると思います。
─────────────────────────────
 アメリカ国立標準技術研究所(NIST)が数年に一度主催す
る機械翻訳のコンテストがあります。そこには毎回、全米の著名
な大学や研究機関の機械翻訳チームが参加していましたが、20
05年に初めてグーグルが参戦しました。他のチームが、中国語
やアラビア語などの専門家を必ずメンバーに入れていたのに対し
グーグルの機械翻訳チームにはそうした言語学者は一人もいませ
んでした。グーグル・チームは統計の専門家だけで固められてい
たのです。そして驚くべきことに、世界各国の言語に関しては全
く無知のグーグル・チームが、機械翻訳の分野で何十年という経
験を持つ他のチームを圧倒したのです。これは統計・確率的なA
Iが、文法などルール・ベースのAIに勝利を収めた瞬間として
専門家の問で語り草になつています。
                ──小林雅一著の前掲書より
─────────────────────────────
          ──[次世代テクノロジー論U/021]

≪画像および関連情報≫
 ●自動翻訳なぜ急速進化/2つのブレークスルー
  ───────────────────────────
   コンピューターで外国語を翻訳する機械翻訳(自動翻訳)
  技術が、長足の進歩を遂げている。人工知能(AI)技術を
  採用したことで翻訳精度が向上、最新の翻訳システムを組み
  込んだ音声翻訳などの製品やサービスが、続々と登場してい
  る。通訳なしで外国人と相当なレベルのコミュニケーション
  ができる時代が確実に近づいている。
   ディスプレーに現れた外国人が英語でスピーチを始める。
  話を追いかけるように画面下に映画の字幕のような英文が表
  示され、その下にこれを翻訳した日本語の字幕が表れる。情
  報通信研究機構(NICT)が開発中の、「同時通訳システ
  ム」のプロトタイプ。会議などで将来、同時通訳の代わりに
  使うことを想定している。
   話者の英語の音声を認識して文章を書き起こすシステムと
  英語の文章を和訳するシステムを組み合わせた。「どのくら
  いの長さで切って翻訳するかで、使い勝手や翻訳の精度も変
  わる。今後5年くらいで完成したい」。NICTの隅田英一
  郎・先進的翻訳技術研究室長は説明する。NICTはこれに
  先立ち、富士通と共同で日本人医師と外国人の患者が、タブ
  レットをはさんで会話ができる医療向けの多言語音声翻訳シ
  ステムを開発した。医師が「体調が悪いのは、いつからです
  か」などと話しかけると、タブレットから翻訳された音声が
  流れ、患者の答えを日本語にして返してくれる。
                  https://bit.ly/2J572Da
  ───────────────────────────

エリック・シュミット元グーグルCEO.jpg
エリック・シュミット元グーグルCEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月01日

●「AIとウェブサイトの関係に迫る」(EJ第4776号)

 AI(人工知能)の歴史を簡単に振り返っています。初期のA
I(1950年代)は、コンピュータの能力に過度の期待を抱い
て失敗し、1度目の「AIの冬」に突入します。人間が何気なく
やっていることが、機械にとっては途方もなく難しいことである
ことがやっとわかったのです。
 ところが、時代とともに、コンピュータの性能が向上してくる
と、再びAIは復活します。論理(ロジック)のはっきりしてい
る分野に絞って、人間がその分野の専門家の知識をコンピュータ
に与えることによって「エキスパートシステム」を構築し、役立
てることはできないかと考えるようになります。1980年代の
「ルールベースのAI」です。この時期から、日本はAIに積極
的に参入するのです。
 しかし、肝心のことが大問題だったのです。それは、知識を機
械に与えることです。機械からみれば「知識の獲得」です。人間
の子供であれば、知識を自律的に学び取り、成長していきますが
コンピュータは自律的に学ぶことはできず、何から何まで人間が
コンピュータに知識を与えるしかなかったからです。
 それに、人間の持つ知識は想像以上に多く、しかも知識はどん
どん増えるので人間が与える知識には限界があります。かくして
エキスパートシステムという名の「ルールベースのAI」は破綻
し、AIは2度目の「AIの冬」に突入します。このとき、ほと
んどの人は「AIはこれでもう終わりだな」と思ったものです。
 次にUCLAのジュディア・パール氏が主導する統計確率的理
論を導入したAI手法が登場します。これは、エキスパートシス
テムの精度を向上させるのに貢献したことは確かです。しかし、
これも確率自体が「大数の法則」によって支配されるものであり
そういう肝心な大量のデータを欠いていることから、あくまで研
究レベルの状態に止まっていたのです。
 しかし、2000年代に入ると、ある「奇跡」が起きます。こ
れによってAIは息を吹き返すのです。この奇跡について、AI
に関する著作の多い小林雅一氏は次のように述べています。
─────────────────────────────
 それはまるで、神が仕組んだかのように絶好のタイミングでし
た。1990年代後半から2000年代にかけて、インターネッ
ト、もっと具体的には、その上に構築されたワールド・ワイド・
ウェブ上に世界中の人たちが情報を載せるようになりました。こ
の結果、様々な文書を中心とする大量のデータが蓄積され、しか
も誰もが自由にアクセスできるようになりました。つまり統計・
確率的なべイジアン・ネットワークを実践するお膳立てが整った
のです。                  ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 ネット上には、AIとインターネットの関係について述べてい
る論文やレポートはほとんどありませんが、小林雅一氏のいう通
り、昨今のAIの驚くべき発展は、インターネットと無関係では
ないと思います。
 この世界中に張り巡らされたインターネットというインフラの
上に築かれた膨大な数のウェブサイトは、日々更新され、サイト
の数は増えつつあります。世界中のウェブサイトの数は、どのく
らいあるのでしょうか。
 諸説がありますが、ウェブサイトとしては約3億サイトぐらい
であり、ページ(URL)という単位で見ると、グーグルによる
と次の通りです。グーグルは、ロボットを使ってウェブページを
探しているので、その数は正確であると思われます。
─────────────────────────────
           1,000,000,000,000
          ゼロが12個で1兆
                  https://bit.ly/2ststCw
─────────────────────────────
 エキスパートシステムに代表される「ルールベースのAI」に
関わった人たちにとって、コンピュータが知識を獲得するとき不
可欠な「知識ベース」の構築は非常に困難な作業であるうえ、ま
してその内容の頻繁な更新は不可能です。
 しかし、ウェブサイトは、日々更新され、記述されている内容
は、あらゆる分野に及んでおり、その数も増えています。しかも
サイトの情報は、コンピュータが読める知識ベースになっている
のです。もちろん、ウェブサイトの情報が正しいとは限りません
が、サイトの内容の正誤については、現在のコンピュータで十分
判断できます。
 現在のAIは、自然言語処理の能力が大幅に向上しています。
スマホで次のように音声で話しかけてみてください。
─────────────────────────────
    近くに雰囲気の良いレストランはありませんか
─────────────────────────────
 そうすると、スマホはGPSによって現在地を確認し、ウェブ
サイトで近くのレストランを検索して、現在地に近いレストラン
を複数探し出し、その店のウェブサイトをスマホに表示してくれ
ます。こんなことは、ごく当たり前のように多くの人がやってい
ますが、これはとんでもなく凄いことをやっているのです。
 現在では、ほとんどのレストランは、ウェブサイトを出してい
ます。これがすべての大前提です。それに、すべてのスマホには
GPSが搭載されており、スマホの現在地をつねに把握していま
す。これらのことがすべて揃わないと、上記のような検索はでき
ないのです。ウェブサイトの存在がいかに重要であるかがわかる
と思います。
 このように、3億を超えるウェブサイトが、現在のAIを支え
ています。そしてこれがAIの「機械学習」に結び付くことにな
るのです。ウェブサイトの出現は、AI開発者にとってまさに奇
跡です。      ──[次世代テクノロジー論U/020]

≪画像および関連情報≫
 ●AIの原点を探る/青山学院大学美添教授
  ───────────────────────────
  ――具体的にはどういうことでしょうか。
  A:ベイズ統計にもいろいろありますが、いずれも、解析に
  「主観確率」(判断確率)という概念を採用しています。古
  典統計学では、未知でも確率は固定・客観的数値です。ベイ
  ズ統計では、確率は意思決定者の持つ情報を反映して変化す
  ることがあります。
  ――確率を後から恣意的に変えられ、それがAI機械学習の
  基礎原理になっている?
  A:恣意的に確率を変更するというのは、ベイズ統計の誤解
  されやすい部分です。ベイズ流に厳密に構成された主観確率
  は、人間は合理的判断をするという原理(公理体系)に基づ
  いた理論で、不確実性に直面しても「自分の効用関数を最大
  化するように意思決定を行う」というものです。当然、人に
  よって効用関数は異なります。しかし効用が最大になるよう
  に意思決定を行うという結論が導かれます。これが、ベイズ
  統計の原理です。そして、これが重要ですが、意思決定の根
  拠情報が追加的に与えられれば、それにより、主観確率は合
  理的手順で修正されます。この手順が「ベイズの公式」と呼
  ばれる形式です(解説参照)。
  ――機械学習の基礎になるということですね。
  A:大雑把にいえばそうで、機械学習では、ベイズの定理を
  利用して判断を修正します。ただし原理的なベイズ統計には
  あまり関心はなく、経験的に有効だから利用するようです。
  ハーバード時代の私の恩師たちが聞いたら、嘆くと思います
  ね。               https://bit.ly/2J3YZC
  ───────────────────────────

小林雅一氏.jpg
小林雅一氏
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月31日

●「ベイズ統計学のAIへの応用研究」(EJ第4775号)

 2度目の「AIの冬」に突入しても、地道にAIの研究を続け
ている学者はいたのです。その一人にジュディア・パールという
イスラエル系アメリカ人の学者がいます。彼が米カルフォルニア
大学ロサンゼルス校(UCLA)にいたとき、あることに気がつ
きます。それは「人間の無知」です。
─────────────────────────────
 パール氏はAI研究に着手する際、現実世界における「人間の
無知」に着目しました。私達人間は日頃、いろんな事を知ってい
るようで、実際は広い世界に生起する様々な出来事をほとんど知
りません。こうした無知ゆえに、私達は論理に頼るだけで正解に
辿り着くことは稀です。なぜなら論理的な判断を下すための証拠
(確実な知識)が揃っていない場合が多いからです。
 パール氏は、1980年代までのAIが行き詰まってしまった
理由も、そこにあるのではないかと気づきました。ともすれば確
実な知識に欠ける現実世界を、論理的なルールだけで強引に説明
しようとしたことが間違っていたのです。   ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 ジュディア・パール氏は、論理的推論だけでなく、AIに統計
確率的考え方を導入できないかと考えたのです。なぜなら、現実
の世の中は、さまざまな要素の入り混じった一種の情報のカオス
状態になっており、きちんとしたルールに支配されているわけで
はないからです。
 それも普通の統計学ではなく、18世紀に「異端の統計学」と
いわれ、弾圧まで行われたというトーマス・ベイズ開発の「ベイ
ズ統計学」の考え方を導入しようとしたのです。これについては
2013年10月に次の書籍も出版されています。
─────────────────────────────
      シャロン・バーチェ・マグレイン著
      『異端の統計学ベイズ』/草思社刊
─────────────────────────────
 「ベイズ統計学」とは、どういう統計学でしょうか。ごく簡単
な例で考えてみます。
 コインを投げて、表が出るか裏が出るかの確率は50%です。
しかし、この50%という確率は、コインを何万回、何十万回、
何百万回も投げたときの確率です。こういう確率を「客観確率」
といいます。普通確率というときはこれを指します。
 たまたま5回コインを投げたとき、表が4、裏が1だったとし
ます。しかし、5回のトライでは少ないので、100回投げてみ
たのです。その結果、75回表が出たとします。75%が表が出
る確率です。投げ方やコインにもよると思いますが、この場合は
「このコインは表が出やすい」という経験的確信を持つにいたっ
たことを意味します。この確率を「主観確率」といいます。
 世の中には経験的に知られている確率というものがあります。
営業における飛び込み訪問で、10件のうち1件は、当たりの良
い家が見つかるというようにです。これが「主観確率」です。こ
ういう確率は現実世界では役に立つのです。しかしあくまで主観
で決めた確率ですから、新しい事実が起きると、それにしたがっ
て確率を修正していきます。
 このベイズ理論について、小林雅一氏は、歯科医の診察を例に
とって、次のようにわかりやすく説明しています。
─────────────────────────────
 これを何かに喩えるとすれば、歯科医の仕事です。患者から、
「歯痛」などの症状を聞いた歯科医は、「ああ、きっと右下5番
の虫歯だろう」と当たりをつけます。これが主観確率(仮定)で
す。この仮定に基づいて、歯科医はその辺りをミラーや探り針で
チェックしていきます。
 しかし、最初、歯痛の原因と見ていた5番の歯に異常は見られ
ません。むしろ、その近くの6番に何やら怪しげな影が見つかり
ました。歯科医は「これが、本当の原因かもしれない」と考え直
します。つまり最初、適当に決めた確率(仮定)が観測によって
より正確な確率へと改良されたのです。これが、まさにベイズ理
論の考え方です。それは人問の行動様式や考え方に、非常にマッ
チした確率理論なのです。    ──小林雅一著の前掲書より
─────────────────────────────
 このベイズ理論は、近年ではスパムメール(迷惑メール)を的
確に排除するアルゴリズムや、AIの応用的研究に使われていま
す。Gメールでは、メールボックスに「迷惑メールボックス」と
いうスパムメールを自動的に振り分け、保存してくれるボックス
があります。このスパムメールかそうでないか、を判断するのに
「ベイジアンフィルタ」というものが使われています。「ベイジ
アンフィルタ」は、あらかじめ機械学習によって単語に点数をつ
けておき、対象となるメールに対して、スパムである事後確率と
スパムでない事後確率を計算して、より確率の高い方に振り分け
る仕組みになっています。事後確率とは、客観確率のことです。
 そもそも確率というものは「大数の法則」に支配されるもので
す。したがって、ベイズ理論が本当の意味で実用化されるために
は、大量のデータが不可欠になります。1980年代後半のこと
であり、そういう環境は望むべくもなかったのです。
 そのため、ジュディア・パール氏の開発したベイズ理論を利用
する画期的なAIの手法は、アカデミックな研究のレベルにとど
まっていたのです。
 このベイズ理論を応用するAI研究は、2回目の「AIの冬」
の期間であったにもかかわらず、ジュディア・パール氏が所属す
るUCLA、スタンフォード大学をはじめとする米国西海岸の名
門大学の若手研究者たちの手によって、磨きをかけられていった
のです。そして、これらの若手の人材が1990年代のインター
ネットブームに乗って、グーグルのなどの先進企業に次々と入社
することになります。──[次世代テクノロジー論U/019]

≪画像および関連情報≫
 ●グーグル、インテル、MSが注目するベイズ理論
  ───────────────────────────
   今日のコンピュータ界をリードする権威ある数学者の1人
  であるトーマス・ベイズは、他の数学者と一線を画する。ベ
  イズは神の存在を方程式で説明できると主張した人物だ。そ
  んな彼の最も重要な論文を出版したのはベイズ本人ではなく
  他人であり、また、彼は241年前に亡くなっている。とこ
  ろが、なんとこの18世紀の聖職者が提唱した確率理論が、
  アプリケーション開発の数学的基礎の主要な部分を占めるよ
  うになっているのだ。
   サーチエンジン超大手のグーグルと情報検索ツールを販売
  するAutonomy の両社もベイズの原理を採用し、百発百中で
  はないにしろ高い確率で適当なデータを探し当てる検索サー
  ビスを提供している。様々な分野の研究者も、特定の症状と
  病気の関連付けや個人用ロボットの創造、過去のデータや経
  験に基づく指示に沿って行動し「考える」ことができる人工
  知能デバイスの開発などにベイズモデルを使っている。
   また、マイクロソフトも積極的にベイズモデルを支持して
  いる。同社は確率論(または確率論的原則)に基づく考えを
  同社のNotification Platform に採用している。このテクノ
  ノロジーは将来的に同社のソフトウェアに組み込まれる予定
  で、それによりコンピュータや携帯電話がメッセージや会議
  予定に自動フィルタをかけたり、コンピュータなどの持ち主
  が他人と連絡を取りあうための最善策を考えたりすることが
  できるようになる。       https://bit.ly/2kvAOCc
  ───────────────────────────

トーマス・ベイズ/ベイズ理論.jpg
トーマス・ベイズ/ベイズ理論
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月30日

●「専門家の知識の獲得は困難である」(EJ第4774号)

 「コンピュータが人間のように見たり、聞いたり、翻訳したり
する技術」の開発を目指した日本の第5世代コンピュータ開発計
画は、1982年に始まり、10年後の1992年に幕を閉じま
した。AI開発関係者にとって、これ以上の研究は無理であると
感ずるにいたったからです。
 日本だけでなく、1980年代の後半には、AIを研究してい
た多くの科学者たちは、いわゆるエキスパートシステムの有効性
に疑問を持つにいたり、これまでのAIの研究の努力が失敗に終
わったことを実感していました。そもそも「人間の知能をシミュ
レートする」ということが、いかに困難なことであるか分かって
きたからです。
 これによって、AI研究への資金と人材の供給は途絶え、再び
長い停滞期に突入します。これが2度目になる「AIの冬」とい
われる停滞期間です。私自身も当時、明治生命情報システム部に
おいてAIを担当し、「生命保険プランエキスパートシステム」
を構築するなど、AIの実用化に努力したのですが、AIブーム
自体が失速し、残念な結果に終っています。しかし、挑戦したこ
とは、まったく無駄ではなかったと思っています。いろいろなこ
とがわかったからです。
 しかし、これによって、「ルールベースのAI」の時代は終っ
たといえます。当時エキスパートシステムは「知識工学」といわ
れ、次の3つの要素から成り立っていました。
─────────────────────────────
   1.知識の獲得 ・・・ 専門家の知識を獲得する
   2.知識の表現 ・・・ 知識ベースの入力をする
   3.知識の利用 ・・・ 知識を利用して推論する
─────────────────────────────
 エキスパートシステムは、これら3つの要素がすべてクリアさ
れて、はじめて実現されます。1〜3の要素について簡単にいう
と、こうなります。
 専門家からの聞き取りによって、知識を獲得し、それらの知識
を「知識ベース」にストックします。これが「1」の「知識の獲
得」です。そのうえで知識ベースをコンピュータが読めるように
形式化するのが「2」の「知識の表現」です。知識がコンピュー
タが読めるかたちで、知識ベースにストックされると、それを利
用して、問題を解決する推論を行います。これが「3」の「知識
の利用」です。
 3つの要素のうち、一番進化を遂げたのは「3」の「知識の利
用」です。これは知識ベースから情報を読み取り、問題を解決す
る部分です。さまざまな推論エンジンが開発され、精度が大幅に
向上していたからです。
 続いて「2」の「知識の表現」が進化しています。この部分は
知識をコンピュータが読めるようにすることです。これについて
は、プロダクションルール、フレーム、ブラックボートなど、さ
まざまな形式が案出されています。
 ところが、肝心の「1」の「知識の獲得」には重大な問題があ
ります。エキスパートシステムは、専門家から知識の聞き取りを
し、それをベースにして知識ベースを構築するのですが、肝心の
知識の聞き取りが困難なのです。チェスや将棋や碁のように限ら
れた世界で、ルールが明確になっている分野は別として、現実の
世界において、知識の獲得はきわめて困難といえます。
 ところで、「知識」とは何でしょうか。
 このように質問されて、「知識とは〇〇である」と即答できる
人は少ないと思います。ネット上には、知識についてさまざまな
説明があります。そのひとつを取り上げます。
─────────────────────────────
 知識とは、情報を分析して、問題解決に役立つように体系化
 したものである。        https://bit.ly/2ktsWkB
─────────────────────────────
 「〜について知識がある」というが、それでは「その知識につ
いて話してくれ」といわれた場合、あまりにも漠然としているの
で、困るのではないでしょうか。当時、専門家から知識を聞き取
るエンジニアのことを「KE/ナレッジ・エンジニア」といって
いましたが、実際には、KEでもその聞き取りは困難を極めたも
のと思われます。
 人間が何かを解決するためのベースになるものは、その人間が
経験したり、勉強したり、本を読んだり、他の人から聞いたりし
て、頭のなかにストックされたものの総体であって、何がベース
になっているか話せといわれても答えられないと思います。知識
とはそういうものです。
 こうした「知識」というものについて、人工知能研究者の立場
から論じた論文「知識の姿/人工知能研究者の立場から」を執筆
されている東京大学の堀浩一氏は、知識について次のように述べ
ています。
─────────────────────────────
 人工知能研究者の立場から知識を追い求めてきたが、求めれば
求めるほど、知識は遠ざかっていく。一体、知識というのは何物
なのだろうか。(中略)
 筆者は、知識とは何かということについてどれだけの考え方が
あるのかよく知らないが、伝統的な知識観というのは、「万人に
共有可能な,言語化された情報あるいは整理された体系としての
知識」ではないだろうか。人工知能研究者が人工知能を作ろうと
奮闘してわかったことは、そんな「知識」はどこにもない、とい
うことである。たとえば化学用のエキスパートシステムを化学者
と共同で作ろうとして、化学に関する知識を化学者から聞き出そ
うとしても、「いやー,わからないから研究しているわけでして
・・」という答が返ってくるのが落ちである。
                  https://bit.ly/2sc3y74
─────────────────────────────
          ──[次世代テクノロジー論U/018]

≪画像および関連情報≫
 ●なぜ人工知能ビジネスは2回も失敗したのか
  ───────────────────────────
   当時、世界的には「エキスパートシステム」という、現場
  のいろんな経験値を「If Then(イフ・ゼン)」 の形で表現
  してやろうというものがあった。「観測されるデータがこう
  だったらこう判断しよう」というもの。センサーレベルの条
  件からもっと概念が育ったら、こういうことも考える必要が
  あるよねというふうに意思決定レベルで使う。そういうのを
  すべて「If Then」で書き下そうとした。
   全世界で5000、日本だけでも1000のエキスパート
  システムが作られた。欧州で1000、米国がいちばん多く
  て3000。産業界はエキスパートシステムブームで、先の
  世界一速い推論コンピューターもこの流れで生まれた。
   たとえば、献立支援のエキスパートシステムというのを作
  ったことがある。冷蔵庫に入っている食材などを入れて「お
  まかせでOK」というボタンを押すと、適したレシピがズラ
  リと出てくる。主菜と副菜と付けあわせである条件がそろっ
  たらあるタイプとか。あとは個人情報で、嫌いな食材やアレ
  ルギー物質を省いたりとか、冷蔵庫に入っている野菜を使お
  うとか。そういったルールを3つ4つ適用した結果、候補が
  ズラズラ出てくる。またダイキン工業と連携してエアコンの
  故障診断を作ったりもした。電力会社で変電所の点検をする
  とき、停電が起こらないようにするため、どういう順番で点
  検をすると電力の信頼性がキープできながら電源作業ができ
  るか考えたりね。あとは野村総研と株の予想システムも作っ
  た。チャートのパターンを学習させるシステムを10種類く
  らい作ったり。         https://bit.ly/2L194Rj
  ───────────────────────────

ESシェルのメカニズム.jpg
ESシェルのメカニズム
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月29日

●「日の丸PTはどうして失敗するか」(EJ第4773号)

 第5世代コンピュータ開発計画──いわゆるICT面において
巨額の予算を注ぎ込んだ「日の丸プロジェクト」でしたが、失敗
に終っています。実はそれ以外にも日の丸プロジェクトはたくさ
んあるのですが、ほとんどは失敗に終っています。
─────────────────────────────
        開始年 所管官庁    予算     成果
VLSI   1976  通産省 740億円     成功
ス−パーコン 1981  通産省 180億円  一部商品化
第5世代コン 1982  通産省 540億円  商品化失敗
ハイビジョン 1983  郵政省   NHK 試験放送のみ
キャプテン  1984  郵政省   NTT サービス停止
トロン    1984  通産省    不明     失敗
シグマ計画  1985  通産省 250億円     失敗
                  https://bit.ly/2J7Rs8O
─────────────────────────────
 上表は、RIETI(独立行政法人経済産業研究所)のサイト
の池田信夫上席研究員の論文に出ているものです。1970年以
降のプロジェクトをピックアップしたものですが、1976年の
VLSI(大規模集積回路)プロジェクトだけは何とか成功して
いるものの、他のプロジェクトのほとんどは、巨額の予算を使い
ながら、失敗に終っています。そのほとんどは、通産省(現経済
産業省)であり、同省には猛省してもらう必要があります。
 なぜ、失敗するのかというと、国際標準を無視して「日本発」
の標準にこだわり、結果として失敗しています。一種のナショナ
リズムといえます。坂村健氏による「トロン計画」にしても、後
の携帯電話の分野にしても、独自の進化を遂げたものの、いずれ
も日本のローカル規格に終っています。日本発の技術が「ガラパ
ゴス」といわれるゆえんです。
 ところで、「シグマ計画」とは何でしょうか。
 この計画の存在はほとんど知られていません。業界では、この
「シグマ計画」を口にするのはタブーとされ、語り継がれていな
いからです。そのため何も残っていないのです。
 1984年のことです。次の報告書が産業構造審議会から提出
されたのです。
─────────────────────────────
 1990年に60万人のソフトウェア開発技術者が不足する
                ──産業構造審議会の答申
─────────────────────────────
 これを受けて通産省は、これを克服するにはソフトウェア開発
を効率化しなければならないとして、ソフトウェア部品を参加企
業で共通化し、それを企業間で共有しようとしたのです。具体的
には、日本語で使えるUNIXツールの標準規格をつくろうとい
う計画だったのです。
 計画の考え方そのものは間違っていなかったものの、このプロ
ジェクトは、5年の年月と250億円の予算を費やし、ほとんど
何の成果も上げられずに失敗しています。それに、本来はソフト
ウェアのプロジェクトであったにもかかわらず、主要な参加企業
がハードウェア・メーカーであったため、予算の大部分は、ハー
ドウェアに注ぎ込まれ、またしてもハードウェア中心のプロジェ
クトに変質してしまったのです。その結果、この計画の成果につ
いて、次のようにいわれたものです。
─────────────────────────────
 1990年のシグマ計画は「60万人の開発技術者が不足す
 る」ことではじめられたが、結果として60万人の無能なソ
 フトウェア開発技術者の余剰を生み出している。
─────────────────────────────
 実は通信省のこのシグマ計画の失敗は隠蔽されたようです。当
時、通産省のような有力な省庁が、国家プロジェクトの失敗を隠
蔽するなどは考えられませんでしたが、今にして思えば、省庁の
省庁といわれる財務省が、文書の隠蔽、改ざん、業者との口裏合
わせなど、何でもありの状態ですから、当時、失敗隠しがあって
も何もおかしくないのです。
 シグマ計画は、プロジェクト終了後、株式会社シグマシステム
という企業に業務が移され、最近になって消滅しています。しか
し、『日経コンピュータ』は、1990年2月12日号で、シグ
マ計画の失敗について、「シグマ計画の総決算/250億円と5
年をかけた国家プロジェクト」という特集を組んで、詳しく報道
しています。誠に勇気ある報道であるといえます。
 こうした日の丸プロジェクトの相次ぐ失敗の原因について、池
田信夫氏は次のようにコメントしています。
─────────────────────────────
 このように「日本発」にこだわるプロジェクトが失敗する第1
の原因は、供給側の都合で作られ、消費者の視点が欠けているこ
とである。消費者にとっては、日本発なんてどうでもよい。どこ
発だろうと、いい標準は多数派になるし、使いにくい規格は生き
残れない。特にインターネットの標準はオープン・スタンダード
だから、特定の国が主導権を握ることはできない。たとえば、リ
ナックスの開発者はフィンランド人だが、それを「フィンランド
発の国際標準」とよぶ人はいないし、フィンランドが優位に立っ
ているわけでもない。
 第2の原因は、グローバルな市場が見えていないことである。
「パソコンは米国主導だから、情報家電は日本の独自規格で対抗
しよう」などという発想で、世界の消費者に通用しない「日の丸
規格」を作っても、キャプテンやハイビジョンのように、結局は
ビジネスとしても生き残れない。昔はパソコンのPC−9800
のようなローカル標準もあったが、グローバルな技術・価格競争
のきびしい現在のIT業界では、もう日本だけの標準というもの
が成立しないのである。       https://bit.ly/2J7Rs8O
─────────────────────────────
          ──[次世代テクノロジー論U/017]

≪画像および関連情報≫
 ●国策半導体の失敗、負け続けた20年の歴史
  ───────────────────────────
   実際、各国とも自国産業を陰になり日向になり支援してい
  る。サムスンが韓国政府と緊密なことは言うに及ばず、SK
  ハイニックスは01年の経営破綻時に韓国政府系金融機関の
  支援で再建された。マイクロン・テクノロジーにはメモリ技
  術を米国に残したい米国政府の意向が働いていると見るのが
  業界では当たり前。しかし、日本政府による半導体業界への
  支援策はことごとく裏目に出ている。それはなぜなのか。
   半導体摩擦のほとぼりが冷めた00年以降、日本でも再び
  国と企業が一体となって開発を進める国家プロジェクトが乱
  立し始めた。たとえば01年の「あすかプロジェクト」には
  国費200億円が、同年の「HALCAプロジェクト」には
  80億円が投じられた。いずれも半導体の製造プロセス開発
  が目的で、メーカー複数社が参画したが、はかばかしい成果
  は得られなかった。
   政府関係者が解説する。「企業は本命の技術は自社で開発
  する。国家プロジェクトには、成功するか微妙な2〜3番目
  の技術と、二軍レベルの技術者が送り込まれていた」。やは
  り01年の「先端SoC基盤技術開発(ASPLA)」は国
  費315億円を投入し、バラバラだった各社の製造プロセス
  の共通化を目指した。この旗振り役を務めたのが冒頭の福田
  氏で、最先端の巨大な日の丸ファンドリー工場を建設し、各
  社の半導体を受託製造すれば、世界最大ファンドリーの台湾
  TSMCに勝てると参加企業に呼びかけた。
                  https://bit.ly/2kpMvu0
  ───────────────────────────

経済評論家/池田信夫氏.jpg
経済評論家/池田信夫氏
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月28日

●「第5世代コンピュータ開発の目的」(EJ第4772号)

 1980年代における日本の「第5世代コンピュータ」は失敗
に終っています。10年間と570億円を投入したプロジェクト
でしたが、通産省(当時)が掲げた目標には、まったく達してい
なかったからです。
 しかし、この第5世代コンピュータプロジェクトは、その後の
日本のICTに大きな影響を及ぼしており、少し詳しく分析して
みる価値があると思います。
 このプロジェクトを運営するのは「新世代コンピュータ開発機
構(ICOT)」であり、このプロジェクトの目的は「人間のよ
うに考えるコンピュータ」です。具体的には、次のようなことが
できるコンピュータの開発を目指したのです。
─────────────────────────────
      1.コンピュータに「目」を持たせる
      2.人間の話す言葉を理解し聞き取る
─────────────────────────────
 「1」は、コンピュータに目を持たせ、人間のように対象物を
見ることができるようにすることです。これを「コンピュータビ
ジョン」といいます。そうすれば、モノを掴んだり、移動させた
り、障害物を避けたりできます。これは、ロボットの技術に応用
することができる技術です。
 「2」は、コンピュータに人間の話す言葉を聞き取らせ、文字
にして表示する「音声認識」や、外国語を自動的に日本語に翻訳
する「機械翻訳」を可能にしようという、きわめて野心的なプロ
ジェクトといえます。
 現在のAI(人工知能)なら、いずれも既にクリアしている技
術ですが、当時としては、きわめてハードルの高い野心的な目標
でした。開発者側のICOTとしては、少しハードルが高くても
世間の耳目を集める目標を掲げて、企業からの技術者の派遣や資
金の拠出を求めようとしたのです。
 しかし、このプロジェクトは、5年が経過した時点で、それら
の野心的な目標のほとんどの達成が困難になったのです。それは
技術的にきわめてハードルが高かったことに加えて、日本政府の
財政が悪化したこともあり、通産省としては、当初予定していた
予算を大幅にカットせざるを得なかったからです。
 しかし、ICOTとしては、「人間のように考えるコンピュー
タ」そのものは完成しているとして、次のようにその実績を強調
しています。
─────────────────────────────
 コンピュータ・ビジョンや音声認識、あるいは機械翻訳などは
どちらかというと、周辺的な技術であって、目標から削除しても
大勢に影響はない。そんなことよりも「人間のように考える」と
いうプロジェクトの中核はちゃんと残されている。
                      ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 このICOTの発言を聞くと、ハードウェア中心の発想であっ
て、基本的には、音声認識、機械翻訳などのソフトウェア的技術
を軽く見ているところがあります。この傾向は、現在も日本の技
術の考え方に根強く残っているのです。その証拠に、日本には、
日立、東芝、NEC、ソニーなど著名な製造業はたくさんありま
すが、米国のアップルやマイクロソフトなどに匹するソフトウェ
ア企業は一社もありません。
 第5世代コンピュータ・プロジェクトは、1992年に幕を閉
じましたが、何の成果もなかったわけでなく、高コストではある
ものの、日本独自の「プロログ」という論理型言語で動く「並列
推論型コンピュータ」を完成させているのです。しかし、このマ
シンで動くソフトウェアは何もなかったのです。これについて、
あのファイゲンバウム氏は、次のようにコメントしています。
─────────────────────────────
 第5世代は、一般市場向けの応用がなく、失敗に終わった。金
をかけてパーティーを開いたが、客が誰も来なかったようなもの
で、日本のメーカーはこのプロジェクトを受け入れなかった。技
術面では本当に成功したのに、画期的な応用を創造しなかったか
らである。           ──ファイゲンバウムの談話
─────────────────────────────
 本来であれば、このプロジェクトに参加した企業が、プロログ
で動作するソフトウェアの開発に注力すべきであったのですが、
既に当時は、高コストの大型コンピュータの時代ではなく、PC
の時代に移りつつあったのです。これについて、評論家の池田信
夫氏は、次の指摘をしています。
─────────────────────────────
 こうしたプロジェクトの最大の問題はそれが失敗したことでは
なく、業界全体をミスリードしたことだ。1980年代はIBM
に代表される大型コンピュータの時代が終わり、パソコンが急速
に成長した時代だった。ところが、通産省が「大型機の次に来る
のはAIだ」という方針を決めて、業界を「指導」した結果、日
本のコンピュータは大型機から脱却できす、時代遅れになってし
まった。パソコンは、NECのPC−9800を初めとするロー
カル標準で、世界には売れないため、日本のコンピュータ業界は
90年代には世界市場から取り残されてしまった。
 この「失われた10年」の間に、台湾や韓国やシンガポールは
パソコンの生産基地として欧米メーカーに部品を大量に供給し、
「世界の工場」としての地位を確立した。これに対して日本は、
多くのメーカーが国内向けに多くの商品を少量生産していたため
規模で対抗できず、技術開発でも追いつけなくなり、かつては世
界最大の生産量を誇った半導体メモリーも没落してしまった。
                  https://bit.ly/2IJEPxz
─────────────────────────────
          ──[次世代テクノロジー論U/016]

≪画像および関連情報≫
 ●「日の丸プロジェクトの実態」/酒井寿紀氏
  ───────────────────────────
   経済産業省(および旧通商産業省)は日本のIT産業の振
  興のために国家プロジェクトをいくつも推進してきた。しか
  し、その成果は必ずしも芳しくない。1980年以降の代表
  的プロジェクトの実態を見てみよう。
   1982年から1994年にかけて、13年間に約570
  億円の国費を投じて第五世代コンピュータ・プロジェクトが
  推進された。このプロジェクトは、将来のコンピュータの重
  要な応用を人工知能の分野と考え、それに適したハードウェ
  アとソフトウェアを開発するものだった。そして、その公式
  な最終報告書には、「当初の期待に十分応え、日本のナショ
  ナルプロジェクトのモデルを示し得たと考えられる」と記さ
  れている。しかし、プロジェクトの成果がその後の日本のコ
  ンピュータ産業に大きく貢献することはなかった。
   スコット・キャロンという米国人がこのプロジェクトにつ
  いて調査し本を著している。この人にインタビューされた関
  係者は、あからさまに通産省を非難し、プロジェクトは時間
  の無駄だったと述べたという。日本では公に言えないことを
  米国人には言ったようだ。このプロジェクトの発足当時、第
  五世代コンピュータ調査研究委員会の委員長をされていた元
  岡達東京大学教授は、小生に、「メーカーに道楽をしてもら
  おうと思うのだが、メーカーの人はなかなか乗って来ない」
  と言った。当時のメーカーは道楽に付き合う余裕がなく、初
  めからプロジェクトに乗り気ではなかったのだ。
                  https://bit.ly/2kmhbwo
  ───────────────────────────

第5世代コンピュータ.jpg
第5世代コンピュータ
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月25日

●「人間のように考えるコンピュータ」(EJ第4771号)

 第1回「AIの冬」──1950年代に開始され、1970年
代で終息したAIブームです。終焉した原因は、天才によくある
「論理への過信」だったのです。
 このときのAIのレジェンドたちの楽観主義の言葉を以下に再
現しておきます。
─────────────────────────────
 ◎ジョン・マッカーシー
  考える機械は、今から約10年で完成できるはずである。
 ◎ハーバート・サイモン
  10年以内にデジタルコンピュータはチェスの世界チャンピ
  オンに勝つ。10年以内にデジタルコンピュータは新しい重
  要な数学の定理を発見し証明する。
 ◎マービン・ミンスキー
  一世代のうちに、人工知能を生み出す問題のほとんどは解決
  されるだろう。3年から8年の間に、平均的な人間の一般的
  知能を備えた機械が登場するだろう。
        ──ウィキペディア/https://bit.ly/2ki20V6
─────────────────────────────
 しかし、いったん終息したAIブームは、1980年代には復
活を果します。第2次AIブームの到来です。第1次ブームのと
きは日本は参加していませんが、第2次AIブームから日本が参
加します。それも積極的に参加したのです。このとき、私はマー
ケティングを担当する部署から情報システム部に異動になり、そ
のAIを担当することになったのです。
 第2次AIブームの中心は「エキスパートシステム」です。各
界の専門家(エキスパート)が持っている豊富な知識やノウハウ
をコンピュータに移植し、いわば専門家の分身をたくさん作り、
世の中の役に立てようというプロジェクトです。
 世界初のエキスパートシステムは 「デンドラル(Dendral)」
といい、1965年にその開発が行われています。開発メンバー
には、「エキスパートシステムの父」ともいわれるエドワード・
ファイゲンバウムが含まれており、この「デンドラル」から派生
したものが「マイシン(Mycin)」です。
 マイシンは、細菌感染の診断をする医学分野で最初に成功を収
めたエキスパートシステムで、スタンフォード医学部でも調査に
よると約65%の正解率を誇っています。これは、専門医の診断
の80%の正解率には及ばないものの、少なくとも細菌感染の専
門家でない医師の診断よりは優秀な成績だったといえます。しか
し、マイシンは、実用システムとして導入されていません。シス
テムの誤診の責任問題を恐れたからです。
 このAIによるエキスパートシステムブームに日本政府は、積
極的に参画し、世界のAI研究をリードする一大国家プロジェク
ト「第5世代コンピュータ開発プロジェクト」を立ち上げたので
す。1982年のことです。当時の通商産業省(現経済産業省)
が主導のプロジェクトです。そのきっかけは、ファイゲンバウム
のマイシンに触発されたからといわれています。
 当時の通産省は、エキスパートシステムの精度のカギを握るの
はコンピュータの性能にあると考えたのです。そこで、そのコン
ピュータの能力を1段階上げようとしたのです。その時点でのコ
ンピュータは、次のように第4世代に達していたので、第5世代
としたわけです。
─────────────────────────────
      第1世代:真空管
      第2世代:トランジスタ
      第3世代:IC/集積回路
      第4世代:LSI/大規模集積回路
      第5世代:AIを実現するマシン
─────────────────────────────
 「AIを実現するマシン」とは何でしょうか。
 このマシンに関して、小林雅一氏は、著書で次のように解説し
ています。
─────────────────────────────
 これに対し第5世代コンピュータでは、基本的に数字ではなく
言語のようなシンボル(記号)を処理することを前提とし、しか
も人間と同じように一度に複数の仕事がやれること(並列処理)
を目指していました。たとえば患者を診断するときに、瞬時に幾
つもの病因(可能性)を思い浮かべる医師のようなエキスパート
・マシンです。これをプロジェクトの担当者たちは、「並列推論
型コンピュータ」と呼びました。つまり、それまでの4世代とは
全く異なる、画期的なアーキテクチャのAI型コンピュータを開
発しようとしたのです。           ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 これは、日本にとって凄いことです。コンピュータの開発で世
界をリードしようとしたからです。1980年代といえば、ソニ
ーのウォークマンなど、日本製の家電製品や自動車が世界市場を
席巻し、「ハイテク・ジャパン」のイメージが拡大していた時期
です。したがって、日本の第5世代コンピュータ開発宣言は、世
界中で注目されたのです。
 しかし、ここで重要なのは、当時挫折していた音声認識や機械
翻訳などのソフトウェア的技術の発展ではなく、「人間のように
考える」コンピュータ、すなわち、ハードウェアの開発を目指し
たことです。これは、現在になって考えると、大きな失敗だった
といえます。
 それでは「人間のように考える」コンピュータとは、具体的に
どのようなマシンを指すのでしょうか。それは、三段論法的推論
をベースとする「ルールベースのAI」そのもので、1960年
代のAIの黎明期の発想と同じだったのです。
          ──[次世代テクノロジー論U/015]

≪画像および関連情報≫
 ●「ルールベースアプローチ」とは何か
  ───────────────────────────
   専門家の知識やノウハウを人間がルールとして記述し、そ
  のルールに従ってコンピューターに処理させようというアプ
  ローチです。「エキスパートシステム」と呼ばれています。
  例えば、計測結果から化合物の種類を特定する、複雑なコン
  ピューターのハードウェアやソフトウェアの構成を過不足な
  く組み合わせるなど、特定の領域に限れば、実用で成果をあ
  げられるようになりました。しかし、そもそも人間の知って
  いることが多すぎることや、それをどう表現するか、また解
  釈や意味の多様性に対応することは容易なことではありませ
  ん。そして、「知識やルールを入れれば賢くなるが、知識を
  すべて書ききれない」という限界に行き当たり、この取り組
  みは下火となってしまいました。その後、この考えを業務シ
  ステムに応用しようという取り組みは続き、BRMS(ビジ
  ネス・ルール・マネジメント・システム)とし、いまもこの
  考え方は生き残っています。例えば、規則の組合せが複雑な
  保険審査や保険料の算定、あるいは、携帯電話の割引条件や
  料金算定など、ルール変更が頻繁な業務システムに使われて
  います。このようなアプリケーションは、処理ルールをプロ
  グラムにロジックとして埋め込んでしまうと、ルールが変更
  されるたびにプログラム修正をしなくてはなりませんので、
  大変手間がかかります。     https://bit.ly/2kivNwU
  ───────────────────────────
 
エドワード・ファイゲンハウム.jpg
エドワード・ファイゲンハウム
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月24日

●「論理への過度の過信が失敗の原因」(EJ第4770号)

 ジョン・マッカーシー、マービン・ミンスキー、ハーバート・
サイモン──いずれも当時の高名な学者ばかりですが、彼らは等
しくAI(人工知能)の発展について、きわめて楽観的な見通し
を立てていたのです。「10年もあれば、AIを構成する実質的
な問題は解決される」といった具合にです。
 彼らの計画によれば、少なくとも1970年頃にはメドがつい
ていたはずですが、2回の「AIの冬」を経て、AI発展の見通
しがついたのは、2000年を超えてからのことであり、10年
どころか、40年もかかったことになります。どこを間違えたの
でしょうか。
 それは、数学や自然科学者の天才たちの陥りがちな「論理への
過信」にあったといえます。彼らは、自ら論理的にものを考える
傾向があり、論理の積み重ねで、機械にある程度の「知性」を持
たせることはできると考えたのです。
 既出の小林雅一氏の著書を参考に、「機械翻訳」を例にとって
考えます。仮に日本語を英語に翻訳するとします。機械翻訳は、
基本的には人間の言葉を機械に読み取らせる自然言語処理の技術
のひとつです。「自然言語」というのは、人間が日常的に使って
いる言語であり、それをコンピュータに処理させるのです。初期
の機械翻訳は、文章を機械に読み取らせるのですが、それは次の
ステップによって逐次行われます。
─────────────────────────────
    @文章から単語を切り出す ・・ 単語解析
    A木構造を生成する    ・・ 構文分析
    B述語論理形式に変換する ・・ 意味分析
─────────────────────────────
 機械翻訳は、予めコンピュータの記憶装置に「辞書」と「構文
規則」のデータベースが用意されています。
 機械は、与えられた文章から単語を切り出し、バラバラにしま
す。これが第1段階の「単語解析」のステップです。続いて、機
械はデータベースを参照しながら、それらの文法的構造を明らか
にして、構文のシンタックスの木構造を生成します。これが第2
段階の「構文解析」のステップです。
 そのうえで、機械はその文章を述語論理形式に変換します。こ
れよって、機械が文章の内容を把握できる「中間言語」になりま
す。これが第3段階の「意味解析」のステップです。
 この後、コンピュータが内容を理解した中間言語を、これらの
3ステップとは逆方向に、「意味合成」→「構文合成」→「単語
合成」を経て、英語に翻訳が行われるのです。
 しかし、この方法では、ごく簡単な文章でないと、翻訳できな
いことがわかります。文章はそれほど論理的ではないからです。
例えば、次の文章の翻訳などは完全にお手上げです。
─────────────────────────────
  日本代表のサムライたちが無敵艦隊スペインに勝った。
                      ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 人間であれば、この文章は、サッカーの試合について述べてお
り、日本代表が強敵のスペインチームを破ったという意味である
ことはすぐわかります。しかし、当時の機械翻訳の技術レベルで
は、「刀を持った日本の侍が、スペインの軍艦に切りかかった」
などと訳しかねないのです。
 マッカーシー氏に代表される初期のAIの状況について、小林
雅一氏は、次のように述べています。
─────────────────────────────
 こうした事情から、初期のAI研究は何とかできる問題を幾つ
か解いた後、先の見えない袋小路に陥ってしまいました。197
3年には、英国の著名な数学者であるジェイムズ・ライトヒル卿
が、「AI研究は、その当初に約束したロボット工学や自然言語
処理などの領域において、なんら実質的な成果を上げていない」
と厳しく批判するレポートを公表しました。これを受けて、英国
や米国の政府は自由なAI研究への予算を全額停止してしまいま
した。手厳しい批判にさらされ、世間の理解とスポンサーを失っ
たAI研究は急速に衰退し、長い停滞期に入りました。
                ──小林雅一著の前掲書より
─────────────────────────────
 このジェイムズ・ライトヒル卿の「自然言語処理などの領域に
おいて、なんら実質的な成果を上げていない」という言葉にもあ
るように、初期のAIはほとんど成果を上げているとはいえませ
ん。これが第1回の「AIの冬」と呼ばれる期間です。1950
年代から1970年代の期間です。
 しかし、後世の人はこの期間を「AIの冬」といっていますが
当のマッカーシー氏やミンスキー氏らは、十分成果が出ていると
胸を張っていたのです。確かに、コンピュータは代数問題を解い
てみせ、幾何学の定理を証明してみせ、英会話をデモ的に学習し
てみせたりしており、これは当時の人々にとって十分「驚異的」
であったのです。
 それは、当時の人々には、コンピュータがそのような「知的」
な行動ができるとは全く信じていなかったので、その程度のこと
でも喝采してみせたのです。しかし、政府から予算を止められて
しまうと、それ以上の研究が進まなくなったことは確かです。
 この時代のAIは、推論と探索の時代であったといえます。例
えば、ネズミの脱出ゲームのようなルールとゴールが決められて
いるゲームにおいて、いかにしてゴールにたどり着くかという問
題が解かれたのです。チェスなどのゲームへのAIの投入もテー
マになったのです。しかし、これらは現実世界とはあまり関係の
ないスケールの小さい世界での話であり、実際には何の役に立つ
かはっきりしなかったので、資金が打ち切られ、研究が一時スト
ップしたのです。  ──[次世代テクノロジー論U/014]

≪画像および関連情報≫
 ●AIとは何か--コンピュータの歴史から紐解く人工知能
  ───────────────────────────
   今、情報科学において重要な技術のうちの1つとして「人
  工知能」(AI)が多くの場で議論されている。しかしなが
  ら、技術者でない一般的な観点で見た場合に、そもそも「人
  工知能」というものが一体何なのかが十分に理解できないよ
  うな議論を目にすることがあるのが現状である。
   この記事では、コンピュータの歴史を紐解くことにより、
  そもそも、人工知能というものが一体何で、ビジネスや社会
  とどう関わっていくのか解説したい。
   そもそも「人工知能」が何なのかについての明確な定義は
  存在しない。人工知能学会のウェブサイトでも、人工知能の
  定義そのものが「議論の余地がある」とされており、実際に
  人工知能研究自体に2つの立場があるとしている。「人間の
  知能そのものを持つ機械を作ろうとする立場」と「人間が知
  能を使って行うことを機械にさせようとする立場」である。
  (現在多くの企業が採用している人工知能は「機械学習」と
  呼ばれるものであり、後者の立場に位置づけられる。機械学
  習は、人間による知的作業のうちの「論理的な推論」を代替
  する技術であり、音声や画像、テキストなどのデータを事前
  に機械に学習させておくことによって、新しいデータを見た
  ときに、自動的に”推測”可能にするというものだ)
   ここで注目すべきなのは、いずれの立場に立った場合にお
  いても、「知能」とは何なのかについての定義が必要であり
  これについての定義は存在しないということである。
                  https://bit.ly/2IBVcvQ
  ───────────────────────────

マービン・ミンスキー.jpg
マービン・ミンスキー
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年05月23日

●「スプートニクショックとARPA」(EJ第4769号)


 インターネットの原型であるARPANETを開発した「AR
PA」とはどういう機関であるかを知る必要があります。それは
「スプートニク・ショック」に深く関係するのです。
 1957年にソ連は史上初の人工衛星「スプートニク」の打ち
上げに成功しています。1957年10月4日のことです。ソ連
はその1ヶ月後の11月3日にスプートニク2号の打ち上げにも
成功しています。2号は、生物を乗せることを想定して、気密室
を作っているので、1号に比べて6倍の508キログラムの重量
になっていたにもかかわらず成功しています。
 1958年2月3日のスプートニク3号は、失敗したものの、
1960年5月15日のスプートニク4号は成功、1960年8
月19日のスプートニク5号には、犬2頭、ネズミ40匹、ラッ
ト2匹、その他いろいろな植物も積んで、打ち上げに成功。翌日
に回収され、動物たちは無事に地球に帰還したのです。このよう
に、1957年から1960年にかけて、ソ連は次々とスプート
ニクを連続して打ち上げ、宇宙開発の成果を強調したのです。
 当然のことですが、これは米国にとって大ショックであり、そ
れは「スプートニク・ショック」といわれます。とくに軍事関係
者にとって衝撃的な出来事だったのです。当時のアイゼンハワー
大統領は、ニール・マケルロイ国防長官に命じて、国防総省内に
軍事研究を統括する機関を設置するよう指示します。
 しかし、これに軍は反発します。兵器開発の主導権を奪われる
のではないかと危惧したからです。核兵器の開発を進めていた原
子力委員会も核兵器は外すよう政府に申し入れます。多くの議論
があって、最終的に基礎研究を行う機関として、1958年にそ
の機関は国防総省内に設置されます。それがARPAです。当初
ARPAは、宇宙開発を手掛けるつもりだったといわれています
が、同年10月に国際宇宙局が設置され、その目論見は崩れ去っ
たのです。
 しかし、その結果、ARPAで開発されたのがARPANET
であり、それが後にインターネットに発展するのです。1972
年になって、ARPAは「DARPA(米国国防総省高等研究計
画局)」に改称されます。
 このように、1957年から1972年の15年間は、米国は
ソ連に対抗するため、膨大な軍事予算を使いまくったのです。と
にかく「ソ連に負けるな!」ということで、米国中が燃えていた
時期といえます。そのなかで、マッカーシー氏らのAIの研究に
も潤沢な予算が投入されたのです。
 スプートニク・ショックを受けた米国は、1958年にNAS
A(アメリカ航空宇宙局)を設立し、マーキュリー計画がスター
トします。この計画は、1958年から1963年にかけて実施
された有人宇宙飛行計画のことです。
 1961年1月20日、ジョン・F・ケネディ氏が大統領に就
任します。ケネディ大統領は、1000基のミニットマン・ミサ
イルをはじめ、当時ソ連が保有していたミサイルの数を上回る大
陸間弾道ミサイルを配備すると宣言しています。
 そして、1961年5月25日、ケネディ大統領は、上下両院
合同議会で、アポロ計画について演説し、10年以内(1971
年)に人間を月に着陸させ、安全に地球に帰還させることを宣言
する有名な演説を行います。以下はその演説の一部です。
─────────────────────────────
 私は、今後10年以内に人間を月に着陸させ、安全に地球に帰
還させるという目標達成にわが国民が取り組むべきと確信してい
ます。この期間の、この宇宙プロジェクト以上により強い印象を
人類に残すものは存在せず、長きにわたる宇宙探査史において、
より重要となるものも存在しないことでしょう。そして、このプ
ロジェクト以上に完遂に困難を伴い、費用を要するものもないで
しょう。         ──ジョン・F・ケネディ米大統領
                  https://bit.ly/2IACvIR
─────────────────────────────
 そして米国は目標の1971年以前の1969年7月16日、
アポロ11号が月面に着陸し、無事に地球に帰還させることに成
功します。これで米国は宇宙の覇者の地位を獲得したのです。
 話をAIに戻します。ジョン・マッカーシー氏は、ダートマス
会議以後の1963年、スタンフォード人工知能研究所(SAI
L)を設立し、そこに多くの若い研究者を集めて、次の目標を掲
げたのです。これも10年以内の目標です。
─────────────────────────────
     10年以内に実戦的なAI技術を作り上げる
                   ──SAIL
─────────────────────────────
 米国が総力でソ連と対抗していた1960年代、科学者にとっ
ては絶好の環境だったといえます。なぜなら、国防総省はAIの
基礎研究に大量の資金を拠出したからです。しかも、具体的な目
標や期限を課さなかったので、自由研究として何でもやれたので
す。これについてAIに詳しいKDDI総研リサーチ・フェロー
の小林雅一氏は、自著で次のように述べています。
─────────────────────────────
 彼ら初期の研究者たちは、誰もが一様に楽観的でした。たとえ
ば、マッカーシー氏は国防総省の研究機関であるDARPA(国
防高等研究計画局)に出した提案書の中で、「考える機械は、今
から約10年で完成できるはずだ」と予想しました。ミンスキー
氏も「今から10年もあれば、AIを構成する実質的な問題は解
決されるだろう」と述べました。サイモン氏に至っては「今から
20年以内に、人間がやれることは、すべて機械がやれるように
なるだろう」と公言するほどでした。     ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
          ──[次世代テクノロジー論U/013]

≪画像および関連情報≫
 ●世界を動かす軍事科学機関DARPA
  ───────────────────────────
   1962年10月16日、ソ連が密かに核ミサイルをキュ
  ーバに設置していることを発見したアメリカ大統領ケネディ
  は、ソ連首相フルシチョフにミサイルの撤去を迫り、拒否さ
  れた。この日からフルシチョフがミサイル撤去の決断を下す
  までの13日間ほどに、人類が核兵器による全面戦争に近づ
  いたことはない。キューバ危機で核ミサイルが攻撃に用いら
  れることはなかったが、実はこの危機の最中に核ミサイルは
  4発も爆発していた。その事実が、世間に知られることがな
  かったのは、この爆発が宇宙空間で行われていたからだ。
   4発中2発はアメリカによって、残りの2発はソ連によっ
  て行われた実験だった。わざわざ宇宙空間で核爆発させたの
  は、クリストフィロス効果を研究するため。1957年にソ
  連が打ち上げた人工衛星によるスプートニク・ショック以来
  アメリカはソ連のICBM(大陸間弾道ミサイル)から自国
  を守る方法を探し続けていた。そして、無名の科学者である
  ニコラス・クリストフィロスが考案した「大気圏のすぐ上の
  地球の磁場にある高エネルギー電子をとらえ、それによって
  生成されるアストロドームのような防御シールド」を作ると
  いうアイディアに行き着いた。クリストフィロス効果とは、
  電離層での数千発にも及ぶ核兵器の炸裂によるベータ粒子を
  地球の磁場に注入し、そこを通過しようとする物体に障害を
  引き起こすというものだった。  https://bit.ly/2ICECjt
  ───────────────────────────

ジョン・マッカーシー.jpg
ジョン・マッカーシー
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
RDF Site Summary