2018年06月01日

●「AIとウェブサイトの関係に迫る」(EJ第4776号)

 AI(人工知能)の歴史を簡単に振り返っています。初期のA
I(1950年代)は、コンピュータの能力に過度の期待を抱い
て失敗し、1度目の「AIの冬」に突入します。人間が何気なく
やっていることが、機械にとっては途方もなく難しいことである
ことがやっとわかったのです。
 ところが、時代とともに、コンピュータの性能が向上してくる
と、再びAIは復活します。論理(ロジック)のはっきりしてい
る分野に絞って、人間がその分野の専門家の知識をコンピュータ
に与えることによって「エキスパートシステム」を構築し、役立
てることはできないかと考えるようになります。1980年代の
「ルールベースのAI」です。この時期から、日本はAIに積極
的に参入するのです。
 しかし、肝心のことが大問題だったのです。それは、知識を機
械に与えることです。機械からみれば「知識の獲得」です。人間
の子供であれば、知識を自律的に学び取り、成長していきますが
コンピュータは自律的に学ぶことはできず、何から何まで人間が
コンピュータに知識を与えるしかなかったからです。
 それに、人間の持つ知識は想像以上に多く、しかも知識はどん
どん増えるので人間が与える知識には限界があります。かくして
エキスパートシステムという名の「ルールベースのAI」は破綻
し、AIは2度目の「AIの冬」に突入します。このとき、ほと
んどの人は「AIはこれでもう終わりだな」と思ったものです。
 次にUCLAのジュディア・パール氏が主導する統計確率的理
論を導入したAI手法が登場します。これは、エキスパートシス
テムの精度を向上させるのに貢献したことは確かです。しかし、
これも確率自体が「大数の法則」によって支配されるものであり
そういう肝心な大量のデータを欠いていることから、あくまで研
究レベルの状態に止まっていたのです。
 しかし、2000年代に入ると、ある「奇跡」が起きます。こ
れによってAIは息を吹き返すのです。この奇跡について、AI
に関する著作の多い小林雅一氏は次のように述べています。
─────────────────────────────
 それはまるで、神が仕組んだかのように絶好のタイミングでし
た。1990年代後半から2000年代にかけて、インターネッ
ト、もっと具体的には、その上に構築されたワールド・ワイド・
ウェブ上に世界中の人たちが情報を載せるようになりました。こ
の結果、様々な文書を中心とする大量のデータが蓄積され、しか
も誰もが自由にアクセスできるようになりました。つまり統計・
確率的なべイジアン・ネットワークを実践するお膳立てが整った
のです。                  ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 ネット上には、AIとインターネットの関係について述べてい
る論文やレポートはほとんどありませんが、小林雅一氏のいう通
り、昨今のAIの驚くべき発展は、インターネットと無関係では
ないと思います。
 この世界中に張り巡らされたインターネットというインフラの
上に築かれた膨大な数のウェブサイトは、日々更新され、サイト
の数は増えつつあります。世界中のウェブサイトの数は、どのく
らいあるのでしょうか。
 諸説がありますが、ウェブサイトとしては約3億サイトぐらい
であり、ページ(URL)という単位で見ると、グーグルによる
と次の通りです。グーグルは、ロボットを使ってウェブページを
探しているので、その数は正確であると思われます。
─────────────────────────────
           1,000,000,000,000
          ゼロが12個で1兆
                  https://bit.ly/2ststCw
─────────────────────────────
 エキスパートシステムに代表される「ルールベースのAI」に
関わった人たちにとって、コンピュータが知識を獲得するとき不
可欠な「知識ベース」の構築は非常に困難な作業であるうえ、ま
してその内容の頻繁な更新は不可能です。
 しかし、ウェブサイトは、日々更新され、記述されている内容
は、あらゆる分野に及んでおり、その数も増えています。しかも
サイトの情報は、コンピュータが読める知識ベースになっている
のです。もちろん、ウェブサイトの情報が正しいとは限りません
が、サイトの内容の正誤については、現在のコンピュータで十分
判断できます。
 現在のAIは、自然言語処理の能力が大幅に向上しています。
スマホで次のように音声で話しかけてみてください。
─────────────────────────────
    近くに雰囲気の良いレストランはありませんか
─────────────────────────────
 そうすると、スマホはGPSによって現在地を確認し、ウェブ
サイトで近くのレストランを検索して、現在地に近いレストラン
を複数探し出し、その店のウェブサイトをスマホに表示してくれ
ます。こんなことは、ごく当たり前のように多くの人がやってい
ますが、これはとんでもなく凄いことをやっているのです。
 現在では、ほとんどのレストランは、ウェブサイトを出してい
ます。これがすべての大前提です。それに、すべてのスマホには
GPSが搭載されており、スマホの現在地をつねに把握していま
す。これらのことがすべて揃わないと、上記のような検索はでき
ないのです。ウェブサイトの存在がいかに重要であるかがわかる
と思います。
 このように、3億を超えるウェブサイトが、現在のAIを支え
ています。そしてこれがAIの「機械学習」に結び付くことにな
るのです。ウェブサイトの出現は、AI開発者にとってまさに奇
跡です。      ──[次世代テクノロジー論U/020]

≪画像および関連情報≫
 ●AIの原点を探る/青山学院大学美添教授
  ───────────────────────────
  ――具体的にはどういうことでしょうか。
  A:ベイズ統計にもいろいろありますが、いずれも、解析に
  「主観確率」(判断確率)という概念を採用しています。古
  典統計学では、未知でも確率は固定・客観的数値です。ベイ
  ズ統計では、確率は意思決定者の持つ情報を反映して変化す
  ることがあります。
  ――確率を後から恣意的に変えられ、それがAI機械学習の
  基礎原理になっている?
  A:恣意的に確率を変更するというのは、ベイズ統計の誤解
  されやすい部分です。ベイズ流に厳密に構成された主観確率
  は、人間は合理的判断をするという原理(公理体系)に基づ
  いた理論で、不確実性に直面しても「自分の効用関数を最大
  化するように意思決定を行う」というものです。当然、人に
  よって効用関数は異なります。しかし効用が最大になるよう
  に意思決定を行うという結論が導かれます。これが、ベイズ
  統計の原理です。そして、これが重要ですが、意思決定の根
  拠情報が追加的に与えられれば、それにより、主観確率は合
  理的手順で修正されます。この手順が「ベイズの公式」と呼
  ばれる形式です(解説参照)。
  ――機械学習の基礎になるということですね。
  A:大雑把にいえばそうで、機械学習では、ベイズの定理を
  利用して判断を修正します。ただし原理的なベイズ統計には
  あまり関心はなく、経験的に有効だから利用するようです。
  ハーバード時代の私の恩師たちが聞いたら、嘆くと思います
  ね。               https://bit.ly/2J3YZC
  ───────────────────────────

小林雅一氏.jpg
小林雅一氏
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月04日

●「AI導入によるグーグル検索技術」(EJ第4777号)

 元グーグルのCEOのエリック・シュミット氏は、次のような
ことをいっています。
─────────────────────────────
 文明の始まりから21世紀初頭までに生産された情報量は、約
5エクサ・バイト(エクサは10の18乗)だが、これと同じ情
報量が現代社会では、たった2日間で生産される。
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 「エクサ」といってもピンとこないと思います。百万を意味す
る「メガ」、10億を意味する「ギガ」までは誰でも知っていま
すが、その先は、「テラ」(兆)「ペタ」(千兆)ときて、次が
「エクサ」(百京)になります。
 このように、現在、ウェブ上の情報が加速度的に増加している
のです。グーグルは基本的には検索エンジンの会社ですが、この
ような情報の爆発的増加は、検索というものを一段と困難にしま
す。それは、本当に探したい情報以外のノイズが、劇的に増える
ことを意味するからです。たとえると、今までは砂場に落ちた指
輪を探す程度だったものが、現在では、砂漠に落ちた指輪を探す
レベルに検索困難度が上昇してしているのです。
 そこでグーグルは、検索エンジンにAIを導入し、人間の要求
するウェブサイトを、高速で、一発検索することに成功したので
す。これを「セマンティック検索」といっています。それは日々
その精度を増しつつあります。
 グーグルは、いわゆる知識を人間がコンピュータに与えている
限り、AI開発の意味はないと考えていたのです。すべての機械
は、人間を単純な繰り返し作業、マニュアル・レーバーから解放
し、ラクをさせることに目的があります。そのためには、何とか
コンピュータが、自動的に学習して知識量を増やし、それをベー
スに判断させることができないかと工夫したのです。その結果、
できたのが「ナレッジグラフ」という知識ベースです。このグー
グルのセマンティック検索について、小林雅一氏は、次のように
解説しています。機械が学習するプロセスがよくわかります。
─────────────────────────────
 グーグルのセマンティック検索では、そのシステムが自動的に
ナレッジ・グラフ(知識ベース)を構築していきます。グーグル
の機械学習システムは、ウェブ上にある無数のホームページを読
み漁り、それらを統計的に分析することによって得た知識を、あ
る種の知識体系の上にマッピングしていきます。たとえば、「東
京」というのは90%の確率で地名らしい。「日本」というのは
95%の確率で国名らしい。そして「東京」は85%の確率で日
本の首都らしい。(中略)システムはこれらの確率事象を照合し
それらが互いに矛盾していないことを確認します。このようにし
て作られる「知識の関係」リストがオントロジーで、それらが大
量に積みあがったものが知識ベース、つまりナレッジ・グラフな
のです。            ──小林雅一著の前掲書より
─────────────────────────────
 上記にある「オントロジー」とは、エキスパートシステムの世
界で使われる概念で「知識の表現」に当たります。対象世界にか
かわる諸概念を整理して体系づけ,コンピュータにも理解可能な
形式で記述したものをいいます。
 2回目の「AIの冬」の後、ベイズ理論をベースとする統計確
率的AIが発展します。その創始者のジュディア・パール氏の弟
子たちの多くは、グーグルをはじめとするシリコンバレーの企業
に入社し、AIの発展に貢献しています。なかでもグーグルに入
社した統計学を専門とする研究者は、セマンティック検索や機械
翻訳の分野でも活躍をします。
 グーグルの機械翻訳チームは、ウェブ上から、オリジナルの文
書とそれが別の言語の訳文の文書のペア──たとえば、英語の原
文とフランス語の訳文など──をかき集め、それをグーグルの強
力なサーバー・コンピュータに読み込ませて、知識ベースを構築
したのです。これは、比較的簡単な作業です。
 これは、コンピュータにとって、自学自習用のテキストになり
ます。コンピュータは原書と訳文を突き合わせて、ベイズ理論に
基づく推論をし、たとえば、上記の例であれば、英文を与えると
フランス語に翻訳するし、フランス語から英訳も、ほぼ正確にこ
なしたのです。ここで重要なことは、推論型AIが重視した文法
や構文を完全に無視したことです。これによってさらに精度が向
上し、ウェブサイト上の翻訳として使われています。
 英語を日本語に訳すのは、まだそこそこではあるものの、精度
は確実に向上しています。このグーグルの機械翻訳の技術の凄さ
については、小林雅一氏の次のエピソードによって、十分証明さ
れると思います。
─────────────────────────────
 アメリカ国立標準技術研究所(NIST)が数年に一度主催す
る機械翻訳のコンテストがあります。そこには毎回、全米の著名
な大学や研究機関の機械翻訳チームが参加していましたが、20
05年に初めてグーグルが参戦しました。他のチームが、中国語
やアラビア語などの専門家を必ずメンバーに入れていたのに対し
グーグルの機械翻訳チームにはそうした言語学者は一人もいませ
んでした。グーグル・チームは統計の専門家だけで固められてい
たのです。そして驚くべきことに、世界各国の言語に関しては全
く無知のグーグル・チームが、機械翻訳の分野で何十年という経
験を持つ他のチームを圧倒したのです。これは統計・確率的なA
Iが、文法などルール・ベースのAIに勝利を収めた瞬間として
専門家の問で語り草になつています。
                ──小林雅一著の前掲書より
─────────────────────────────
          ──[次世代テクノロジー論U/021]

≪画像および関連情報≫
 ●自動翻訳なぜ急速進化/2つのブレークスルー
  ───────────────────────────
   コンピューターで外国語を翻訳する機械翻訳(自動翻訳)
  技術が、長足の進歩を遂げている。人工知能(AI)技術を
  採用したことで翻訳精度が向上、最新の翻訳システムを組み
  込んだ音声翻訳などの製品やサービスが、続々と登場してい
  る。通訳なしで外国人と相当なレベルのコミュニケーション
  ができる時代が確実に近づいている。
   ディスプレーに現れた外国人が英語でスピーチを始める。
  話を追いかけるように画面下に映画の字幕のような英文が表
  示され、その下にこれを翻訳した日本語の字幕が表れる。情
  報通信研究機構(NICT)が開発中の、「同時通訳システ
  ム」のプロトタイプ。会議などで将来、同時通訳の代わりに
  使うことを想定している。
   話者の英語の音声を認識して文章を書き起こすシステムと
  英語の文章を和訳するシステムを組み合わせた。「どのくら
  いの長さで切って翻訳するかで、使い勝手や翻訳の精度も変
  わる。今後5年くらいで完成したい」。NICTの隅田英一
  郎・先進的翻訳技術研究室長は説明する。NICTはこれに
  先立ち、富士通と共同で日本人医師と外国人の患者が、タブ
  レットをはさんで会話ができる医療向けの多言語音声翻訳シ
  ステムを開発した。医師が「体調が悪いのは、いつからです
  か」などと話しかけると、タブレットから翻訳された音声が
  流れ、患者の答えを日本語にして返してくれる。
                  https://bit.ly/2J572Da
  ───────────────────────────

エリック・シュミット元グーグルCEO.jpg
エリック・シュミット元グーグルCEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月05日

●「人工脳『パーセプトロン』の理論」(EJ第4778号)

 現在のAI(人工知能)の中心は「ディープラーニング(深層
学習)」です。そのディープラーニングが何であり、どのように
役立つのかを知るためには、どうしてそこにいたったのか、AI
の歴史を知る必要があります。新しい技術を理解するには、その
技術が生まれた背景を知ることが不可欠だと考えています。
 グーグルは、検索精度の向上を図るため、「セマンティック検
索」の実現を目指し、その結果、自動的に作り出された「ナレッ
ジ・グラフ(知識ベース)」によって、検索の精度の大幅向上に
成功しています。これは、統計確率的AIの精度の向上に寄与し
たことになりますが、このナレッジグラフにストックされた知識
の件数は、2012年の時点で実に6億件を超えています。
 このナレッジグラフの構築作業は、グーグル開発による機械学
習プログラムによって日夜休むことなく続けられ、それは単に検
索精度の向上のみならず、機械翻訳など、AI全体の精度の向上
に貢献しつつあります。現在、グーグルがAIにおいて主導権を
握りつつあるのは、このナレッジグラフの存在と無関係ではない
といえます。
 しかし、1950年代から「ルールベースのAI」の実現を目
指してきた古典的AI派の学者や研究者たちは、統計確率的AI
の研究者たちに対して、次の疑問を突き付けています。
─────────────────────────────
 しかし、我々にも言いたいことがある。君達のように統計、確
率に従うAIは、人間の思考プロセスと明らかに別種のものだ。
そのような方法で、いずれ人間の知能や知性をコンピュータ上に
再現できると本気で信じているのか?つまり、今は結果を出して
いるからいいが、その先に未来はあるのか?
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 確かに統計確率知的AIは、ウェブサイトの検索や機械翻訳な
どの精度を大きく向上させたものの、それは、AIの一里塚に過
ぎないのです。このような状況の下で浮上してきたたのが「ニュ
ーラルネットワーク」です。最近この言葉をよく聞きますが、ニ
ューラルネットワークとは何でしょうか。これを真正面から取り
上げると、複雑な数式の世界に入ってしまうので、それを避けて
なるべく簡単な説明を試みます。
 ニューラルネットワーク(以下、NN)とは、機械学習や神経
科学などの分野で扱われる計算モデルの一種といってよいでしょ
う。この名前から想像されるように、脳の神経回路から知見を得
たモデルであり、「ニューロン」と呼ばれる最小の計算単位を、
ネットワーク状につなげた構成をしています。現在、話題になっ
ている「ディープラーニング」は、このNNを利用しています。
はっきりしていることは、NNは、機械学習の一分野であるとい
うことです。
 NNというと、ごく最近の技術のように思うかもしれませんが
大変長い歴史があります。そもそもAIの研究は、1956年の
ダートマス会議からはじまったのですが、その次の年である19
57年に「パーセプトロン」というシステムの概念が話題になっ
たのです。これは、米国のコンピュータ科学者であるフランク・
ローゼンプラットという学者が考案した概念です。
 簡単にいうと、人間の視覚と脳の機能をモデル化したもので、
それでいて、パターン認識を行い、シンプルなネットワークであ
りながら、自力で学習する能力を持つという理論です。
 この「パーセプトロン」についてネットで調べると、いずれも
数式を使った非常に難しい解説が出てきます。そこで、ここでも
分かりやすい小林雅一氏の解説を引用します。
─────────────────────────────
 パーセプトロンは、脳内におけるニューロンとシナプスによる
信号伝達メカニズムを極度に単純化したシステムでしたが、それ
でも幾つかの基本的な図形、たとえば三角形と四角形の違いを学
習し、それらを分類することができました。このように、コンピ
ュータが自力で学習することのインパクトは大きく、当時の米国
では『ニューヨーカー』のような知識人向けの一流雑誌が、「こ
れが今後進化すれば、いずれは人間のように感じ、記憶し、考え
る機械が生まれるだろう」と激賞するほどでした。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、パーセプトロンは、コンピュータに図形を認識させよ
うとしたのです。今日でいうところのNN、すなわち、ニューラ
ルネットワークの原型になるような先進的な理論であったという
ことができます。
 ところが、このパーセプトロン理論に対して、ダートマス会議
のメンバーの一人であるマービン・ミンスキー氏と南アフリカ生
まれの数学者、シーモア・パパート氏の2人は、次の論文を書い
て、この理論の限界を指摘したのです。
─────────────────────────────
     マービン・ミンスキー/シーモア・パパート共著
  『パーセプトロン/計算機科学への序論』/1969年
─────────────────────────────
 この論文では、パーセプトロンには致命的な欠陥があり、この
理論では、今後どのように改良しても限界があることを指摘して
います。実は、ミンスキー氏らとしては、パーセプトロンに反論
したのではなく、問題点を指摘しただけなのですが、それでもこ
の2人の学者の指摘は正鵠を射ており、これによってパーセプト
ロンに対する世間の期待は一気にしぼんでしまったのです。
 このときから実に20年以上の歳月を経て、パーセプトロン理
論ではない別の考え方に基づくパーセプトロンのネックを解決す
る新理論が提案されたのです。それがNN、ニューラルネットワ
ークです。     ──[次世代テクノロジー論U/022]

≪画像および関連情報≫
 ●人工知能「冬の時代」が到来/牧野武文氏
  ───────────────────────────
   1963年に、ミンスキーは、シーモア・パパートと知り
  合った。この南アフリカ生まれの数学者は、数学の学士号を
  とるためにイギリスのケンブリッジ大学で学んでいた。その
  ときにパーセプトロンに興味をもったが、パーセプトロンの
  機能については、ミンスキーを同じように限定的なものでは
  ないかという疑いを持った。
   パパートが、MITを訪れ、ミンスキーと面会すると、二
  人の考えはたちまち一致した。パーセプトロンがあまりに魅
  力的に見えすぎるため、人工知能研究者が誤った道に進もう
  としている。パーセプトロンを追求しても、それは袋小路に
  なっているのだ(現在のディープラーニングの基礎となって
  いるのもパーセプトロンだが、それには飛躍的な進化が必要
  だった)。
   パパートは、MITの数学科の教職を得て、さらにミンス
  キーのAI研の研究員となることで、ミンスキーといっしょ
  にパーセプトロンの限界を探る研究を始めた。パパートとと
  もに導きだした結論は、パーセプトロンは線形分離可能な問
  題しか学習できないということだった。線形分離可能という
  は、直線で集団をわけることができるような事象のことだ。
                  https://bit.ly/2J9EuZj
  ───────────────────────────

フランク・ローゼンブラット氏/パーセプトロン.jpg
フランク・ローゼンブラット氏/パーセプトロン
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月06日

●「パーセプトロン/その正体を知る」(EJ第4779号)

 「パーセプトロン」──AIの話をするときは、必ず出てくる
キーワードです。パーセプトロンについては、もう少し書く必要
があります。不明な点がたくさんあるからです。
 実はAI(人工知能)の研究は、「ルールベースのAI」から
始まったわけではないのです。最初はコンピュータで何とか「人
工の脳」を作ろうとしたのです。
 1943年のことです。米国の神経生理学者のウォーレン・マ
カロック氏と論理学者のウォルター・ピッツ氏が、共同で次の論
文を発表したのです。
─────────────────────────────
    ウォーレン・マカロック/ウォルター・ピッツ著
      『神経活動に内在するアイデアの論理演算』
                     1943年
─────────────────────────────
 人間の脳は、ニューロンという神経細胞が複雑に絡み合い、全
体でネットワークを形成しています。これが、神経回路網、すな
わち、ニューラルネットワークです。
 マカロックとピッツ両氏は、基本単位であるニューロンの振る
舞いを「ステップ関数」と呼び、それを数式によって表現したも
のを「形式ニューロン」と呼んだのです。つまり、数学モデルの
話なのです。しかし、これはシステムにはなっていません。
 この先駆的研究を引き継いだのが、コンピュータ科学者のフラ
ンク・ローゼンブラット氏です。彼はこの形式ニューロンを複数
組み合わせて、情報の入力層と出力層から成るきわめてシンプル
な人工的ニューラルネットを開発し、「パーセプトロン」と名付
けたのです。
 上記のように、この形式ニューロンは数式であり、それを組み
合わせたニューラルネットも数学的な産物です。しかし情報の入
力層と出力層を持っているので、一応システムになっています。
何らかの情報を入力し、計算結果として出力情報を得ることがで
きるからです。したがって、パーセプトロンとは、そういうこと
ができるハードウェアではなく、ソフトウェア的な数学モデルで
あるということができます。
 このパーセプトロンがマービン・ミンスキー氏とシーモア・パ
パート氏によって否定されたことは昨日のEJでふれましたが、
具体的には次のようにいったのです。
─────────────────────────────
 パーセプトロンは、原理的、かつ致命的な問題を抱えているた
め、いくつかの単純な論理計算、たとえば、排他的論理和をコン
ピュータ上に実現できない。    ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 ここでいう「排他的論理和」とは何でしょうか。
 Aという円とBという円が一部重なっているとします。その重
なった部分は、AでもありBでもある部分ですが、その部分を排
除するというのが排他的論理和です。集合の問題です。これを小
林雅一氏は、次のようにわかりやすく説明しています。
─────────────────────────────
 「排他的論理和」とは・・・
 たとえば、母親が小さな子供に向って、「チョコかプリンのど
ちらかは食べていいけど両方は駄目よ」と言うようなものです。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、小さい子供でもわかる「排他的論理和」ですが、パー
セプトロンにはわからないということで、パーセプトロンの信用
は失墜したのです。
 しかし、今になって考えてみると、この単純な人工脳パーセプ
トロンがベースになり、ニューラルネットワークとして、AIは
息を吹き返したのです。2006年頃のことです。その立役者は
英国のコンピュータ科学者、ジェフリー・ヒントン氏です。彼こ
そ「ディープラーニング」の命名者です。AIは、人工脳への挑
戦にはじまり、50年以上の年月を重ねて再び脳の研究に戻った
のです。ここまでのAIの歴史を辿ると次の4段階になります。
─────────────────────────────
    1.パーセプトロンAI ・・ 1950年代
    2.ルールベースのAI ・・ 1980年代
    3.統計・確率的なAI ・・ 1990年代
    4.脳科学に基づくAI ・・ 2000年代
─────────────────────────────
 最初は、何とか人間の脳を人工的に作り出したいと考えたので
す。その結果、パーセプトロンが考案されます。これによって世
の中は一時騒然となったのです。しかし、それが小さい子供の脳
にすら、はるかに及ばないとわかって、多くの投資家は資金を引
き上げ、1回目の「AIの冬」に突入します。
 続いて、高性能コンピュータの開発を前提として、コンピュー
タに多くの知識を与えることによって、推論により人間の脳を模
倣する「エキスパートシステム」ブームになります。「ルールベ
ースのAI」の時代です。
 しかし、やがて、コンピュータに知識を与えること(知識の獲
得)の困難性が露呈します。人間の持つ知識の多いことと、つね
に新しい知識が増えるので、知識の獲得が極めて困難であること
が明らかになり、AIは2回目の「AIの冬」に突入します。
 1990年から2000年にかけてインターネットが普及し、
ウェブサイトが激増します。それを知識ベースとして利用し、グ
ーグルの統計学エンジニアが中心になって「統計・確率的AI」
が台頭します。その結果、検索の精度が飛躍的に向上するととも
に、機械翻訳などの他のAIの精度も向上します。しかし、この
「統計・確率的なAI」の限界も明らかになり、再び人工脳の開
発が始まるのです。 ──[次世代テクノロジー論U/023]

≪画像および関連情報≫
 ●ベイジアンネットワーク/AIの歴史/後編
  ───────────────────────────
   ベイズ理論をベースにしたベイジアンネットワークは19
  80年頃に研究が始められました。これは統計・確率論的な
  アプローチによるAI技術です。
   ベイズ理論とは、観測を繰り返すごとに確率を修正して正
  解に近づけるという考え方であり、それをもとにしたベイジ
  アンネットワークは因果関係を確率で表現するグラフィカル
  モデルです。
   ある事象に対する原因の確率と結果の確率をノードとし、
  それらをエッジで繋いだ形で表現されます。観測によって得
  た新たな情報をベイジアンネットワークに投入するとそれぞ
  れの確率が変化し、その確率に基づいて推論を行います。ベ
  イジアンネットワークには原因から結果を推論することも、
  結果から原因を推論することも可能であるという特徴があり
  ます。ベイジアンネットワークはネットショップでのお勧め
  商品紹介、健康診断結果からの疑わしい病気の推定、スパム
  フィルタ、ウェブ侵入検知など、様々な分野での実用例があ
  ります。そして現在でも、ビッグデータ活用の手法の一つと
  して利用されています。
   統計・確率論的なAIに対しては、「統計と確率が基本に
  あるため、それは知性や知能ではない」という批判がありま
  す。膨大なデータの解析結果から単語の辞書的な意味を確率
  的に知ることはできるが、その単語の本当の意味を理解する
  ことはできません。人間の知能そのものを作るということを
  目的とした場合、統計・確率論的なAIはいつか限界に達す
  ると予想されます。       https://bit.ly/2HgYKlU
  ───────────────────────────

パーセプトロン理論.jpg
パーセプトロン理論
posted by 平野 浩 at 00:00| Comment(1) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月07日

●「ニューラルネットワークとは何か」(EJ第4780号)

 今日からは「脳科学に基づくAI」について、考えていくこと
にします。AI(人工知能)というのは、基本的には人間の脳の
働きと同じことをコンピュータに行わせるテクノロジーのことで
す。このような考え方に基づいてAIを定義すると、次のように
なります。
─────────────────────────────
 AI(人工機能)とは、インプットに対して、人間がするよ
 うなアウトプットを行う装置のことである。
─────────────────────────────
 コンピュータの性能が低い時代のAIは、少ない計算量で、人
間らしい振る舞いをさせる、たとえば、インプットに対するアウ
トプットの「ルール」を予め人間が決めておいたり(ルールベー
スのAI)、あるいは、インプットされた情報を統計確率的推論
によるアルゴリズムで精度の高いアウトプットを得る(統計・確
率的なAI)などが、これまで試みられてきています。
 しかし、インプットとアウトプットの間のブラックボックスの
部分を、人間自身がコンピュータに与えている限りにおいては、
いつまで経ってもAIが人間を超えるアウトプットを出せる存在
になることは困難です。コンピュータ自らが、自動的に知識を獲
得し、人間のように思考して、人間のようにアウトプットする存
在になって、はじめて人間を超えることができるのです。
 そうであるとすると、AIの研究は、原点に戻って人間の脳を
シミュレートする「脳科学に基づくAI」にならざるを得ないの
です。事実これまでのAIの歴史はそうなっています。
 仕事というものを人間がやれるかやれないかで分けて、AIと
の関係を考えてみます。
─────────────────────────────
       1.人間しかできなかったこと
       2.人間にはできなかったこと
─────────────────────────────
 本来AIやAIを組み込んだスマートマシンは、上記「2」の
「人間にはできなかったこと」を可能にし、結果として人間の能
力を拡張することを目的としています。
 たとえば、人間が一生かかっても参照できない量の学術文献や
判例などの法律文書をすべて読んで分析し、最適の解釈や判断を
示してくれたり、過去の犯罪記録の分析から犯罪の発生現場や内
容を予測し、それに基づいて指定された地域のパトロールを強化
することで検挙率を増やすことにより、犯罪の発生率を下げると
いったことなどが上げられます。
 これに対して、どんな強力なコンピュータでもAIでは処理で
きない上記「1」の「人間しかできなかったこと」はたくさんあ
ります。自動車の運転や企業における一般的事務作業、人との応
対業務や営業業務などがそれに当たります。AIでこれらを可能
にすることができれば、それらをAIに置換することによって、
人間の能力を効率化することができます。
 しかし、現代のAIは、上記「1」と「2」の両方ともできる
ようになりつつあります。これらのカギを握っているのが「脳科
学に基づくAI」の実現です。
 「脳科学に基づくAI」のニューラルネットワークとは何かに
ついて考えます。
 ニューラルネットワークは、神経回路網を意味する言葉で、人
間の知能をつかさどる脳を構造を模倣することで、その振る舞い
を再現しようとするタイプのAIです。科学ライターの大和哲氏
は、ニューラルネットワークを次のように定義しています。
─────────────────────────────
 ニューラルネットワークは、簡単に言うと、コンピュータ内で
データとして、インプットが入ってからアウトプットが出てくる
まで、その間に重みづけのグラフが構築されていて、「問題」と
して入力されたデータは、適切なルートを通って「回答」である
アウトプットを出力します。
 ここで言う“重み”とは、情報にとってどれだけ重要かを表し
た数値だと考えるといいでしょう。そして、ニューラルネットワ
ークの特徴は、このルートを通る間、情報がグラフ中の経路の重
み自体を、さらに軽くしたりあるいは重くしたりと、調整にも使
われる点です。つまりニューラルネットワークは、「経験から学
習する」人工知能であることが特徴のひとつです。
                  https://bit.ly/2xH3e5M
─────────────────────────────
 これだけではピンとこないと思いますが、脳科学に基づくAI
の構造は次のようなものです。初期のニューラルネットワークで
ある「パーセプトロン」には情報の入力層と出力層から成る2層
であったのに対し、現在のニューラルネットワークは、入力層と
出力層の間にいくつもの「隠れ層」といわれるものがある多層構
造になっているのです。これが「ディープ(深層)」といわれる
ゆえんです。
 多層にすると、入力層からインプットされた情報は、出力層か
らアウトプットされるまで、いくつもの隠れ層にインプットされ
何らかの処理をこ施されてアウトプットされることの繰り返しで
最終的に出力層からアウトプットされます。そのようにいくつも
の層を経過することによって、初期情報が何らかの上位概念を形
成していくと考えられるのです。
 人間の場合、目や耳から入力された情報がアウトプットされる
までの処理のプロセスはいわゆるブラックボックスであり、脳が
どのような処理を行ったかは不明です。これに対してこれまでの
AIは、インプットからアウトプットまでの推論プロセスは説明
できるのです。ブラックボックスではないのです。これでは人間
を超えることはできないのですが、ニューラルネットワークでは
その意思決定プロセスはわからなくなってきています。それだけ
現代のAIは、人間の脳に大きく近づいてきているといえます。
          ──[次世代テクノロジー論U/024]

≪画像および関連情報≫
 ●数学知識もいらないゼロからのニューラルネットワーク入門
  ───────────────────────────
   これまでに人工知能(AI)関連の記事を読んだことがあ
  る人であれば、ほぼ間違いなく”ニューラルネットワーク”
  という言葉を目にしたことがあるだろう。ニューラルネット
  ワークとは、大まかな人間の脳の仕組みを模したモデルで、
  与えられたデータを基に、新しい概念を学習することができ
  る。機械学習の一分野であるニューラルネットワークこそ、
  長く続いた”AI冬の時代”を終わらせ、新時代の幕開けを
  告げたテクノロジーなのだ。簡単に言えば、ニューラルネッ
  トワークは業界の根底を覆すような、現存するテクノロジー
  の中でもっともディスラプティブな存在だ。
   そんなニューラルネットワークに関するこの記事の目的は
  読者のみなさんがディープラーニングについて会話ができる
  ようになるくらいの理解を促すことにある。そのため、数学
  的な詳しい部分にまでは入らず、なるべく比喩や、アニメー
  ションを用いながらニューラルネットワークについて説明し
  ていきたい。
   AIという概念が誕生してからまだ間もない頃、パワフル
  なコンピューターにできるだけ多くの情報とその情報の理解
  の仕方を組み込めば、そのコンピューターが”考え”られる
  ようになるのでは、と思っている人たちがいた。IBMの有
  名な「ディープブルー」をはじめとするチェス用のコンピュ
  ーターはこのような考えを基に作られていた。
                  https://tcrn.ch/2Ja4UtU
  ───────────────────────────

ニューラルネットワーク.jpg
ニューラルネットワーク
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月08日

●「人間の脳について知る必要がある」(EJ第4781号)

 ニューラルネットワーク(NN)で注目すべき話題が小林雅一
氏の本に出ています。小林雅一氏は、KDDI総研リサーチフェ
ローです。AIの関連書籍のなかでは、数も多く、ダントツで分
かりやすい本であると思います。
 ある研究チームが、NNを使って機械翻訳システムを開発する
に当たり、手始めに英語と中国語を学習させたのです。これらの
2ヶ国語の語学力が一定のレベルに達した後で、今度はスペイン
語を学習させてみたところ、なぜか、中国語の語学力が一段と向
上したといいます。
 どうして、スペイン語を学習させると、中国語の語学力が向上
したのか、そのメカニズムは、そのシステムを開発したエンジニ
アもわかっていません。NNの神経回路網は複雑であり、その思
考回路については、開発エンジニアにとってブラックボックス化
しつつあります。それは、人間の思考回路に少しずつ近づいてい
ることを意味します。
 人間の「脳」をシミュレートする以上、人間の脳自体の研究が
必要になります。しかし、脳には現代の科学でもわかっていない
ことがまだたくさんあります。そのため、神経科学者たちはさま
ざまな実験を行っています。
 ある動物実験の話を紹介します。これも小林雅一氏の本からの
情報です。大脳には「聴覚野」と呼ばれる領域があります。これ
は、人間が耳からの音声情報を理解するための領域ですが、「視
覚野」と比べると、不明なことが多く、あまりよく解明されてい
ません。視覚野とは、大脳皮質における視覚に関する領域のこと
をいいます。
 ある神経科学者は、動物の耳から聴覚野へとつながる神経のラ
インを切断し、目から出ているラインを聴覚野につないでみたそ
うです。当然その動物は視力を失います。しかし、その後、不思
議なことが起きたのです。その動物は視力を取り戻し、モノを見
ることができるようになったのです。
 こうした実験を重ねて神経科学者たちはひとつの仮説を立てた
のです。小林雅一氏は次のように解説しています。
─────────────────────────────
 これら一連の実験結果を基に、神経科学者たちは大胆な仮説を
立てました。それは「視覚」「聴覚」「触覚」「味覚」など、人
間の様々な知覚能力に通底する基本的なメカニズムがある、とい
うものです。これに従えば、脳は目や耳から人力された生々しい
初期情報を、段階的に抽象化して、徐々に上位の概念を形成して
いきます。彼らは、このメカニズムを自分連なりに考えて、具体
的なアルゴリズムへと転化し、これを「スパース・コーディング
(Sparse Coding)」と命名しました。英語の「Sparse」 は「少
量の」という意味で、ここでは「大量の情報から、抽象化に必要
な本質的情報だけを、少しずつ抜粋すること」を指しています。
これによって隠れ層をより多層化しても、現実的な時間内で情報
処理ができるようになりました。  ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 難しい言葉が出てきました。「スパース・コーディング」とは
一体何でしょうか。
 米カルフォルニア大学バークレー校にブルーノ・オネスホーゼ
ン氏という教授がいます。計算論的神経科学(コンピューテーシ
ョナル・ニューロサイエンス)の分野で業績を上げている学者で
す。このオネスホーゼン氏が同大学のデービス校で、准教授をし
ていた頃の話です。
 オネスホーゼン教授は、脳の視覚野の一部の「V1」の研究の
第一人者ですが、動物の目から入力された視覚情報を脳にどのよ
うに処理されるかを解明する仮説を立てたのです。
 難しい話になりますが、視覚情報は目から入り、大脳皮質の一
番後ろにある第一次視覚野(V1)に送られます。サルやヒトで
は傾き、動き、奥行きなどの情報は、V1ではじめて抽出され、
さらに前方の大脳皮質に送られます。私たちが物の位置や形を認
識するとき、V1からその前方の大脳皮質に送られる情報が重要
な働きをしていると考えられます。ちなみに、このV1が壊れる
と、目が見えなくなります。
 V1に入ってきた目からの視覚情報は、無数のピクセル/画素
の集まりです。この状態では、それが何であるかは不明ですが、
V1で段階的にかたちを作り、認識にいたるのです。これについ
て、小林雅一氏は、次のように解説しています。
─────────────────────────────
 脳の視覚野は、このピクセル情報からいくつかの特徴ベクトル
(物体の輪郭を構成する線)を自動的に抽出します。そしてこの
ベクトルをいくつか組み合わせて、「目」や「耳」のようなパー
ツ(部品)を描き出し、それが終わると今度はこれらのパーツを
組み合わせて、「猫」や「人」の顔など最終的な対象物を描き出
している。要するに脳の視覚野は、そのように段階的に対象物を
認識しているというのです。         ──小林雅一著
   『AIの衝撃/人工知能は人類の敵か』/講談社現代新書
─────────────────────────────
 目から入った視覚情報、仮に人の顔であるとします。それらは
視覚野「V1」に入った最初の段階では、無数のピクセルの集ま
りにすぎません。その中から特徴的なパーツ(ベクトル)を抽出
し、そのうえで、それらを組み合わせて、段階的に顔を形成して
いくのです。
 そのプロセスには一定のルールのようなものがあるので、それ
をコンピュータで処理可能なアルゴリズムに転化させることがで
きます。オネスホーゼン氏は、そのことを「スパース・コーディ
ング」と名付けたのです。この場合、ひとつひとつのベクトルは
脳のニューロン一個一個に対応します。
          ──[次世代テクノロジー論U/025]

≪画像および関連情報≫
 ●人工知能を語る前に、脳について知りたい
  ───────────────────────────
   たった1つの学習理論とは脳が物事を学習する際には、そ
  の処理対象に応じた活動をするわけではなく、全ての処理対
  象に対して唯一の学習方法を使っているという考え方です。
  これは理論と名付けられている通り、そういう考えがあるだ
  けで、まだ確実にそうだと証明されているわけではありませ
  ん。しかし、1つの考え方として認められているものでもあ
  ります。特に人工知能関連では「スパース・コーディング」
  というものが有名です。スパースコーディングとは、ある処
  理を行うときに、なるべく少ない神経活動で済ませられるよ
  うに学習が行われるという考え方です。
   視神経を切断すると、当然視力を失います。視力を失った
  状態で、その切断した視神経を聴覚を処理している脳の神経
  に接続した場合にどうなるでしょうか。もしも音の処理と光
  の処理が異なるものであるならば、視覚の信号を聴覚の脳の
  領域に与えた所で何も起こらないはずです。しかし驚くこと
  に次第に視覚が取り戻されていったのです。すなわち視覚の
  信号を聴覚に使われていた脳の領域で処理することができた
  のです。これは、脳の視覚と聴覚に関する信号の処理構造は
  本質的な差異がなく、ある統一された学習によって意味のあ
  る情報として獲得しうると考えられます。
   視覚の情報処理機構を、アルゴリズムとして実装した場合
  に、実際に画像処理として有効であるのは何となく当たり前
  のかなと思います(もちろん工学に応用できるという点で有
  意義)。            https://bit.ly/2Jehick
  ───────────────────────────

視覚野/V1.jpg
視覚野/V1
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月11日

●「教師なし学習で『猫の概念』獲得」(EJ第4782号)

 すっかり、世間一般にAI(人工知能)という言葉が定着した
感があります。つい5年くらい前であれば、AIは専門用語であ
り、エンジニアしか知らなかった言葉です。したがって、書いて
いると、話がどうしても難しくなります。しかし、どうせ知るの
であれば、多少詳しいところまで、踏み込んで知る方があとあと
まで役に立ちます。
 どうしてコンピュータが人間と同じように見たり、聞いたりで
きるのでしょうか。ついこの間まで、コンピュータはモノのかた
ちを認識できなかったのです。ここに一枚の写真があったとしま
す。人が写っています。人間なら、すぐそれが人の写真であり、
女性の写真であるかがわかりますが、コンピュータは何の写真か
ぜんぜんわかりません。コンピュータが把握できるのは、無数の
小さいピクセル(画素)の集合体にしか見えないのです。それを
具体的な画像としてコンピュータに認識させる技術が「ディープ
ラーニング」です。
 添付ファイルを見てください。AIには、構造的にデータを入
力する「入力層」と、結果としてデータを出力させる「出力層」
があります。中間部には「隠れ層」という層がいくつもあります
が、データはそれらのいくつもの層を通過するごとに、少しずつ
具体的なかたちとしてとらえ、最終的に完全なかたちとなって出
力されます。そういう多くの層を通過することから「ディープ」
と呼ばれるのです。
 この画像認識について、早稲田大学ビジネスファイナンス研究
センター顧問の野口悠紀雄氏は次のように解説しています。
─────────────────────────────
 画像認識の場合、画像を多数の小さな部分(ピクセル)に分け
数値化したデータを、ニューラルネットワークの最初の層に人力
する。そこから第2層にデータが渡される際、各ニューロンの値
に異なる値(重み)を掛けた値を次の層の特定のニューロンに送
る。以降、同様にして最後の層までデータが渡され、最終的な出
力が生成される。
 何十万枚、あるいは何百万枚もの画像を読み込む学習によって
正しい答えを出せるようになるまで重みの値を調整する。現在で
はエラー率が5%まで低下しており、人問の画像認識能力とほぼ
同じになつている。対象によっては、人間より速く正確に認識で
きる。                ──野口悠紀雄氏論文
        「ディープラーニングの驚くべき威力と限界」
  『超整理日記/週刊ダイヤモンド』/2018年5月12号
─────────────────────────────
 コンピュータが画像を認識できるということは、手書きを含む
文字はもちろんのこと、モノの形状を認識できるので、宅配、郵
便などの物品の仕分け作業の分野などで、AIは、大いに役に立
つことになります。
 医療分野においても、AIの需要は高いのです。日本は医療機
械のCTとMRIの台数では、それぞれ世界第1位と2位ですが
それを撮影し診断する放射線医の数が圧倒的に不足しています。
したがって、AIを使えば、CTやMRIの画像の診断に役立て
ることができます。しかも、診断を重ねるごとに、判断の精度は
向上していくことになります。
 2012年6月のことです。グーグルとスタンフォード大学の
共同研究チームの開発したニューラルネットワークが、AIの歴
史に残る成果を発表します。ユーチューブの動画から「猫」の概
念を獲得したという発表です。「猫の概念の獲得」というのは、
コンピュータが、猫が写っている画像を見分けられるようになっ
たということを意味します。
 この場合、重要なのは、コンピュータに猫の特徴を教えていな
いということです。特定の何かが写っている動画を与えたのでは
なく、任意のユーチューブ動画で学習させただけです。実験内容
を少し詳しく述べます。
 具体的にいうと、ユーチューブにアップロードされている動画
からランダムに取り出した「200×200ピクセルサイズ」の
画像を1000万枚用意し、1000台のコンピュータを使って
9つの層のニューラルネットワークで、ディープラーニングによ
る学習を行わせたのです。
 AIは、さまざまなモノが写っている1000枚の画像を学習
し、パターン分析を行い、グループ分けを行ったのですが、その
なかで猫については認識できるようになったということです。そ
れは、おそらく動画には猫が一番多く写っていたのではないかと
思われます。実際にネット上には、おびただしい数の猫の動画が
溢れています。
 いわゆるニューラルネットワークの「機械学習」には、次の2
つの学習法があります。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 1の「教師あり学習」とは、文字通り人間が先生になって、つ
きっきりで、コンピュータに教えることです。たとえば、猫とは
どういうかたちをしているかについて、その特徴点を教え込み、
複数の動物の写真のなかから、正確に猫の写真を選ばせるように
する方法です。しかし、この方法では、AIはいつまで経っても
人間を超えることはできません。
 これに対して2の「教師なし学習」は、人間の助けなしにコン
ピュータに独力で学習させる方法です。多くのデータのなかから
自律的に学習させる方法です。グークルとスタンフォード大学の
共同研究チームは、これを達成させたのです。
 実は、猫だけではなく、自動車、椅子、人の顔などの概念も同
時に認識していたそうです。いずれにしても、この快挙によって
AIは人間に大きく一歩近づいたといえます。
          ──[次世代テクノロジー論U/026]

≪画像および関連情報≫
 ●パスポートをかざすだけで入国審査/「顔認証ゲート」
  ───────────────────────────
   法務省は2018年6月8日、国内で初めて成田空港で、
  11日から運用を開始する顔認証技術を活用した「顔認証ゲ
  ート」を公開した。パスポートをかざすだけで入国審査がで
  きるシステムで、事前手続きは不要となる。本格運用によっ
  て、出入国手続きの時間の短縮が期待される。利用者の多い
  中部、関西、福岡空港でも、年内に導入される予定。
   顔認証ゲートでは、ICチップが内蔵されたパスポートを
  機械にかざしチップの顔写真データと、自動化ゲートのカメ
  ラで撮影した顔をコンピューターで照合。同一人物か確認し
  顔が一致すればゲートが開く。
   対象は身長135センチ以上の利用者。法務省によると、
  他人を誤って入国させる確率は0・01%以下という。パス
  ポート発給時と顔が大きく変わっていなければ10秒ほどで
  終了する。マスクや帽子を着用していると注意を促すメッセ
  ージが機械に表示される。
   現行の出入国審査では、審査官がパスポート写真と本人を
  見比べて確認する手続きが一般的だった。昨年10月から羽
  田空港国際線ターミナルで帰国者を対象に3台が先行導入さ
  れていたが、本格導入は成田が初めて。今月11日から第2
  第3ターミナル、18日から第1ターミナルの上陸審査場で
  運用を開始する。        https://bit.ly/2sQYTaa
  ───────────────────────────

ニューラルネットワーク/ディープラーニング.jpg
ニューラルネットワーク/ディープラーニング
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月12日

●「ヒントンのカブセルネットワーク」(EJ第4783号)

 ジェフリー・ヒントン氏──1947年の英国生まれの科学者
であり、今やAI(人工知能)、なかんずくニューラルネットワ
ークの権威であり、ディープラーニングの世界では、最も影響力
を持つ人物の一人といわれています。ヒントン氏は、トロント大
学教授という籍を持ちながら、グーグルの研究員をしており、世
界のAI技術を牽引しています。
 小林雅一氏によると、ヒントン教授は、コンピュータ基礎理論
のひとつである「ブール代数」を発明した数学者、ジョージ・ブ
ールの子孫といわれます。ジョージ・ブールは数学の世界に「論
理」を取り入れた人物であり、AIと密接な関係があります。
 当時、数学は「数」や「図形」を扱う学問で、「論理」は哲学
の分野であると考えられていました。しかしブールは論理や推論
を数学的に考えられるのではないかという発想を持ち、1844
年の論文において「演算」を記号で表し、その記号同士の計算を
考えたのです。これがプール代数です。
 ヒントン教授の凄いところは、2度にわたる「AIの冬」を経
てもAIの研究を続けたことです。そして、やっと2012年6
月にグーグルとスタンフォード大学のAI研究チームは、動画の
なかから「猫」を認識したのです。
 しかし、これにはディープラーニングに与えるデータの前処理
というものが必要です。しかも、大量のデータを与える必要があ
ります。2012年の快挙のときでも、ユーチューブからランダ
ムに選んだ動画から、一定のピクセルサイズの画像を1000万
枚も準備していますが、これが前処理です。
 この1000万枚の画像のなかに偶然最も多く写っていたのが
「猫の画像」であり、AIは「猫」を認識できたのです。もう少
し詳しくいうと、その画像のなかに、さまざまな角度からの猫の
画像が入っていたからであるということができます。
 人間の子供であれば、「これが猫だよ」と教えられれば、どの
ような角度からでも、すぐ「猫」だと認識できます。他のどのよ
うな猫に関しても同じです。しかし、ニューラルネットワークで
は、画像のピクセルがほんの少し動いただけでも画像を全然別の
ものと認識してしまいます。そういう誤差が起きないように、た
くさんの画像を認識させる必要があります。
 これに関してヒントン教授は、2017年10月に「カプセル
ネットワーク」という名の論文を発表しています。その原文のU
RLは、次の通りです。
─────────────────────────────
             Geoffrey E. Hinton
      Dynamic Routing Between Capsules
                  https://bit.ly/2xXEB4P
─────────────────────────────
 これによって、AIの画像認識率が格段に向上したのです。こ
れまでのニューラルネットワークの最高時の精度を実現でき、そ
の誤答率はニューラルネットワークの最低時の半分のレベルまで
減少したといわれます。
 「カプセルネットワーク」とは何でしょうか。
 この「カプセル」という概念がかなり難解です。カプセルネッ
トワークについて解説しているサイトによると、カプセルについ
て次のように説明しています。
─────────────────────────────
 「カプセル」とは、むき出しの仮想ニューロンの小さな集合体
で、猫の鼻や耳のような、ある物体の異なるパーツと、空間にお
けるそれらの相対的な位置を探知するよう設計されている。多数
のカプセルによるネットワークは、新たな場面について、「実は
すでにある場面を違う視点から見たものだ」と理解し、その気づ
きを利用する。           https://bit.ly/2HALKYj
─────────────────────────────
 添付ファイルを見てください。人の顔を認識するときに、従来
のニューラルネットワークでは、それが目なのか、鼻なのか、口
なのかにしか着目していないのです。ちょうど、左の画像のよう
に認識しています。
 これに対し、カプセルネットワークでは、右の画像のように、
それらの特徴がどのような関係で配置されているかまで含めて認
識します。つまり、カプセルネットワークでは、目や鼻や口や耳
の特徴を独立的にとらえるだけでなく、それらがどのような位置
関係で配置されているかまで認識します。
 ひとつひとつのカプセルにつまったニューロンが個々の特徴に
着目するだけでなく、それぞれの位置関係まで把握するのです。
ここにカプセルネットワークの名前の由来があります。
 ヒントン教授のこの最新の論文にについては、発表されたばか
りであり、その成果をうんぬんするには、まだ早いかもしれませ
んが、確実に従来のニューラルネットワークを前進させるもので
あり、各方面から多くの賛辞が寄せられています。
─────────────────────────────
◎ローランド・メミセヴィッチ/モントリオール大学教授
  与えられたある量のデータから、既存のシステムよりも多く
 の理解を得られる。
◎ゲイリー・マーカス/ニューヨーク大学教授
  ヒントンの最新の業績は、歓迎すべき新たな風の息吹を象徴
 しています。AI分野の研究者たちは、脳にもともと組み込ま
 れている仕組みを積極的に真似るべきです。視覚や言語といっ
 た必須の能力を身に付けるために役立つのですから。
  新たに登場した体系が、どこに行き着くかはまだ分かりませ
 ん。でも、これまでのAI研究が固執し、はまり込んでしまっ
 ていた轍から抜け出す方法を見つけたという点において、ヒン
 トンは素晴らしい成果を挙げたといえるでしょう。
                  https://bit.ly/2HALKYj
─────────────────────────────
          ──[次世代テクノロジー論U/027]

≪画像および関連情報≫
 ●深層学習を根底から覆すカプセルネットワークの衝撃
  ───────────────────────────
   現在の深層学習ブームのきっかけを作ったのが、トロント
  大学のジェフリー・ヒントン教授であることには誰も疑問を
  抱かないでしょう。ヒントン教授らのグループはそれまで目
  覚ましい成果がなかなか出なかった画像認識という分野に深
  層畳み込みニューラルネットワークという新しいアイデアで
  取り込み、目覚ましい成果を挙げたことで、グーグルはヒン
  トン教授の設立した企業DNNリサーチを買収し、今のディ
  ープラーニングブーム旋風が世に巻き起こりました。だいた
  い、この手のニューテクノロジーブームというのは、2、3
  年で落ち着くのが常です。
   しかし、稀にブームで終わらずに、本物のイノベーション
  になる技術があります。たとえば、モバイル・インターネッ
  ト、リアルタイム3Dコンピュータグラフィックス、スマー
  トフォンなどです。
   スマートフォンの場合、なにもアイフォーンが最初ではあ
  りませんでした。アイフォーンのプロトタイプのようなもの
  が1990年代後半からいくつも登場しては消えていったの
  です。人工知能分野のなかでも、特にニューラルネットワー
  クはスマートフォンと似ています。過去に何度も注目を集め
  ブームになりながら、いまひとつ定着できずイノベーション
  に昇華できなかったもののひとつです。
                  https://bit.ly/2kWUFdI
  ───────────────────────────
 ●添付ファイル画像出典/https://bit.ly/2prgd4T


カプセルネットワークとは何か.jpg
カプセルネットワークとは何か
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月13日

●「どのように画像の特徴を掴むのか」(EJ第4784号)

 そもそも「ディープラーニング」は、何がきっかけになって、
注目されたのでしょうか。
 「画像認識コンテスト/ILSVRC」という国際的なイベン
トがあります。このコンテストは毎年行われ、世界中の一流大学
や研究機関がエントリーして、独自のアルゴリズムを競い合う技
術競技です。ILSVRCは、次の言葉の略です。
─────────────────────────────
  ILSVRC
  ImageNet Large Scale Visual Recognition Challenge
─────────────────────────────
 2012年のILSVRCのことです。そのとき、1200万
画素・1000カテゴリの画像認識の問題に対し、ジェフリー・
ヒントン教授率いるチームが圧勝しました。このとき、使われた
のがディープラーニングです。勝敗は、画像認識エラー率で競う
のですが、他チームの平均エラー率が26%だったのに対し、ヒ
ントン教授率いるチームのエラー率は16%だったのです。この
結果には、世界中が驚愕したのです。以来、ディープラーニング
は世界中で有名になったといえます。
 さて、「ディープラーニング」は、機械学習の一つです。6月
11日のEJ第4782号で述べたように、機械学習には次の2
つがあります。再現します。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 画像認識の場合、人間であれば、その画像の特徴というべきも
のを無意識に掴んで、それが、どういう画像であるかを判断しま
す。ディープラーニングの場合は、どのように把握するのでしょ
うか。日本のAI研究の第一人者である松尾豊東大准教授は、こ
れについて次のように述べています。
─────────────────────────────
 例えば、画像の場合、画像の中から特徴量を自動的に切り出す
ことができる。特徴量とは、簡単なものだと、エッジの検出、角
の検出、などのようなものから始まり、それが組み合わさること
によって「顔がある」「これは人間の顔」「これは猫の顔」など
という高次の特徴量へとつながっていく。そうすることで高次の
特徴量も自動的に取り出すことができるのです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 ここで松尾准教授のいう「特徴量」という言葉について、知る
必要があります。特徴量とは特徴を数式化したものをいいます。
アルファベットを例に上げます。AIは、その形状からアルファ
ベットというものを次の3つのパターンに分類して認識します。
─────────────────────────────
  1.中心から縦に引いた線を境にして左右の形が等しい
    A、H、I、M、O、T、U、V、W、X、Y
  2.中心から横に引いた線を境にして上下の形が等しい
    B、C、D、E、H、I、O、X
  3.上記「1」と「2」の条件を両方とも満たしている
    H、I、O、X
                  https://bit.ly/2l5zCWF
─────────────────────────────
 どういう仕組みで、画像の特徴量を把握するのかというと、そ
こには、「オートエンコーダ」というものを使うのです。松尾准
教授は、次のように述べています。
─────────────────────────────
 オートエンコーダーというものを使います。従来の機械学習な
ら、「教師あり学習」、「教師なし学習」という分け方をするこ
とが多かったのですが、ディープラーニングは「教師なし学習」
だが、一見すると「教師あり学習」のような扱いをするのです。
 どういうことかと言うと、例えばコンピューターに画像のデー
タを与えた場合、コンピューターは画像の一部を消して、その一
部を残った部分から当てなさいという問題に変えるのです。そう
すると、画像を与えただけで、たくさんの擬似的問題を作ること
ができる。それをニューラル・ネットワークで解かせていくと、
ニューラル・ネットワークの隠れ層にあたる部分に特徴量が自動
的に獲得されてくるという仕組みです。そして、それは画像の一
部を見て、残りを当てるということにおいて重要な特徴量なので
画像を端的に表わす特徴量が自動的に選ばれるというわけです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 松尾准教授は凄いことをいっています。例えば、「1」という
字を認識しするとき、AIはその一部を消して、自分で自分に問
題を出します。例えば、「1」の画像の下半分を消して、画像が
何であるか、ニューラルネットワークに問い合わせます。
 右に横線が出ると「L」、左が空いた弧がくれば「5」と、縦
に線が伸びれば「1」になります。画像の隠す部分を変えて、い
くつも問題を作り、ニューラルネットワークを通して正解を得る
仕組みになっています。
 ディープラーニングで思考するニューラルネットワークは、本
来「教師なし学習」です。しかし、AI自体が自身に対して問題
を出し、答えさせることによって、正解率を高めるメカニズムは
一種の「教師あり学習」ともいえる──松尾准教授はそのように
いっているのです。
 覚えるということは試行錯誤の繰り返しです。赤ちゃんが手当
たり次第に周りにあるものに触ったり、叩いたり、口に入れたり
してそれがどういうモノか理解していくプロセスがディープラー
ニングのなかに内蔵されているようです。AIについて知れば知
るほど、人間の脳がいかによくできているかを知らされることに
なります。     ──[次世代テクノロジー論U/028]

≪画像および関連情報≫
 ●松尾豊東京大学准教授とのインタビュー
  ───────────────────────────
  金丸:お忙しいなかお越しいただきありがとうございます。
  今日は六本木に今年3月オープンした『ビフテキのカワムラ
  六本木店』をご用意しました。こちらは神戸に本店があって
  銀座にもお店があるんですが、とにかく予約が取れないんで
  すよ。
  松尾:そうなんですか。そんなお店にお招きいただき、あり
  がとうございます。最高級の神戸牛が味わえると聞いて、楽
  しみにしてきました。
  金丸:松尾先生のご専門は、人工知能(AI)です。ここ最
  近、AIのニュースを聞かない日はありませんし、先生のこ
  とはメディアでもよく拝見しています。
  松尾:ありがとうございます。
  金丸:先生とは経済産業省のプロジェクトでご一緒していま
  す。いまAIのなかでも、ディープラーニングという新しい
  技術が注目されていますが、どういうものなのか簡単に教え
  ていただけますか?
  松尾:ディープラーニングとは、人間の脳の神経回路をまね
  た「ニューラルネットワーク」を使って、人間の脳と同じよ
  うな情報処理を行う技術です。これまでコンピュータに画像
  を認識させるには、たとえばネコなら「目が丸い」「耳がと
  がっている」というようなネコの特徴を人間が入力しなけれ
  ばなりませんでした。それがディープラーニングの技術によ
  り、コンピュータに大量の画像データを読み込ませることで
  コンピュータ自らが学習し、その特徴を見出せるようになり
  ました。            https://bit.ly/2kZXTNu
  ───────────────────────────

松尾豊東京大学准教授.jpg
松尾豊東京大学准教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月14日

●「IBMワトソンはどんなマシンか」(EJ第4785号)

 IBMが開発した「ワトソン」という名前のコンピュータがあ
ります。今やAI(人工知能)とワトソンは同義語として語られ
るほど有名な存在です。実は、当のIBMは、ワトソンについて
次のようにいっているのです。
─────────────────────────────
 ワトソンとAI(人工知能)は目指すゴールが決定的に違う
                       ──IBM
─────────────────────────────
 「ワトソン」という名前を聞くと、アーサー・コナンドイルの
推理小説『シャーロック・ホームズシリーズ』の登場人物で、名
探偵シャーロック・ホームズの友人のワトソン博士を想起する人
が多いと思います。小説でのワトソンは、いろいろな場面でホー
ムズにアドバスする役割であり、AIコンピュータ「ワトソン」
の役割にぴったりですが、まったく関係がありません。
 ワトソンの名は、IBMの事実上の創立者であるトーマス・J
・ワトソンから取られています。創立者ではありませんが、初代
社長で、1914年から1956年までIBMのトップとして、
IBMを世界的大企業に育て上げた人物であり、IBMを代表す
るコンピュータの名前を冠するのに相応しい人物です。
 ところで、なぜ「ワトソン」とAIとは目指すところが違うの
でしょうか。キーワードは次の言葉です。
─────────────────────────────
  IBMの「ワトソン」は、コグニティブシステムである
─────────────────────────────
 コグニティブ(cognitive) とは、日本語で「認識」とか「認
知」のことであり、コグニティブシステムとは、ある事象につい
てコンピュータが自ら考え、学習し、自らの答えを導き出すシス
テムを意味します。「コグニティブ・コンピューティング」とも
いわれています。
 米IBM基礎研究所バイスプレジデントで、ディープラーニン
グの応用や神経細胞のシナプスのように働く新しい「シナプス・
チップ」の研究を牽引するダリオ・ギル氏は、コグニティブシス
テムについて、次のように説明をしています。
─────────────────────────────
 AIの技術が、コグニティブシステムに使われていることは間
違いないが、AIとコグニティブシステムは「ゴール」が違う。
AIは、科学分野における技術であり、人間ができることのイミ
テーションを目指している。一方、コグニティブシステムは人間
が中心。人がより良い作業が行えるようにサポートするものだ。
 コグニティブシステムは、学習能力を持った点が大きな特徴。
これまでのようにルールを書かなくても、システム側が事例を通
じて学習することが可能だ。ソフトウェアの世界を抜本的に変え
ることになる。普通、コンピュータというのは、購入した日が最
も性能が高い日であるが、コグニティブシステムは最もパフォー
マンスが悪いのが購入した日。学習することで、日に日に性能が
向上する。その学習の成果をもとに、コグニティブシステムは、
人間が持っている専門知識を補完するものだ。私は、コンピュー
タが人を置きかえるという考え方は根本的に間違っていると思っ
ている。    ──ダリオ・ギル氏 https://bit.ly/2l5bFPd
─────────────────────────────
 ワトソンは、自然言語処理ができるマシンですが、早押しの人
気クイズ番組「ジョパディ!」で優勝しています。当時のワトソ
ンには音声認識機能は搭載されておらず、問題は文章で出題され
シリンダーでボタンを押す装置を用いて回答したことがわかって
います。
 現在では、ワトソンにはかなり強力な音声認識機能が装備され
ており、日本のメガバンクのコールセンターでも、ワトソンが使
われています。文字は解読できるし、人の会話を聞き取り、文章
化できる能力も持っています。しかも、知識のソースを与えれば
ワトソンは、自動的に機械学習できる能力も持っています。
 ダリオ・ギル氏はこうもいっています。現在のコンピュータは
現存する2・5エクサバイトのデータのうち、80%のデータの
意味が理解できない。これらは、SNSなどによって発信されて
いる自然言語のデータですが、人間にとってもこれらのデータは
あまりにも分量が多いので処理できない。ワトソンのコグニティ
ブシステムは、これらの80%のデータを読んで、理解できるよ
うにするものである、と。
 これらのことから、ワトソンとは、自動学習でき、豊富なデー
タから、高度な推論のできるエキスパートシステムではないかと
思われます。既にIBMは、ワトソンによる「コグニティブビジ
ネス」を展開していますが、課題は多くあるようです。
 しかし、IBMのワトソンについて、松尾豊東大准教授は、次
のように絶賛しています。
─────────────────────────────
 IBMのワトソンがすごいのは、自然言語処理に優れていると
ころだ。コンピューターが扱えるデータが爆発的に増えていると
いっても今はまだ紙に書かれた情報が山のようにある。書籍をス
キャナで読み取って、文字を認識したとしても、コンピュータに
は、その書籍の内容がどういうものなのかは理解できない。どの
部分が書籍のタイトルで、どれが著者名かということさえも、そ
のままでは分からない。
 ところがワトソンは、コンピューター向けに作られていない文
字情報を、コンピューターに理解できるような形に変えるところ
でさまざまな工夫がされているのだという。クイズ番組「ジョパ
ディ!」に出演したワトソンは、書籍や百科事典、ウィキペディ
ア上の情報など、2億ページ分のテキストデータ(70GB程度
約100万冊の書籍に相当)をスキャンして取り込んでいた。
       ──松尾豊東大准教授 https://bit.ly/2LFgAl9
─────────────────────────────
          ──[次世代テクノロジー論U/029]

≪画像および関連情報≫
 ●ワトソンで苦戦のIBMが狙う「AIでの反撃」
  ───────────────────────────
   人工知能(AI)分野ではグーグルやマイクロフト、フェ
  イスブックらが優秀な人材をかき集める一方、IBMのよう
  な古くからの大手は苦戦を強いられている。
   IBMは、莫大な費用を同社のAIのワトソンに注いでい
  るが、目立った成果をあげられていない。健康情報メディア
  「Stat」は先日、ワトソンのガン治療分野への導入が遅延し
  ている状況を詳細にレポートした。
   IBMは大学の研究機関とともに、この状況への対処を始
  めた。2017年9月7日、IBMは、マサチューセッツ工
  科大学(MIT)と実施するAI研究プロジェクトに、今後
  10年間で2億4000万ドル(約260億円)を出資する
  とアナウンスした。「MIT-IBM Watson AI Lab」と 呼ばれる
  このプロジェクトは、100名の研究者らを4つのAI領域
  の研究に割り当てる。
   その4領域とはニューアルゴリズム、ハードウェア、ソー
  シャルインパクト、ビジネス活用だ。アルゴリズム開発にお
  いて同プロジェクトは、マシンラーニング(機械学習)の一
  分野であるディープラーニング(深層学習)に続く新領域に
  注力する。「今回の提携で、ディープラーニングを超える新
  たなアルゴリズムの発見に向けた基礎研究を開始する」とM
  ITのエンジニアリング部門学部長は述べた。
   研究チームが特に注力するのは、人間による監視や手作業
  によるデータのタグづけ無しで実行可能なAIアルゴリズム
  のトレーニングだ。現状のディープラーニングのトレーニン
  グには、人間の目視による確認が必須で、個々のデータにラ
  ベルづけを行う必要がある。例えば車の画像データがあれば
  これは車だと教えてやる必要があるのだ。
                  https://bit.ly/2Mix7MR
  ───────────────────────────

ダリオ・ギル米IBM基礎研究所副社長.jpg
ダリオ・ギル米IBM基礎研究所副社長
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月15日

●「ワトソンの無期限無料試用の狙い」(EJ第4786号)

 2017年10月27日に、日本IBMは、ワトソンについて
次のアナウンスを行っています。
─────────────────────────────
 IoTのシステム構築には試行錯誤がつきもので、PoC(概
念検証)などでは試作や検証に時間がかかる傾向がある。そうし
た課題に対し、日本IBM、同社のAIプラットフォームである
ワトソンなどを開発者が無料で、かつ無期限に利用できるサービ
スを2017年10月27日から開始した。  ──日本IBM
─────────────────────────────
 このIBMのサービスは「IBMクラウド・アカウント」と呼
ばれます。これまでは、無料試用トライアルは30日に限定され
ていたものが、無期限に無料で利用できるようになったのです。
AIを試してみたい企業や個人のデベロッパーにとって、またと
ないチャンスが訪れたといえます。なぜ、IBMは、このかなり
思い切ったサービスに打って出たのでしょうか。
 これには、諸説がありますが、AI(人工知能)の分野におい
て先行していたはずのIBMが、優秀な人材を集め、集中的にA
Iに投資を行っているグーグルやマイクロソフト、フェイスブッ
クなどから遅れをとっているからであるといわれています。確か
に、これまでにIBMは莫大なコストをワトソンに注いでいます
が、目立った成果を上げられないでいるからです。
 それに、IBMはワトソンをグーグルなどで開発を進めるAI
とは別のビジネスシステムとして位置づけようとしているフシが
あります。10月27日のユーザーイベントで基調講演をしたエ
リー・キーナン日本IBM代表取締役社長は、世界を変える6つ
の技術として、@AI、AIoT、Bブロックチェーン、C量子
コンピュータ、Dニューロモーフィックコンピュータ(脳型コン
ピュータ)、E世界最小コンピュータの6つを上げ、コンピュー
タが現在、人間の生活を大きく革新しつつあると述べたうえで、
AIについて次のように述べています。
─────────────────────────────
 AIには、人々の生活を直接的に助けるAIと、ビジネスを支
援するAIがある。ワトソンはビジネスを助けるAIである。限
られたゲーム盤の上でさらにルールが固定化されたゲームとビジ
ネスの世界は大きく異なる。AIをビジネスで活用するためには
業界用語や文脈、ワークフローをAIが理解できないと難しい。
ワトソンは、すでに医療現場で医者の診断を支援するサービスを
開始しており、ビジネスの世界で実績がある。他のAI技術では
そういう実績はまだない。      https://bit.ly/2t6IQFG
─────────────────────────────
 これでわかるように、IBMは、ワトソンをグーグルなどが主
導する、いわゆるAIとは別のものであるとしているようです。
ワトソンは既に業務に役立つレベルに達しており、さらに多くの
成功事例を生み出そうとして「IBMクラウド・アカウント」を
スタートさせたものと考えられます。
 その成功事例を担っているのは、ワトソンの展開において日本
のパートナーとしてIBMに協力してきたソフトバンクグループ
です。10月27日のユーザーイベントで、日本IBMエリー・
キーナン社長に続いて登壇したソフトバンクの代表取締役社長兼
CEOの宮内謙氏は、EC(電子商取引)の市場規模が200兆
円以上になっているが、これからの10年間は、それよりももっ
と大きな変化が起きるとして、テクノロジーによる企業の成長戦
略の可能性について、次のように述べています。
─────────────────────────────
 成長戦略を描くうえで、考えなければいけない3つの経済変化
として、「コネクテッドエコノミー」
    「シェアリングエコノミー」
    「スコアリングエコノミー」を挙げる。
 コネクテッドエコノミーは、通信により人と人がつながり、場
所も時間を選ばないコミュニケーションができるようになったこ
とで生まれる価値を示す。今はこれがさらに広がり、人だけでな
くモノもつながることができる。
 さらにこのコネクテッドエコノミーを土台として、完全にモノ
の管理が行えるようになったことで、シェアリングエコノミーが
生まれた。カーシェアリングや自動車シェアリングなどのほか、
ウーバーなどの自動車配車サービスなどもこれに当たる。
 さらに、あまり注目されていないが、今後重要になることにス
コアリングエコノミーがある。コネクテッド化により、モノの完
全な管理が可能となることで、例えばシェアされた自動車をどの
ような使い方をしているのかが把握できる。
そこで利用者がスコアリングされるような状況が生まれる。これ
らはさらにさまざまな産業に広がっていき、新たなチャンスを生
み出すだろう。           https://bit.ly/2t6IQFG
─────────────────────────────
 ソフトバンクでは、AIを活用した革新的企業との協業や出資
などを展開しています。その分野としては、セキュリティ、ライ
ドシェア、医療、自動運転、ロボット、半導体、室内農業、産業
IoTなど、多方面に及んでいます。
 日本IBMは、「IBMクラウド・アカウント」のサービス開
始を機会にワトソンのユーザーを一挙に増やすことを計画してい
ます。日本IBM三澤智光取締役は次のように述べています。
─────────────────────────────
 ワトソンの国内での展開は既に350社以上におよんでいるが
日本語APIを自由に触りたいという声が非常に多かったので、
今回「IBMクラウド・アカウント」を用意した。より多くの開
発者にさまざまな形で触れてもらうことが重要だと考えている。
 ──日本IBMクラウド事業本部長/三澤智光取締役執行役員
                  https://bit.ly/2JO4GVe
─────────────────────────────
          ──[次世代テクノロジー論U/030]

≪画像および関連情報≫
 ●「IBMクラウド・アカウント」の価値
  ───────────────────────────
   今回リリースされた「IBMクラウド・アカウント」は、
  利用期間に制限がない。使用料金が発生することがないため
  クレジットカードなどの登録も不要だ。これまでのフリート
  ライアルは30日間の期間限定だったが、今度はじっくり試
  すことができる。また、学生などでクレジットカードを所持
  していない人とっても利用のハードルが下がったことは大き
  な意義がある。
   しかし、有料プランと比較した場合、当然ながらいくつか
  の制約が存在する。利用可能な組織・地域とも各1つ。CF
  メモリが256MB、主要サービスはライトプランのみで、
  インスタンスもプランごとに1つといった機能面の制限。そ
  して、10日間の開発停止でアプリが停止し、30日間の活
  動停止でサービスが削除される。これらの制限は実際の開発
  において、どれほどの障壁となるのか。また、無料化におけ
  る社会的な意義や今後、どんな可能性を秘めているのか。
   川合氏は「ストーリーAI」と呼ばれる、物語における感
  情の動きをビジュアライズするAIの開発者。現在はアルゴ
  リズムの強化と商用化に向けたサービス開発を行っている。
   「私が開発するストーリーAIは、物語における感情の振
  れ幅と時間軸(X軸)と感情軸(Y軸)でビジュアライズし
  表現するものです。物語の登場人物たちがストーリー中にど
  のような感情を抱いているのかをテキストから理解し、物語
  の盛り上がりを判断するアルゴリズムをつくりました」。
                  https://ibm.co/2lcG7ad
  ───────────────────────────

宮内謙ソフトバンク社長兼CEO.jpg
宮内謙ソフトバンク社長兼CEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月18日

●「3つの『認識』は可能になるのか」(EJ第4787号)

 現代のAI(人工知能)は、ニューラルネットワークのディー
プラーニングが主流になっています。このディープラーニングは
「革命」といわれます。なぜ、革命なのでしょうか。それは、次
の3つのことが可能になりつつあるからです。
─────────────────────────────
        1.3つの認識が可能になる
        2.運動ができるようになる
        3.言語の意味が理解できる
─────────────────────────────
 上記「1」の「3つの認識」とは何でしょうか。1つは「画像
認識」、2つは「文字認識」、3つは「音声認識」です。ひとつ
ずつどこまでできるようになっているか考えることにします。
 「画像認識」については、これまでは悪戦苦闘していたのです
が、「グーグルの猫」が認識できるようになり、AIは明らかに
ブレークスルーを成し遂げたのです。画像を認識するということ
は、その特徴点を見分けるということです。猫を見分けるために
動画から取り込んだ1000万枚の画像を解析し、1000台も
のコンピュータで3日かけて学習し、やっと認識したのです。
 画像認識がうまくいけば、「文字認識」と「音声認識」はクリ
アできるのです。実際に現在のAIは、まだ課題はあるものの、
文字認識も音声認識もできるようになりつつあります。
 上記「2」の「運動ができるようになる」は、ロボットの開発
に応用され、少しずつ実現しつつあります。これには、自動運転
車の問題も含みます。自動運転車は現在進んでいるように見えま
すが、まだまだ多くの難題を抱えています。
 上記「3」の「言語の意味が理解できる」は、翻訳や通訳に応
用できますが、実はこれが一番難しいのです。ペッパーなどのロ
ボットは、人の言葉を理解し、それに対応した行動をとりつつあ
るように見えますが、ペッパーは相手の声と自分が発する声の見
分けがつかないのです。そのため、ペッパーなどのコミュニケー
ションロボットは、自分が話すときは、マイクはオフになってい
るのです。なぜなら、ロボットは自分が話す音を認識してしまう
と、それに対しても答えようとする無限ループに陥ってしまうか
らです。そのため、ロボットが話すときは、マイクは自動的にオ
フになります。
 「ディープマインド」という英国の人工知能企業があります。
2010年にディープマインドテクノロジーとして起業されたの
ですが、2014年にグーグルに買収され、ディープマインド社
になったのです。
 このディープマインド社が開発したのが、碁のAIアルゴリズ
ム「アルファ碁」です。2016年3月、「アルファ碁」は、世
界トップレベルの韓国のイ・セドル九段に4勝1敗で勝利し、世
界的に有名になります。
 このディープマインド社のCEOであるデミス・ハサビス氏は
ゲームの世界では、「DQN」という汎用学習アルゴリズムの天
才的開発者として知られています。
─────────────────────────────
             「DQN」
           Deep Q-Network
 DQNは画像認識に多く用いられる深層学習と強化学習(Q学
習)を組み合わせたアルゴリズムにより動作し、ゲームのルール
を教えていない場合でも、どのように操作すれば高得点を目指す
ことができるのかを判断することができる。
        ──ウィキペディア https://bit.ly/2ina8Ef
─────────────────────────────
 「DQN」は、どのようなゲームにも適用できる画期的な汎用
学習アルゴリズムで、ゲーム画面の出力信号と「高いスコアを出
せ」という指令のみで動くといわれます。つまり、「高得点を出
せ」と命令すると、得点を上げるメカニズムを超スピードで学習
し、そういう結果を出してくるのです。
 DQNは、49種類のゲーム中、43種類で従来のAIによる
得点を上回り、29のゲームでは、プロゲーマーと同等またはそ
れ以上のパフォーマンスをみせたといわれます。
 ディープマインド社は、このDQNをベースに「アルファ碁」
を開発したのです。「アルファ碁」は、イ・セドル九段を破った
ことで、「名誉九段」の称号が与えられていますが、その後につ
いて次の話があります。
 韓国に「東洋囲碁」というインターネット囲碁サイトがありま
す。2016年12月29日から31日にかけて、その囲碁サイ
トに「マジスター/Magister」というIDの棋士が現れ、世界ラ
ンクトップの中国のケ・ジェ九段や韓国ランキング1位のパク・
ジョンファン九段など、世界トップ級の棋士と対局しています。
結果は30戦全勝です。
 2017年1月1日から5日にかけて、中国で韓国と同じよう
なことが起きたのです。中国の囲碁サイト「野狐囲碁」に「マス
ター/Master」と名乗るID棋士が現れ、世界トップ級棋士とさ
らに30戦戦い、全勝しています。韓国の「東洋囲碁」と中国の
「野狐囲碁」の戦績を合わせると、60戦60勝、勝率100%
ということになります。
 実は、デミス・ハサビ氏は、マジスターIDもマスターIDも
「アルファ碁」の進化型であることを明かしています。今後の公
式戦に備えて、テストを行ったのです。もはや囲碁とか将棋の世
界では、AIに人は勝てないといっても過言ではないようです。
 しかし、将棋にしても囲碁にしても、すべての情報が開示され
ているゲームです。しかし、ポーカーや麻雀などは、相手の手は
隠されていてわからないゲームです。そういうゲームで、AIが
勝利を収めたという話はありません。したがって、AIによって
すべてのゲームが支配されたということにはならないのです。し
かし、ビジネスというゲームには、AIは無限の活用の余地があ
ります。      ──[次世代テクノロジー論U/031]

≪画像および関連情報≫
 ●囲碁の最強人工知能「アルファ碁」の仕組みとは?
  ───────────────────────────
   2017年5月27日、人類最強の呼び声が高い棋士ケ・
  ジェにグーグル社傘下のイギリスの人工知能企業のディープ
  マインド社が開発する「アルファ碁」が勝利しました。
   27日の対局に先立ち23日、25日にも「アルファ碁」
  はケ・ジェを相手に勝利し、ケ・ジェは人工知能を相手にま
  さかの全敗を喫したのです。囲碁は元々、AI(人工知能)
  にとって、もっとも難しいゲームの一つとされていました。
  最強棋士を破る囲碁AIは、どのようにして、生まれたので
  しょうか?
   2015年10月、碁のヨーロッパ王者であるファン・フ
  イ2段に5戦5勝を収め、続く2016年3月には、21年
  間のプロキャリアで18回に渡って世界王者になった経歴を
  持つイ・セドル9段に4勝1敗で勝利しました。
   敗北はとてもハードなことだった。アルファ碁と対局する
  前は、僕は「きっと勝てるだろう」と考えていた。最初の対
  局の後には戦術を変えて挑んだのだけど、それでも負けてし
  まった。人間には時に大きなミスをするという問題がある。
  なぜなら、僕たちは人間だからだ。時には僕たちは疲れてい
  るし、時には「何が何でもゲームに勝ちたい」と望んで、大
  きなプレッシャーを感じる。でも、プログラムはそうじゃな
  い。まるで壁のようにプログラムはとても強く、安定してい
  る。この違いは、僕にとってはとても大きなものなんだ。僕
  はアルファ碁がコンピューターであることを元々知っていた
  けれど、もしも誰一人としてその事実を僕に伝えていなかっ
  たら、僕は対局相手のことを少々奇妙だがとても強い本物の
  人間のプレイヤーだと感じただろうね。
                  https://bit.ly/2tfyKlI
  ───────────────────────────

中国最強棋士と対局する「アルファ碁」.jpg
中国最強棋士と対局する「アルファ碁」
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月19日

●「人工知能最大の難問フレーム問題」(EJ第4788号)

 ディープラーニング革命によって、AI(人工知能)に関わる
難問が次々と解決されています。画像認識、文字認識、音声認識
などが急速にクリアされています。しかし、AIには根本的に解
決できない難問があります。それは「フレーム問題」です。
 フレーム問題とは何か──これは基本的に人間と機械の違いに
直面する難しい問題です。まずは、フレーム問題とは何かについ
て、雑賀美明氏の著書から引用します。
─────────────────────────────
 フレーム問題というのもあります。
 これは、1969年にジョン・マッカーシーとパトリック・ヘ
イズが指摘した人工知能研究の最大の難問です。今からしようと
していることに関係のある事柄だけを選び出すことが、実は非常
に難しいと言う問題です。周りの環境から、何が関係あって、何
が関係ないかを調べるために、無限の計算が必要になって人工知
能が止まってしまうことを「フレーム(枠)問題」と言います。
 人工知能は、チェスやオセロのような閉じられたルールの枠の
中では有効に働きますが、現実の世界のように開かれた世界に飛
び出すと、情報を処理しきれずに動きが停止してしまいます。コ
ンピュータには有限の処理能力しかないので、何も動作できずに
止まってしまうのです。    ──雑賀美明著/マルジュ社刊
      『人工知能×仮想現実の衝撃/第4次産業革命から
                  シンギュラリティまで』
─────────────────────────────
 フレーム問題について、身近の事件から探っていくことにしま
す。このところ新幹線でのトラブルが相次いでいます。6月9日
の新幹線「のぞみ265号」での乗客殺傷事件、これに続く14
日の「のぞみ176号」による人身事故など。とくに人身事故で
は、運転手はトンネル内で異音を聞いているのに、小動物である
と思ってそのことを運転指令に報告せず、列車を停止しなかった
のです。これは明らかに業務規則違反です。こんなことはあって
はならないことです。
 このケースとはまるで違いますが、車に乗っていてフロントガ
ラスに何かがぶつかったとします。そういうことはよくあること
です。小石が跳ねたかもしれないし、何らの虫がぶつかったかも
しれない。そういう場合、人間の運転者であれば、車を止めるこ
とはないはずです。人間なら、何がぶつかったか見当がつくし、
それが運転継続に支障をきたすことではないかわかるからです。
 ところが、この車がAIによる自動運転車であった場合、仮に
ぶつかったものが虫であっても、急停車するはずです。AIには
ぶつかったものが虫なのか、小石なのか、人なのかを判断できな
いからです。しかし走っているのですから、フロントガラスには
いろいろなものがぶつかりますが、そのたびに、車が止まってし
まったら、不便きわまりないことになります。
 このように、人間なら簡単にできることが、AIにはできない
し、逆に人間なら到底できないことが、AIなら短い時間で正確
に仕上げてしまうことが多いのです。このことは、フレーム問題
と関係があります。
 5月25日付/EJ第4771号で「マイシン」というエキス
パートシステムをご紹介しました。この「マイシン」について、
中島秀之東京大学大学院特任教授がフレーム問題との関連で、次
のように対談で述べています。
─────────────────────────────
――エキスパートシステムというのは、まるで人間のエキスパー
ト(専門家)のように、与えられた知識から推論して複雑な問題
を解くよう設計されたAIのことですね。医療系のエキスパート
システムだったマイシンは、伝染性の血液疾患の患者さんを診断
していたと聞いたことがあります。
中島:そうです。マイシンは、感染症の診断が、トップクラスの
   医者には負けるけれど、人間のインターンよりは優れてい
   ました。さまざまな医学知識を取り込んで、いろんな推論
   を展開するのは、AIの得意分野です。ところが、マイシ
   ンのようなAIは、一部の例外を除いて、結局、実用化さ
   れませんでした。
――なぜですか?
中島:大きな理由の1つは、感染症を調べるためにいろいろ検査
   するとき、「子どもに注射を打つ検査をあんまりやると、
   痛がるからだめだよ」という知識が、医学書には書いてい
   なかったからです。
――つまり、マイシンは、検査に必要となれば、子どもにも注射
をバンバン打つよう指示してしまったわけですね?
中島:そうです。「子どもが注射を嫌う」というのは、人にとっ
   ては常識です。しかし、AIであるマイシンには、わから
   ない。じゃあ、AIに読ませる医学書に「子どもは注射が
   嫌い」と書けば済むのかというと、そういう常識の類は、
   ほかにもいっぱいあるわけです。
                  https://nkbp.jp/2JYiG2m
─────────────────────────────
 「マイシン」というエキスパーシステムには、感染症の検査に
必要な医学知識やノウハウはすべて入れてあるのですが、医師は
それだけで診断するわけではありません。それに人間であれば誰
でも持っている「常識」に基づいて診断を下すのですが、AIは
それを持っていないのです。
 それなら、それらの「常識」をAIに与えればよいということ
にはならないのです。人間の持っている知識は、驚くほど多く、
人間自身も自分がどれだけの知識や情報を持っているか意識して
おらず、人間はそれらを基にして総合的に判断を下しているので
す。そういう知識をAIに学習させることは困難です。こういう
ことから、フレーム問題は起きてくるのです。これについては、
明日のEJでももっと詳しく取り上げて考えてみます。
          ──[次世代テクノロジー論U/032]

≪画像および関連情報≫
 ●人工知能の大半は、ないものを「ない」と認識できない
  ───────────────────────────
   例えば、会社の歓迎会で花見を開催したとしましょう。ブ
  ルーシートに並べられた缶ビールを見て、「どうしてキリン
  ビールはないの?」「私はよなよなエールが好きなのに」と
  文句を言われた経験はありませんか?一見、自然な会話に見
  えますが、人工知能にこれを言わせようとすると非常に大変
  です。
   まず、日本で販売されている全ての缶ビールを学習させた
  (覚えさせた)上で、目の前に置かれた缶ビールのラベルを
  1つ1つ認識させれば、どのビールがあって、どのビールが
  ないかが分かります。しかし、重み付けなどを行って1つだ
  けを選ばせるといった制御をしない限り、「キリンビールが
  ない」とは言わずに、そこにないビールを全て列挙すること
  になるでしょう。
   その人工知能が「花見で買ってきていないビールすぐ認識
  する君」のような超特化型のAIならよいですが、人間のよ
  うな汎用的思考を持った、いわゆる「汎用人工知能」が認識
  しようとすると、実現性は一気に低くなります。日々新たな
  商品が生まれる、全ての缶ビールを学習させるなど事実上不
  可能だからです。これがもし、ハイボールや缶酎ハイも加え
  ることになったら・・・と考えればキリがありません。
                  https://bit.ly/2JUkHJt
  ───────────────────────────

中島秀之東京大学大学院特任教授.jpg
中島秀之東京大学大学院特任教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
RDF Site Summary