2018年06月01日

●「AIとウェブサイトの関係に迫る」(EJ第4776号)

 AI(人工知能)の歴史を簡単に振り返っています。初期のA
I(1950年代)は、コンピュータの能力に過度の期待を抱い
て失敗し、1度目の「AIの冬」に突入します。人間が何気なく
やっていることが、機械にとっては途方もなく難しいことである
ことがやっとわかったのです。
 ところが、時代とともに、コンピュータの性能が向上してくる
と、再びAIは復活します。論理(ロジック)のはっきりしてい
る分野に絞って、人間がその分野の専門家の知識をコンピュータ
に与えることによって「エキスパートシステム」を構築し、役立
てることはできないかと考えるようになります。1980年代の
「ルールベースのAI」です。この時期から、日本はAIに積極
的に参入するのです。
 しかし、肝心のことが大問題だったのです。それは、知識を機
械に与えることです。機械からみれば「知識の獲得」です。人間
の子供であれば、知識を自律的に学び取り、成長していきますが
コンピュータは自律的に学ぶことはできず、何から何まで人間が
コンピュータに知識を与えるしかなかったからです。
 それに、人間の持つ知識は想像以上に多く、しかも知識はどん
どん増えるので人間が与える知識には限界があります。かくして
エキスパートシステムという名の「ルールベースのAI」は破綻
し、AIは2度目の「AIの冬」に突入します。このとき、ほと
んどの人は「AIはこれでもう終わりだな」と思ったものです。
 次にUCLAのジュディア・パール氏が主導する統計確率的理
論を導入したAI手法が登場します。これは、エキスパートシス
テムの精度を向上させるのに貢献したことは確かです。しかし、
これも確率自体が「大数の法則」によって支配されるものであり
そういう肝心な大量のデータを欠いていることから、あくまで研
究レベルの状態に止まっていたのです。
 しかし、2000年代に入ると、ある「奇跡」が起きます。こ
れによってAIは息を吹き返すのです。この奇跡について、AI
に関する著作の多い小林雅一氏は次のように述べています。
─────────────────────────────
 それはまるで、神が仕組んだかのように絶好のタイミングでし
た。1990年代後半から2000年代にかけて、インターネッ
ト、もっと具体的には、その上に構築されたワールド・ワイド・
ウェブ上に世界中の人たちが情報を載せるようになりました。こ
の結果、様々な文書を中心とする大量のデータが蓄積され、しか
も誰もが自由にアクセスできるようになりました。つまり統計・
確率的なべイジアン・ネットワークを実践するお膳立てが整った
のです。                  ──小林雅一著
 『クラウドからAIへ/アップル、グーグル、フェイスブック
                の次なる主戦場』/朝日新書
─────────────────────────────
 ネット上には、AIとインターネットの関係について述べてい
る論文やレポートはほとんどありませんが、小林雅一氏のいう通
り、昨今のAIの驚くべき発展は、インターネットと無関係では
ないと思います。
 この世界中に張り巡らされたインターネットというインフラの
上に築かれた膨大な数のウェブサイトは、日々更新され、サイト
の数は増えつつあります。世界中のウェブサイトの数は、どのく
らいあるのでしょうか。
 諸説がありますが、ウェブサイトとしては約3億サイトぐらい
であり、ページ(URL)という単位で見ると、グーグルによる
と次の通りです。グーグルは、ロボットを使ってウェブページを
探しているので、その数は正確であると思われます。
─────────────────────────────
           1,000,000,000,000
          ゼロが12個で1兆
                  https://bit.ly/2ststCw
─────────────────────────────
 エキスパートシステムに代表される「ルールベースのAI」に
関わった人たちにとって、コンピュータが知識を獲得するとき不
可欠な「知識ベース」の構築は非常に困難な作業であるうえ、ま
してその内容の頻繁な更新は不可能です。
 しかし、ウェブサイトは、日々更新され、記述されている内容
は、あらゆる分野に及んでおり、その数も増えています。しかも
サイトの情報は、コンピュータが読める知識ベースになっている
のです。もちろん、ウェブサイトの情報が正しいとは限りません
が、サイトの内容の正誤については、現在のコンピュータで十分
判断できます。
 現在のAIは、自然言語処理の能力が大幅に向上しています。
スマホで次のように音声で話しかけてみてください。
─────────────────────────────
    近くに雰囲気の良いレストランはありませんか
─────────────────────────────
 そうすると、スマホはGPSによって現在地を確認し、ウェブ
サイトで近くのレストランを検索して、現在地に近いレストラン
を複数探し出し、その店のウェブサイトをスマホに表示してくれ
ます。こんなことは、ごく当たり前のように多くの人がやってい
ますが、これはとんでもなく凄いことをやっているのです。
 現在では、ほとんどのレストランは、ウェブサイトを出してい
ます。これがすべての大前提です。それに、すべてのスマホには
GPSが搭載されており、スマホの現在地をつねに把握していま
す。これらのことがすべて揃わないと、上記のような検索はでき
ないのです。ウェブサイトの存在がいかに重要であるかがわかる
と思います。
 このように、3億を超えるウェブサイトが、現在のAIを支え
ています。そしてこれがAIの「機械学習」に結び付くことにな
るのです。ウェブサイトの出現は、AI開発者にとってまさに奇
跡です。      ──[次世代テクノロジー論U/020]

≪画像および関連情報≫
 ●AIの原点を探る/青山学院大学美添教授
  ───────────────────────────
  ――具体的にはどういうことでしょうか。
  A:ベイズ統計にもいろいろありますが、いずれも、解析に
  「主観確率」(判断確率)という概念を採用しています。古
  典統計学では、未知でも確率は固定・客観的数値です。ベイ
  ズ統計では、確率は意思決定者の持つ情報を反映して変化す
  ることがあります。
  ――確率を後から恣意的に変えられ、それがAI機械学習の
  基礎原理になっている?
  A:恣意的に確率を変更するというのは、ベイズ統計の誤解
  されやすい部分です。ベイズ流に厳密に構成された主観確率
  は、人間は合理的判断をするという原理(公理体系)に基づ
  いた理論で、不確実性に直面しても「自分の効用関数を最大
  化するように意思決定を行う」というものです。当然、人に
  よって効用関数は異なります。しかし効用が最大になるよう
  に意思決定を行うという結論が導かれます。これが、ベイズ
  統計の原理です。そして、これが重要ですが、意思決定の根
  拠情報が追加的に与えられれば、それにより、主観確率は合
  理的手順で修正されます。この手順が「ベイズの公式」と呼
  ばれる形式です(解説参照)。
  ――機械学習の基礎になるということですね。
  A:大雑把にいえばそうで、機械学習では、ベイズの定理を
  利用して判断を修正します。ただし原理的なベイズ統計には
  あまり関心はなく、経験的に有効だから利用するようです。
  ハーバード時代の私の恩師たちが聞いたら、嘆くと思います
  ね。               https://bit.ly/2J3YZC
  ───────────────────────────

小林雅一氏.jpg
小林雅一氏
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月04日

●「AI導入によるグーグル検索技術」(EJ第4777号)

 元グーグルのCEOのエリック・シュミット氏は、次のような
ことをいっています。
─────────────────────────────
 文明の始まりから21世紀初頭までに生産された情報量は、約
5エクサ・バイト(エクサは10の18乗)だが、これと同じ情
報量が現代社会では、たった2日間で生産される。
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 「エクサ」といってもピンとこないと思います。百万を意味す
る「メガ」、10億を意味する「ギガ」までは誰でも知っていま
すが、その先は、「テラ」(兆)「ペタ」(千兆)ときて、次が
「エクサ」(百京)になります。
 このように、現在、ウェブ上の情報が加速度的に増加している
のです。グーグルは基本的には検索エンジンの会社ですが、この
ような情報の爆発的増加は、検索というものを一段と困難にしま
す。それは、本当に探したい情報以外のノイズが、劇的に増える
ことを意味するからです。たとえると、今までは砂場に落ちた指
輪を探す程度だったものが、現在では、砂漠に落ちた指輪を探す
レベルに検索困難度が上昇してしているのです。
 そこでグーグルは、検索エンジンにAIを導入し、人間の要求
するウェブサイトを、高速で、一発検索することに成功したので
す。これを「セマンティック検索」といっています。それは日々
その精度を増しつつあります。
 グーグルは、いわゆる知識を人間がコンピュータに与えている
限り、AI開発の意味はないと考えていたのです。すべての機械
は、人間を単純な繰り返し作業、マニュアル・レーバーから解放
し、ラクをさせることに目的があります。そのためには、何とか
コンピュータが、自動的に学習して知識量を増やし、それをベー
スに判断させることができないかと工夫したのです。その結果、
できたのが「ナレッジグラフ」という知識ベースです。このグー
グルのセマンティック検索について、小林雅一氏は、次のように
解説しています。機械が学習するプロセスがよくわかります。
─────────────────────────────
 グーグルのセマンティック検索では、そのシステムが自動的に
ナレッジ・グラフ(知識ベース)を構築していきます。グーグル
の機械学習システムは、ウェブ上にある無数のホームページを読
み漁り、それらを統計的に分析することによって得た知識を、あ
る種の知識体系の上にマッピングしていきます。たとえば、「東
京」というのは90%の確率で地名らしい。「日本」というのは
95%の確率で国名らしい。そして「東京」は85%の確率で日
本の首都らしい。(中略)システムはこれらの確率事象を照合し
それらが互いに矛盾していないことを確認します。このようにし
て作られる「知識の関係」リストがオントロジーで、それらが大
量に積みあがったものが知識ベース、つまりナレッジ・グラフな
のです。            ──小林雅一著の前掲書より
─────────────────────────────
 上記にある「オントロジー」とは、エキスパートシステムの世
界で使われる概念で「知識の表現」に当たります。対象世界にか
かわる諸概念を整理して体系づけ,コンピュータにも理解可能な
形式で記述したものをいいます。
 2回目の「AIの冬」の後、ベイズ理論をベースとする統計確
率的AIが発展します。その創始者のジュディア・パール氏の弟
子たちの多くは、グーグルをはじめとするシリコンバレーの企業
に入社し、AIの発展に貢献しています。なかでもグーグルに入
社した統計学を専門とする研究者は、セマンティック検索や機械
翻訳の分野でも活躍をします。
 グーグルの機械翻訳チームは、ウェブ上から、オリジナルの文
書とそれが別の言語の訳文の文書のペア──たとえば、英語の原
文とフランス語の訳文など──をかき集め、それをグーグルの強
力なサーバー・コンピュータに読み込ませて、知識ベースを構築
したのです。これは、比較的簡単な作業です。
 これは、コンピュータにとって、自学自習用のテキストになり
ます。コンピュータは原書と訳文を突き合わせて、ベイズ理論に
基づく推論をし、たとえば、上記の例であれば、英文を与えると
フランス語に翻訳するし、フランス語から英訳も、ほぼ正確にこ
なしたのです。ここで重要なことは、推論型AIが重視した文法
や構文を完全に無視したことです。これによってさらに精度が向
上し、ウェブサイト上の翻訳として使われています。
 英語を日本語に訳すのは、まだそこそこではあるものの、精度
は確実に向上しています。このグーグルの機械翻訳の技術の凄さ
については、小林雅一氏の次のエピソードによって、十分証明さ
れると思います。
─────────────────────────────
 アメリカ国立標準技術研究所(NIST)が数年に一度主催す
る機械翻訳のコンテストがあります。そこには毎回、全米の著名
な大学や研究機関の機械翻訳チームが参加していましたが、20
05年に初めてグーグルが参戦しました。他のチームが、中国語
やアラビア語などの専門家を必ずメンバーに入れていたのに対し
グーグルの機械翻訳チームにはそうした言語学者は一人もいませ
んでした。グーグル・チームは統計の専門家だけで固められてい
たのです。そして驚くべきことに、世界各国の言語に関しては全
く無知のグーグル・チームが、機械翻訳の分野で何十年という経
験を持つ他のチームを圧倒したのです。これは統計・確率的なA
Iが、文法などルール・ベースのAIに勝利を収めた瞬間として
専門家の問で語り草になつています。
                ──小林雅一著の前掲書より
─────────────────────────────
          ──[次世代テクノロジー論U/021]

≪画像および関連情報≫
 ●自動翻訳なぜ急速進化/2つのブレークスルー
  ───────────────────────────
   コンピューターで外国語を翻訳する機械翻訳(自動翻訳)
  技術が、長足の進歩を遂げている。人工知能(AI)技術を
  採用したことで翻訳精度が向上、最新の翻訳システムを組み
  込んだ音声翻訳などの製品やサービスが、続々と登場してい
  る。通訳なしで外国人と相当なレベルのコミュニケーション
  ができる時代が確実に近づいている。
   ディスプレーに現れた外国人が英語でスピーチを始める。
  話を追いかけるように画面下に映画の字幕のような英文が表
  示され、その下にこれを翻訳した日本語の字幕が表れる。情
  報通信研究機構(NICT)が開発中の、「同時通訳システ
  ム」のプロトタイプ。会議などで将来、同時通訳の代わりに
  使うことを想定している。
   話者の英語の音声を認識して文章を書き起こすシステムと
  英語の文章を和訳するシステムを組み合わせた。「どのくら
  いの長さで切って翻訳するかで、使い勝手や翻訳の精度も変
  わる。今後5年くらいで完成したい」。NICTの隅田英一
  郎・先進的翻訳技術研究室長は説明する。NICTはこれに
  先立ち、富士通と共同で日本人医師と外国人の患者が、タブ
  レットをはさんで会話ができる医療向けの多言語音声翻訳シ
  ステムを開発した。医師が「体調が悪いのは、いつからです
  か」などと話しかけると、タブレットから翻訳された音声が
  流れ、患者の答えを日本語にして返してくれる。
                  https://bit.ly/2J572Da
  ───────────────────────────

エリック・シュミット元グーグルCEO.jpg
エリック・シュミット元グーグルCEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月05日

●「人工脳『パーセプトロン』の理論」(EJ第4778号)

 現在のAI(人工知能)の中心は「ディープラーニング(深層
学習)」です。そのディープラーニングが何であり、どのように
役立つのかを知るためには、どうしてそこにいたったのか、AI
の歴史を知る必要があります。新しい技術を理解するには、その
技術が生まれた背景を知ることが不可欠だと考えています。
 グーグルは、検索精度の向上を図るため、「セマンティック検
索」の実現を目指し、その結果、自動的に作り出された「ナレッ
ジ・グラフ(知識ベース)」によって、検索の精度の大幅向上に
成功しています。これは、統計確率的AIの精度の向上に寄与し
たことになりますが、このナレッジグラフにストックされた知識
の件数は、2012年の時点で実に6億件を超えています。
 このナレッジグラフの構築作業は、グーグル開発による機械学
習プログラムによって日夜休むことなく続けられ、それは単に検
索精度の向上のみならず、機械翻訳など、AI全体の精度の向上
に貢献しつつあります。現在、グーグルがAIにおいて主導権を
握りつつあるのは、このナレッジグラフの存在と無関係ではない
といえます。
 しかし、1950年代から「ルールベースのAI」の実現を目
指してきた古典的AI派の学者や研究者たちは、統計確率的AI
の研究者たちに対して、次の疑問を突き付けています。
─────────────────────────────
 しかし、我々にも言いたいことがある。君達のように統計、確
率に従うAIは、人間の思考プロセスと明らかに別種のものだ。
そのような方法で、いずれ人間の知能や知性をコンピュータ上に
再現できると本気で信じているのか?つまり、今は結果を出して
いるからいいが、その先に未来はあるのか?
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 確かに統計確率知的AIは、ウェブサイトの検索や機械翻訳な
どの精度を大きく向上させたものの、それは、AIの一里塚に過
ぎないのです。このような状況の下で浮上してきたたのが「ニュ
ーラルネットワーク」です。最近この言葉をよく聞きますが、ニ
ューラルネットワークとは何でしょうか。これを真正面から取り
上げると、複雑な数式の世界に入ってしまうので、それを避けて
なるべく簡単な説明を試みます。
 ニューラルネットワーク(以下、NN)とは、機械学習や神経
科学などの分野で扱われる計算モデルの一種といってよいでしょ
う。この名前から想像されるように、脳の神経回路から知見を得
たモデルであり、「ニューロン」と呼ばれる最小の計算単位を、
ネットワーク状につなげた構成をしています。現在、話題になっ
ている「ディープラーニング」は、このNNを利用しています。
はっきりしていることは、NNは、機械学習の一分野であるとい
うことです。
 NNというと、ごく最近の技術のように思うかもしれませんが
大変長い歴史があります。そもそもAIの研究は、1956年の
ダートマス会議からはじまったのですが、その次の年である19
57年に「パーセプトロン」というシステムの概念が話題になっ
たのです。これは、米国のコンピュータ科学者であるフランク・
ローゼンプラットという学者が考案した概念です。
 簡単にいうと、人間の視覚と脳の機能をモデル化したもので、
それでいて、パターン認識を行い、シンプルなネットワークであ
りながら、自力で学習する能力を持つという理論です。
 この「パーセプトロン」についてネットで調べると、いずれも
数式を使った非常に難しい解説が出てきます。そこで、ここでも
分かりやすい小林雅一氏の解説を引用します。
─────────────────────────────
 パーセプトロンは、脳内におけるニューロンとシナプスによる
信号伝達メカニズムを極度に単純化したシステムでしたが、それ
でも幾つかの基本的な図形、たとえば三角形と四角形の違いを学
習し、それらを分類することができました。このように、コンピ
ュータが自力で学習することのインパクトは大きく、当時の米国
では『ニューヨーカー』のような知識人向けの一流雑誌が、「こ
れが今後進化すれば、いずれは人間のように感じ、記憶し、考え
る機械が生まれるだろう」と激賞するほどでした。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、パーセプトロンは、コンピュータに図形を認識させよ
うとしたのです。今日でいうところのNN、すなわち、ニューラ
ルネットワークの原型になるような先進的な理論であったという
ことができます。
 ところが、このパーセプトロン理論に対して、ダートマス会議
のメンバーの一人であるマービン・ミンスキー氏と南アフリカ生
まれの数学者、シーモア・パパート氏の2人は、次の論文を書い
て、この理論の限界を指摘したのです。
─────────────────────────────
     マービン・ミンスキー/シーモア・パパート共著
  『パーセプトロン/計算機科学への序論』/1969年
─────────────────────────────
 この論文では、パーセプトロンには致命的な欠陥があり、この
理論では、今後どのように改良しても限界があることを指摘して
います。実は、ミンスキー氏らとしては、パーセプトロンに反論
したのではなく、問題点を指摘しただけなのですが、それでもこ
の2人の学者の指摘は正鵠を射ており、これによってパーセプト
ロンに対する世間の期待は一気にしぼんでしまったのです。
 このときから実に20年以上の歳月を経て、パーセプトロン理
論ではない別の考え方に基づくパーセプトロンのネックを解決す
る新理論が提案されたのです。それがNN、ニューラルネットワ
ークです。     ──[次世代テクノロジー論U/022]

≪画像および関連情報≫
 ●人工知能「冬の時代」が到来/牧野武文氏
  ───────────────────────────
   1963年に、ミンスキーは、シーモア・パパートと知り
  合った。この南アフリカ生まれの数学者は、数学の学士号を
  とるためにイギリスのケンブリッジ大学で学んでいた。その
  ときにパーセプトロンに興味をもったが、パーセプトロンの
  機能については、ミンスキーを同じように限定的なものでは
  ないかという疑いを持った。
   パパートが、MITを訪れ、ミンスキーと面会すると、二
  人の考えはたちまち一致した。パーセプトロンがあまりに魅
  力的に見えすぎるため、人工知能研究者が誤った道に進もう
  としている。パーセプトロンを追求しても、それは袋小路に
  なっているのだ(現在のディープラーニングの基礎となって
  いるのもパーセプトロンだが、それには飛躍的な進化が必要
  だった)。
   パパートは、MITの数学科の教職を得て、さらにミンス
  キーのAI研の研究員となることで、ミンスキーといっしょ
  にパーセプトロンの限界を探る研究を始めた。パパートとと
  もに導きだした結論は、パーセプトロンは線形分離可能な問
  題しか学習できないということだった。線形分離可能という
  は、直線で集団をわけることができるような事象のことだ。
                  https://bit.ly/2J9EuZj
  ───────────────────────────

フランク・ローゼンブラット氏/パーセプトロン.jpg
フランク・ローゼンブラット氏/パーセプトロン
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月06日

●「パーセプトロン/その正体を知る」(EJ第4779号)

 「パーセプトロン」──AIの話をするときは、必ず出てくる
キーワードです。パーセプトロンについては、もう少し書く必要
があります。不明な点がたくさんあるからです。
 実はAI(人工知能)の研究は、「ルールベースのAI」から
始まったわけではないのです。最初はコンピュータで何とか「人
工の脳」を作ろうとしたのです。
 1943年のことです。米国の神経生理学者のウォーレン・マ
カロック氏と論理学者のウォルター・ピッツ氏が、共同で次の論
文を発表したのです。
─────────────────────────────
    ウォーレン・マカロック/ウォルター・ピッツ著
      『神経活動に内在するアイデアの論理演算』
                     1943年
─────────────────────────────
 人間の脳は、ニューロンという神経細胞が複雑に絡み合い、全
体でネットワークを形成しています。これが、神経回路網、すな
わち、ニューラルネットワークです。
 マカロックとピッツ両氏は、基本単位であるニューロンの振る
舞いを「ステップ関数」と呼び、それを数式によって表現したも
のを「形式ニューロン」と呼んだのです。つまり、数学モデルの
話なのです。しかし、これはシステムにはなっていません。
 この先駆的研究を引き継いだのが、コンピュータ科学者のフラ
ンク・ローゼンブラット氏です。彼はこの形式ニューロンを複数
組み合わせて、情報の入力層と出力層から成るきわめてシンプル
な人工的ニューラルネットを開発し、「パーセプトロン」と名付
けたのです。
 上記のように、この形式ニューロンは数式であり、それを組み
合わせたニューラルネットも数学的な産物です。しかし情報の入
力層と出力層を持っているので、一応システムになっています。
何らかの情報を入力し、計算結果として出力情報を得ることがで
きるからです。したがって、パーセプトロンとは、そういうこと
ができるハードウェアではなく、ソフトウェア的な数学モデルで
あるということができます。
 このパーセプトロンがマービン・ミンスキー氏とシーモア・パ
パート氏によって否定されたことは昨日のEJでふれましたが、
具体的には次のようにいったのです。
─────────────────────────────
 パーセプトロンは、原理的、かつ致命的な問題を抱えているた
め、いくつかの単純な論理計算、たとえば、排他的論理和をコン
ピュータ上に実現できない。    ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 ここでいう「排他的論理和」とは何でしょうか。
 Aという円とBという円が一部重なっているとします。その重
なった部分は、AでもありBでもある部分ですが、その部分を排
除するというのが排他的論理和です。集合の問題です。これを小
林雅一氏は、次のようにわかりやすく説明しています。
─────────────────────────────
 「排他的論理和」とは・・・
 たとえば、母親が小さな子供に向って、「チョコかプリンのど
ちらかは食べていいけど両方は駄目よ」と言うようなものです。
                ──小林雅一著の前掲書より
─────────────────────────────
 つまり、小さい子供でもわかる「排他的論理和」ですが、パー
セプトロンにはわからないということで、パーセプトロンの信用
は失墜したのです。
 しかし、今になって考えてみると、この単純な人工脳パーセプ
トロンがベースになり、ニューラルネットワークとして、AIは
息を吹き返したのです。2006年頃のことです。その立役者は
英国のコンピュータ科学者、ジェフリー・ヒントン氏です。彼こ
そ「ディープラーニング」の命名者です。AIは、人工脳への挑
戦にはじまり、50年以上の年月を重ねて再び脳の研究に戻った
のです。ここまでのAIの歴史を辿ると次の4段階になります。
─────────────────────────────
    1.パーセプトロンAI ・・ 1950年代
    2.ルールベースのAI ・・ 1980年代
    3.統計・確率的なAI ・・ 1990年代
    4.脳科学に基づくAI ・・ 2000年代
─────────────────────────────
 最初は、何とか人間の脳を人工的に作り出したいと考えたので
す。その結果、パーセプトロンが考案されます。これによって世
の中は一時騒然となったのです。しかし、それが小さい子供の脳
にすら、はるかに及ばないとわかって、多くの投資家は資金を引
き上げ、1回目の「AIの冬」に突入します。
 続いて、高性能コンピュータの開発を前提として、コンピュー
タに多くの知識を与えることによって、推論により人間の脳を模
倣する「エキスパートシステム」ブームになります。「ルールベ
ースのAI」の時代です。
 しかし、やがて、コンピュータに知識を与えること(知識の獲
得)の困難性が露呈します。人間の持つ知識の多いことと、つね
に新しい知識が増えるので、知識の獲得が極めて困難であること
が明らかになり、AIは2回目の「AIの冬」に突入します。
 1990年から2000年にかけてインターネットが普及し、
ウェブサイトが激増します。それを知識ベースとして利用し、グ
ーグルの統計学エンジニアが中心になって「統計・確率的AI」
が台頭します。その結果、検索の精度が飛躍的に向上するととも
に、機械翻訳などの他のAIの精度も向上します。しかし、この
「統計・確率的なAI」の限界も明らかになり、再び人工脳の開
発が始まるのです。 ──[次世代テクノロジー論U/023]

≪画像および関連情報≫
 ●ベイジアンネットワーク/AIの歴史/後編
  ───────────────────────────
   ベイズ理論をベースにしたベイジアンネットワークは19
  80年頃に研究が始められました。これは統計・確率論的な
  アプローチによるAI技術です。
   ベイズ理論とは、観測を繰り返すごとに確率を修正して正
  解に近づけるという考え方であり、それをもとにしたベイジ
  アンネットワークは因果関係を確率で表現するグラフィカル
  モデルです。
   ある事象に対する原因の確率と結果の確率をノードとし、
  それらをエッジで繋いだ形で表現されます。観測によって得
  た新たな情報をベイジアンネットワークに投入するとそれぞ
  れの確率が変化し、その確率に基づいて推論を行います。ベ
  イジアンネットワークには原因から結果を推論することも、
  結果から原因を推論することも可能であるという特徴があり
  ます。ベイジアンネットワークはネットショップでのお勧め
  商品紹介、健康診断結果からの疑わしい病気の推定、スパム
  フィルタ、ウェブ侵入検知など、様々な分野での実用例があ
  ります。そして現在でも、ビッグデータ活用の手法の一つと
  して利用されています。
   統計・確率論的なAIに対しては、「統計と確率が基本に
  あるため、それは知性や知能ではない」という批判がありま
  す。膨大なデータの解析結果から単語の辞書的な意味を確率
  的に知ることはできるが、その単語の本当の意味を理解する
  ことはできません。人間の知能そのものを作るということを
  目的とした場合、統計・確率論的なAIはいつか限界に達す
  ると予想されます。       https://bit.ly/2HgYKlU
  ───────────────────────────

パーセプトロン理論.jpg
パーセプトロン理論
posted by 平野 浩 at 00:00| Comment(1) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月07日

●「ニューラルネットワークとは何か」(EJ第4780号)

 今日からは「脳科学に基づくAI」について、考えていくこと
にします。AI(人工知能)というのは、基本的には人間の脳の
働きと同じことをコンピュータに行わせるテクノロジーのことで
す。このような考え方に基づいてAIを定義すると、次のように
なります。
─────────────────────────────
 AI(人工機能)とは、インプットに対して、人間がするよ
 うなアウトプットを行う装置のことである。
─────────────────────────────
 コンピュータの性能が低い時代のAIは、少ない計算量で、人
間らしい振る舞いをさせる、たとえば、インプットに対するアウ
トプットの「ルール」を予め人間が決めておいたり(ルールベー
スのAI)、あるいは、インプットされた情報を統計確率的推論
によるアルゴリズムで精度の高いアウトプットを得る(統計・確
率的なAI)などが、これまで試みられてきています。
 しかし、インプットとアウトプットの間のブラックボックスの
部分を、人間自身がコンピュータに与えている限りにおいては、
いつまで経ってもAIが人間を超えるアウトプットを出せる存在
になることは困難です。コンピュータ自らが、自動的に知識を獲
得し、人間のように思考して、人間のようにアウトプットする存
在になって、はじめて人間を超えることができるのです。
 そうであるとすると、AIの研究は、原点に戻って人間の脳を
シミュレートする「脳科学に基づくAI」にならざるを得ないの
です。事実これまでのAIの歴史はそうなっています。
 仕事というものを人間がやれるかやれないかで分けて、AIと
の関係を考えてみます。
─────────────────────────────
       1.人間しかできなかったこと
       2.人間にはできなかったこと
─────────────────────────────
 本来AIやAIを組み込んだスマートマシンは、上記「2」の
「人間にはできなかったこと」を可能にし、結果として人間の能
力を拡張することを目的としています。
 たとえば、人間が一生かかっても参照できない量の学術文献や
判例などの法律文書をすべて読んで分析し、最適の解釈や判断を
示してくれたり、過去の犯罪記録の分析から犯罪の発生現場や内
容を予測し、それに基づいて指定された地域のパトロールを強化
することで検挙率を増やすことにより、犯罪の発生率を下げると
いったことなどが上げられます。
 これに対して、どんな強力なコンピュータでもAIでは処理で
きない上記「1」の「人間しかできなかったこと」はたくさんあ
ります。自動車の運転や企業における一般的事務作業、人との応
対業務や営業業務などがそれに当たります。AIでこれらを可能
にすることができれば、それらをAIに置換することによって、
人間の能力を効率化することができます。
 しかし、現代のAIは、上記「1」と「2」の両方ともできる
ようになりつつあります。これらのカギを握っているのが「脳科
学に基づくAI」の実現です。
 「脳科学に基づくAI」のニューラルネットワークとは何かに
ついて考えます。
 ニューラルネットワークは、神経回路網を意味する言葉で、人
間の知能をつかさどる脳を構造を模倣することで、その振る舞い
を再現しようとするタイプのAIです。科学ライターの大和哲氏
は、ニューラルネットワークを次のように定義しています。
─────────────────────────────
 ニューラルネットワークは、簡単に言うと、コンピュータ内で
データとして、インプットが入ってからアウトプットが出てくる
まで、その間に重みづけのグラフが構築されていて、「問題」と
して入力されたデータは、適切なルートを通って「回答」である
アウトプットを出力します。
 ここで言う“重み”とは、情報にとってどれだけ重要かを表し
た数値だと考えるといいでしょう。そして、ニューラルネットワ
ークの特徴は、このルートを通る間、情報がグラフ中の経路の重
み自体を、さらに軽くしたりあるいは重くしたりと、調整にも使
われる点です。つまりニューラルネットワークは、「経験から学
習する」人工知能であることが特徴のひとつです。
                  https://bit.ly/2xH3e5M
─────────────────────────────
 これだけではピンとこないと思いますが、脳科学に基づくAI
の構造は次のようなものです。初期のニューラルネットワークで
ある「パーセプトロン」には情報の入力層と出力層から成る2層
であったのに対し、現在のニューラルネットワークは、入力層と
出力層の間にいくつもの「隠れ層」といわれるものがある多層構
造になっているのです。これが「ディープ(深層)」といわれる
ゆえんです。
 多層にすると、入力層からインプットされた情報は、出力層か
らアウトプットされるまで、いくつもの隠れ層にインプットされ
何らかの処理をこ施されてアウトプットされることの繰り返しで
最終的に出力層からアウトプットされます。そのようにいくつも
の層を経過することによって、初期情報が何らかの上位概念を形
成していくと考えられるのです。
 人間の場合、目や耳から入力された情報がアウトプットされる
までの処理のプロセスはいわゆるブラックボックスであり、脳が
どのような処理を行ったかは不明です。これに対してこれまでの
AIは、インプットからアウトプットまでの推論プロセスは説明
できるのです。ブラックボックスではないのです。これでは人間
を超えることはできないのですが、ニューラルネットワークでは
その意思決定プロセスはわからなくなってきています。それだけ
現代のAIは、人間の脳に大きく近づいてきているといえます。
          ──[次世代テクノロジー論U/024]

≪画像および関連情報≫
 ●数学知識もいらないゼロからのニューラルネットワーク入門
  ───────────────────────────
   これまでに人工知能(AI)関連の記事を読んだことがあ
  る人であれば、ほぼ間違いなく”ニューラルネットワーク”
  という言葉を目にしたことがあるだろう。ニューラルネット
  ワークとは、大まかな人間の脳の仕組みを模したモデルで、
  与えられたデータを基に、新しい概念を学習することができ
  る。機械学習の一分野であるニューラルネットワークこそ、
  長く続いた”AI冬の時代”を終わらせ、新時代の幕開けを
  告げたテクノロジーなのだ。簡単に言えば、ニューラルネッ
  トワークは業界の根底を覆すような、現存するテクノロジー
  の中でもっともディスラプティブな存在だ。
   そんなニューラルネットワークに関するこの記事の目的は
  読者のみなさんがディープラーニングについて会話ができる
  ようになるくらいの理解を促すことにある。そのため、数学
  的な詳しい部分にまでは入らず、なるべく比喩や、アニメー
  ションを用いながらニューラルネットワークについて説明し
  ていきたい。
   AIという概念が誕生してからまだ間もない頃、パワフル
  なコンピューターにできるだけ多くの情報とその情報の理解
  の仕方を組み込めば、そのコンピューターが”考え”られる
  ようになるのでは、と思っている人たちがいた。IBMの有
  名な「ディープブルー」をはじめとするチェス用のコンピュ
  ーターはこのような考えを基に作られていた。
                  https://tcrn.ch/2Ja4UtU
  ───────────────────────────

ニューラルネットワーク.jpg
ニューラルネットワーク
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月08日

●「人間の脳について知る必要がある」(EJ第4781号)

 ニューラルネットワーク(NN)で注目すべき話題が小林雅一
氏の本に出ています。小林雅一氏は、KDDI総研リサーチフェ
ローです。AIの関連書籍のなかでは、数も多く、ダントツで分
かりやすい本であると思います。
 ある研究チームが、NNを使って機械翻訳システムを開発する
に当たり、手始めに英語と中国語を学習させたのです。これらの
2ヶ国語の語学力が一定のレベルに達した後で、今度はスペイン
語を学習させてみたところ、なぜか、中国語の語学力が一段と向
上したといいます。
 どうして、スペイン語を学習させると、中国語の語学力が向上
したのか、そのメカニズムは、そのシステムを開発したエンジニ
アもわかっていません。NNの神経回路網は複雑であり、その思
考回路については、開発エンジニアにとってブラックボックス化
しつつあります。それは、人間の思考回路に少しずつ近づいてい
ることを意味します。
 人間の「脳」をシミュレートする以上、人間の脳自体の研究が
必要になります。しかし、脳には現代の科学でもわかっていない
ことがまだたくさんあります。そのため、神経科学者たちはさま
ざまな実験を行っています。
 ある動物実験の話を紹介します。これも小林雅一氏の本からの
情報です。大脳には「聴覚野」と呼ばれる領域があります。これ
は、人間が耳からの音声情報を理解するための領域ですが、「視
覚野」と比べると、不明なことが多く、あまりよく解明されてい
ません。視覚野とは、大脳皮質における視覚に関する領域のこと
をいいます。
 ある神経科学者は、動物の耳から聴覚野へとつながる神経のラ
インを切断し、目から出ているラインを聴覚野につないでみたそ
うです。当然その動物は視力を失います。しかし、その後、不思
議なことが起きたのです。その動物は視力を取り戻し、モノを見
ることができるようになったのです。
 こうした実験を重ねて神経科学者たちはひとつの仮説を立てた
のです。小林雅一氏は次のように解説しています。
─────────────────────────────
 これら一連の実験結果を基に、神経科学者たちは大胆な仮説を
立てました。それは「視覚」「聴覚」「触覚」「味覚」など、人
間の様々な知覚能力に通底する基本的なメカニズムがある、とい
うものです。これに従えば、脳は目や耳から人力された生々しい
初期情報を、段階的に抽象化して、徐々に上位の概念を形成して
いきます。彼らは、このメカニズムを自分連なりに考えて、具体
的なアルゴリズムへと転化し、これを「スパース・コーディング
(Sparse Coding)」と命名しました。英語の「Sparse」 は「少
量の」という意味で、ここでは「大量の情報から、抽象化に必要
な本質的情報だけを、少しずつ抜粋すること」を指しています。
これによって隠れ層をより多層化しても、現実的な時間内で情報
処理ができるようになりました。  ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 難しい言葉が出てきました。「スパース・コーディング」とは
一体何でしょうか。
 米カルフォルニア大学バークレー校にブルーノ・オネスホーゼ
ン氏という教授がいます。計算論的神経科学(コンピューテーシ
ョナル・ニューロサイエンス)の分野で業績を上げている学者で
す。このオネスホーゼン氏が同大学のデービス校で、准教授をし
ていた頃の話です。
 オネスホーゼン教授は、脳の視覚野の一部の「V1」の研究の
第一人者ですが、動物の目から入力された視覚情報を脳にどのよ
うに処理されるかを解明する仮説を立てたのです。
 難しい話になりますが、視覚情報は目から入り、大脳皮質の一
番後ろにある第一次視覚野(V1)に送られます。サルやヒトで
は傾き、動き、奥行きなどの情報は、V1ではじめて抽出され、
さらに前方の大脳皮質に送られます。私たちが物の位置や形を認
識するとき、V1からその前方の大脳皮質に送られる情報が重要
な働きをしていると考えられます。ちなみに、このV1が壊れる
と、目が見えなくなります。
 V1に入ってきた目からの視覚情報は、無数のピクセル/画素
の集まりです。この状態では、それが何であるかは不明ですが、
V1で段階的にかたちを作り、認識にいたるのです。これについ
て、小林雅一氏は、次のように解説しています。
─────────────────────────────
 脳の視覚野は、このピクセル情報からいくつかの特徴ベクトル
(物体の輪郭を構成する線)を自動的に抽出します。そしてこの
ベクトルをいくつか組み合わせて、「目」や「耳」のようなパー
ツ(部品)を描き出し、それが終わると今度はこれらのパーツを
組み合わせて、「猫」や「人」の顔など最終的な対象物を描き出
している。要するに脳の視覚野は、そのように段階的に対象物を
認識しているというのです。         ──小林雅一著
   『AIの衝撃/人工知能は人類の敵か』/講談社現代新書
─────────────────────────────
 目から入った視覚情報、仮に人の顔であるとします。それらは
視覚野「V1」に入った最初の段階では、無数のピクセルの集ま
りにすぎません。その中から特徴的なパーツ(ベクトル)を抽出
し、そのうえで、それらを組み合わせて、段階的に顔を形成して
いくのです。
 そのプロセスには一定のルールのようなものがあるので、それ
をコンピュータで処理可能なアルゴリズムに転化させることがで
きます。オネスホーゼン氏は、そのことを「スパース・コーディ
ング」と名付けたのです。この場合、ひとつひとつのベクトルは
脳のニューロン一個一個に対応します。
          ──[次世代テクノロジー論U/025]

≪画像および関連情報≫
 ●人工知能を語る前に、脳について知りたい
  ───────────────────────────
   たった1つの学習理論とは脳が物事を学習する際には、そ
  の処理対象に応じた活動をするわけではなく、全ての処理対
  象に対して唯一の学習方法を使っているという考え方です。
  これは理論と名付けられている通り、そういう考えがあるだ
  けで、まだ確実にそうだと証明されているわけではありませ
  ん。しかし、1つの考え方として認められているものでもあ
  ります。特に人工知能関連では「スパース・コーディング」
  というものが有名です。スパースコーディングとは、ある処
  理を行うときに、なるべく少ない神経活動で済ませられるよ
  うに学習が行われるという考え方です。
   視神経を切断すると、当然視力を失います。視力を失った
  状態で、その切断した視神経を聴覚を処理している脳の神経
  に接続した場合にどうなるでしょうか。もしも音の処理と光
  の処理が異なるものであるならば、視覚の信号を聴覚の脳の
  領域に与えた所で何も起こらないはずです。しかし驚くこと
  に次第に視覚が取り戻されていったのです。すなわち視覚の
  信号を聴覚に使われていた脳の領域で処理することができた
  のです。これは、脳の視覚と聴覚に関する信号の処理構造は
  本質的な差異がなく、ある統一された学習によって意味のあ
  る情報として獲得しうると考えられます。
   視覚の情報処理機構を、アルゴリズムとして実装した場合
  に、実際に画像処理として有効であるのは何となく当たり前
  のかなと思います(もちろん工学に応用できるという点で有
  意義)。            https://bit.ly/2Jehick
  ───────────────────────────

視覚野/V1.jpg
視覚野/V1
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月11日

●「教師なし学習で『猫の概念』獲得」(EJ第4782号)

 すっかり、世間一般にAI(人工知能)という言葉が定着した
感があります。つい5年くらい前であれば、AIは専門用語であ
り、エンジニアしか知らなかった言葉です。したがって、書いて
いると、話がどうしても難しくなります。しかし、どうせ知るの
であれば、多少詳しいところまで、踏み込んで知る方があとあと
まで役に立ちます。
 どうしてコンピュータが人間と同じように見たり、聞いたりで
きるのでしょうか。ついこの間まで、コンピュータはモノのかた
ちを認識できなかったのです。ここに一枚の写真があったとしま
す。人が写っています。人間なら、すぐそれが人の写真であり、
女性の写真であるかがわかりますが、コンピュータは何の写真か
ぜんぜんわかりません。コンピュータが把握できるのは、無数の
小さいピクセル(画素)の集合体にしか見えないのです。それを
具体的な画像としてコンピュータに認識させる技術が「ディープ
ラーニング」です。
 添付ファイルを見てください。AIには、構造的にデータを入
力する「入力層」と、結果としてデータを出力させる「出力層」
があります。中間部には「隠れ層」という層がいくつもあります
が、データはそれらのいくつもの層を通過するごとに、少しずつ
具体的なかたちとしてとらえ、最終的に完全なかたちとなって出
力されます。そういう多くの層を通過することから「ディープ」
と呼ばれるのです。
 この画像認識について、早稲田大学ビジネスファイナンス研究
センター顧問の野口悠紀雄氏は次のように解説しています。
─────────────────────────────
 画像認識の場合、画像を多数の小さな部分(ピクセル)に分け
数値化したデータを、ニューラルネットワークの最初の層に人力
する。そこから第2層にデータが渡される際、各ニューロンの値
に異なる値(重み)を掛けた値を次の層の特定のニューロンに送
る。以降、同様にして最後の層までデータが渡され、最終的な出
力が生成される。
 何十万枚、あるいは何百万枚もの画像を読み込む学習によって
正しい答えを出せるようになるまで重みの値を調整する。現在で
はエラー率が5%まで低下しており、人問の画像認識能力とほぼ
同じになつている。対象によっては、人間より速く正確に認識で
きる。                ──野口悠紀雄氏論文
        「ディープラーニングの驚くべき威力と限界」
  『超整理日記/週刊ダイヤモンド』/2018年5月12号
─────────────────────────────
 コンピュータが画像を認識できるということは、手書きを含む
文字はもちろんのこと、モノの形状を認識できるので、宅配、郵
便などの物品の仕分け作業の分野などで、AIは、大いに役に立
つことになります。
 医療分野においても、AIの需要は高いのです。日本は医療機
械のCTとMRIの台数では、それぞれ世界第1位と2位ですが
それを撮影し診断する放射線医の数が圧倒的に不足しています。
したがって、AIを使えば、CTやMRIの画像の診断に役立て
ることができます。しかも、診断を重ねるごとに、判断の精度は
向上していくことになります。
 2012年6月のことです。グーグルとスタンフォード大学の
共同研究チームの開発したニューラルネットワークが、AIの歴
史に残る成果を発表します。ユーチューブの動画から「猫」の概
念を獲得したという発表です。「猫の概念の獲得」というのは、
コンピュータが、猫が写っている画像を見分けられるようになっ
たということを意味します。
 この場合、重要なのは、コンピュータに猫の特徴を教えていな
いということです。特定の何かが写っている動画を与えたのでは
なく、任意のユーチューブ動画で学習させただけです。実験内容
を少し詳しく述べます。
 具体的にいうと、ユーチューブにアップロードされている動画
からランダムに取り出した「200×200ピクセルサイズ」の
画像を1000万枚用意し、1000台のコンピュータを使って
9つの層のニューラルネットワークで、ディープラーニングによ
る学習を行わせたのです。
 AIは、さまざまなモノが写っている1000枚の画像を学習
し、パターン分析を行い、グループ分けを行ったのですが、その
なかで猫については認識できるようになったということです。そ
れは、おそらく動画には猫が一番多く写っていたのではないかと
思われます。実際にネット上には、おびただしい数の猫の動画が
溢れています。
 いわゆるニューラルネットワークの「機械学習」には、次の2
つの学習法があります。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 1の「教師あり学習」とは、文字通り人間が先生になって、つ
きっきりで、コンピュータに教えることです。たとえば、猫とは
どういうかたちをしているかについて、その特徴点を教え込み、
複数の動物の写真のなかから、正確に猫の写真を選ばせるように
する方法です。しかし、この方法では、AIはいつまで経っても
人間を超えることはできません。
 これに対して2の「教師なし学習」は、人間の助けなしにコン
ピュータに独力で学習させる方法です。多くのデータのなかから
自律的に学習させる方法です。グークルとスタンフォード大学の
共同研究チームは、これを達成させたのです。
 実は、猫だけではなく、自動車、椅子、人の顔などの概念も同
時に認識していたそうです。いずれにしても、この快挙によって
AIは人間に大きく一歩近づいたといえます。
          ──[次世代テクノロジー論U/026]

≪画像および関連情報≫
 ●パスポートをかざすだけで入国審査/「顔認証ゲート」
  ───────────────────────────
   法務省は2018年6月8日、国内で初めて成田空港で、
  11日から運用を開始する顔認証技術を活用した「顔認証ゲ
  ート」を公開した。パスポートをかざすだけで入国審査がで
  きるシステムで、事前手続きは不要となる。本格運用によっ
  て、出入国手続きの時間の短縮が期待される。利用者の多い
  中部、関西、福岡空港でも、年内に導入される予定。
   顔認証ゲートでは、ICチップが内蔵されたパスポートを
  機械にかざしチップの顔写真データと、自動化ゲートのカメ
  ラで撮影した顔をコンピューターで照合。同一人物か確認し
  顔が一致すればゲートが開く。
   対象は身長135センチ以上の利用者。法務省によると、
  他人を誤って入国させる確率は0・01%以下という。パス
  ポート発給時と顔が大きく変わっていなければ10秒ほどで
  終了する。マスクや帽子を着用していると注意を促すメッセ
  ージが機械に表示される。
   現行の出入国審査では、審査官がパスポート写真と本人を
  見比べて確認する手続きが一般的だった。昨年10月から羽
  田空港国際線ターミナルで帰国者を対象に3台が先行導入さ
  れていたが、本格導入は成田が初めて。今月11日から第2
  第3ターミナル、18日から第1ターミナルの上陸審査場で
  運用を開始する。        https://bit.ly/2sQYTaa
  ───────────────────────────

ニューラルネットワーク/ディープラーニング.jpg
ニューラルネットワーク/ディープラーニング
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月12日

●「ヒントンのカブセルネットワーク」(EJ第4783号)

 ジェフリー・ヒントン氏──1947年の英国生まれの科学者
であり、今やAI(人工知能)、なかんずくニューラルネットワ
ークの権威であり、ディープラーニングの世界では、最も影響力
を持つ人物の一人といわれています。ヒントン氏は、トロント大
学教授という籍を持ちながら、グーグルの研究員をしており、世
界のAI技術を牽引しています。
 小林雅一氏によると、ヒントン教授は、コンピュータ基礎理論
のひとつである「ブール代数」を発明した数学者、ジョージ・ブ
ールの子孫といわれます。ジョージ・ブールは数学の世界に「論
理」を取り入れた人物であり、AIと密接な関係があります。
 当時、数学は「数」や「図形」を扱う学問で、「論理」は哲学
の分野であると考えられていました。しかしブールは論理や推論
を数学的に考えられるのではないかという発想を持ち、1844
年の論文において「演算」を記号で表し、その記号同士の計算を
考えたのです。これがプール代数です。
 ヒントン教授の凄いところは、2度にわたる「AIの冬」を経
てもAIの研究を続けたことです。そして、やっと2012年6
月にグーグルとスタンフォード大学のAI研究チームは、動画の
なかから「猫」を認識したのです。
 しかし、これにはディープラーニングに与えるデータの前処理
というものが必要です。しかも、大量のデータを与える必要があ
ります。2012年の快挙のときでも、ユーチューブからランダ
ムに選んだ動画から、一定のピクセルサイズの画像を1000万
枚も準備していますが、これが前処理です。
 この1000万枚の画像のなかに偶然最も多く写っていたのが
「猫の画像」であり、AIは「猫」を認識できたのです。もう少
し詳しくいうと、その画像のなかに、さまざまな角度からの猫の
画像が入っていたからであるということができます。
 人間の子供であれば、「これが猫だよ」と教えられれば、どの
ような角度からでも、すぐ「猫」だと認識できます。他のどのよ
うな猫に関しても同じです。しかし、ニューラルネットワークで
は、画像のピクセルがほんの少し動いただけでも画像を全然別の
ものと認識してしまいます。そういう誤差が起きないように、た
くさんの画像を認識させる必要があります。
 これに関してヒントン教授は、2017年10月に「カプセル
ネットワーク」という名の論文を発表しています。その原文のU
RLは、次の通りです。
─────────────────────────────
             Geoffrey E. Hinton
      Dynamic Routing Between Capsules
                  https://bit.ly/2xXEB4P
─────────────────────────────
 これによって、AIの画像認識率が格段に向上したのです。こ
れまでのニューラルネットワークの最高時の精度を実現でき、そ
の誤答率はニューラルネットワークの最低時の半分のレベルまで
減少したといわれます。
 「カプセルネットワーク」とは何でしょうか。
 この「カプセル」という概念がかなり難解です。カプセルネッ
トワークについて解説しているサイトによると、カプセルについ
て次のように説明しています。
─────────────────────────────
 「カプセル」とは、むき出しの仮想ニューロンの小さな集合体
で、猫の鼻や耳のような、ある物体の異なるパーツと、空間にお
けるそれらの相対的な位置を探知するよう設計されている。多数
のカプセルによるネットワークは、新たな場面について、「実は
すでにある場面を違う視点から見たものだ」と理解し、その気づ
きを利用する。           https://bit.ly/2HALKYj
─────────────────────────────
 添付ファイルを見てください。人の顔を認識するときに、従来
のニューラルネットワークでは、それが目なのか、鼻なのか、口
なのかにしか着目していないのです。ちょうど、左の画像のよう
に認識しています。
 これに対し、カプセルネットワークでは、右の画像のように、
それらの特徴がどのような関係で配置されているかまで含めて認
識します。つまり、カプセルネットワークでは、目や鼻や口や耳
の特徴を独立的にとらえるだけでなく、それらがどのような位置
関係で配置されているかまで認識します。
 ひとつひとつのカプセルにつまったニューロンが個々の特徴に
着目するだけでなく、それぞれの位置関係まで把握するのです。
ここにカプセルネットワークの名前の由来があります。
 ヒントン教授のこの最新の論文にについては、発表されたばか
りであり、その成果をうんぬんするには、まだ早いかもしれませ
んが、確実に従来のニューラルネットワークを前進させるもので
あり、各方面から多くの賛辞が寄せられています。
─────────────────────────────
◎ローランド・メミセヴィッチ/モントリオール大学教授
  与えられたある量のデータから、既存のシステムよりも多く
 の理解を得られる。
◎ゲイリー・マーカス/ニューヨーク大学教授
  ヒントンの最新の業績は、歓迎すべき新たな風の息吹を象徴
 しています。AI分野の研究者たちは、脳にもともと組み込ま
 れている仕組みを積極的に真似るべきです。視覚や言語といっ
 た必須の能力を身に付けるために役立つのですから。
  新たに登場した体系が、どこに行き着くかはまだ分かりませ
 ん。でも、これまでのAI研究が固執し、はまり込んでしまっ
 ていた轍から抜け出す方法を見つけたという点において、ヒン
 トンは素晴らしい成果を挙げたといえるでしょう。
                  https://bit.ly/2HALKYj
─────────────────────────────
          ──[次世代テクノロジー論U/027]

≪画像および関連情報≫
 ●深層学習を根底から覆すカプセルネットワークの衝撃
  ───────────────────────────
   現在の深層学習ブームのきっかけを作ったのが、トロント
  大学のジェフリー・ヒントン教授であることには誰も疑問を
  抱かないでしょう。ヒントン教授らのグループはそれまで目
  覚ましい成果がなかなか出なかった画像認識という分野に深
  層畳み込みニューラルネットワークという新しいアイデアで
  取り込み、目覚ましい成果を挙げたことで、グーグルはヒン
  トン教授の設立した企業DNNリサーチを買収し、今のディ
  ープラーニングブーム旋風が世に巻き起こりました。だいた
  い、この手のニューテクノロジーブームというのは、2、3
  年で落ち着くのが常です。
   しかし、稀にブームで終わらずに、本物のイノベーション
  になる技術があります。たとえば、モバイル・インターネッ
  ト、リアルタイム3Dコンピュータグラフィックス、スマー
  トフォンなどです。
   スマートフォンの場合、なにもアイフォーンが最初ではあ
  りませんでした。アイフォーンのプロトタイプのようなもの
  が1990年代後半からいくつも登場しては消えていったの
  です。人工知能分野のなかでも、特にニューラルネットワー
  クはスマートフォンと似ています。過去に何度も注目を集め
  ブームになりながら、いまひとつ定着できずイノベーション
  に昇華できなかったもののひとつです。
                  https://bit.ly/2kWUFdI
  ───────────────────────────
 ●添付ファイル画像出典/https://bit.ly/2prgd4T


カプセルネットワークとは何か.jpg
カプセルネットワークとは何か
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月13日

●「どのように画像の特徴を掴むのか」(EJ第4784号)

 そもそも「ディープラーニング」は、何がきっかけになって、
注目されたのでしょうか。
 「画像認識コンテスト/ILSVRC」という国際的なイベン
トがあります。このコンテストは毎年行われ、世界中の一流大学
や研究機関がエントリーして、独自のアルゴリズムを競い合う技
術競技です。ILSVRCは、次の言葉の略です。
─────────────────────────────
  ILSVRC
  ImageNet Large Scale Visual Recognition Challenge
─────────────────────────────
 2012年のILSVRCのことです。そのとき、1200万
画素・1000カテゴリの画像認識の問題に対し、ジェフリー・
ヒントン教授率いるチームが圧勝しました。このとき、使われた
のがディープラーニングです。勝敗は、画像認識エラー率で競う
のですが、他チームの平均エラー率が26%だったのに対し、ヒ
ントン教授率いるチームのエラー率は16%だったのです。この
結果には、世界中が驚愕したのです。以来、ディープラーニング
は世界中で有名になったといえます。
 さて、「ディープラーニング」は、機械学習の一つです。6月
11日のEJ第4782号で述べたように、機械学習には次の2
つがあります。再現します。
─────────────────────────────
          1.教師あり学習
          2.教師なし学習
─────────────────────────────
 画像認識の場合、人間であれば、その画像の特徴というべきも
のを無意識に掴んで、それが、どういう画像であるかを判断しま
す。ディープラーニングの場合は、どのように把握するのでしょ
うか。日本のAI研究の第一人者である松尾豊東大准教授は、こ
れについて次のように述べています。
─────────────────────────────
 例えば、画像の場合、画像の中から特徴量を自動的に切り出す
ことができる。特徴量とは、簡単なものだと、エッジの検出、角
の検出、などのようなものから始まり、それが組み合わさること
によって「顔がある」「これは人間の顔」「これは猫の顔」など
という高次の特徴量へとつながっていく。そうすることで高次の
特徴量も自動的に取り出すことができるのです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 ここで松尾准教授のいう「特徴量」という言葉について、知る
必要があります。特徴量とは特徴を数式化したものをいいます。
アルファベットを例に上げます。AIは、その形状からアルファ
ベットというものを次の3つのパターンに分類して認識します。
─────────────────────────────
  1.中心から縦に引いた線を境にして左右の形が等しい
    A、H、I、M、O、T、U、V、W、X、Y
  2.中心から横に引いた線を境にして上下の形が等しい
    B、C、D、E、H、I、O、X
  3.上記「1」と「2」の条件を両方とも満たしている
    H、I、O、X
                  https://bit.ly/2l5zCWF
─────────────────────────────
 どういう仕組みで、画像の特徴量を把握するのかというと、そ
こには、「オートエンコーダ」というものを使うのです。松尾准
教授は、次のように述べています。
─────────────────────────────
 オートエンコーダーというものを使います。従来の機械学習な
ら、「教師あり学習」、「教師なし学習」という分け方をするこ
とが多かったのですが、ディープラーニングは「教師なし学習」
だが、一見すると「教師あり学習」のような扱いをするのです。
 どういうことかと言うと、例えばコンピューターに画像のデー
タを与えた場合、コンピューターは画像の一部を消して、その一
部を残った部分から当てなさいという問題に変えるのです。そう
すると、画像を与えただけで、たくさんの擬似的問題を作ること
ができる。それをニューラル・ネットワークで解かせていくと、
ニューラル・ネットワークの隠れ層にあたる部分に特徴量が自動
的に獲得されてくるという仕組みです。そして、それは画像の一
部を見て、残りを当てるということにおいて重要な特徴量なので
画像を端的に表わす特徴量が自動的に選ばれるというわけです。
                  https://bit.ly/2LFgAl9
─────────────────────────────
 松尾准教授は凄いことをいっています。例えば、「1」という
字を認識しするとき、AIはその一部を消して、自分で自分に問
題を出します。例えば、「1」の画像の下半分を消して、画像が
何であるか、ニューラルネットワークに問い合わせます。
 右に横線が出ると「L」、左が空いた弧がくれば「5」と、縦
に線が伸びれば「1」になります。画像の隠す部分を変えて、い
くつも問題を作り、ニューラルネットワークを通して正解を得る
仕組みになっています。
 ディープラーニングで思考するニューラルネットワークは、本
来「教師なし学習」です。しかし、AI自体が自身に対して問題
を出し、答えさせることによって、正解率を高めるメカニズムは
一種の「教師あり学習」ともいえる──松尾准教授はそのように
いっているのです。
 覚えるということは試行錯誤の繰り返しです。赤ちゃんが手当
たり次第に周りにあるものに触ったり、叩いたり、口に入れたり
してそれがどういうモノか理解していくプロセスがディープラー
ニングのなかに内蔵されているようです。AIについて知れば知
るほど、人間の脳がいかによくできているかを知らされることに
なります。     ──[次世代テクノロジー論U/028]

≪画像および関連情報≫
 ●松尾豊東京大学准教授とのインタビュー
  ───────────────────────────
  金丸:お忙しいなかお越しいただきありがとうございます。
  今日は六本木に今年3月オープンした『ビフテキのカワムラ
  六本木店』をご用意しました。こちらは神戸に本店があって
  銀座にもお店があるんですが、とにかく予約が取れないんで
  すよ。
  松尾:そうなんですか。そんなお店にお招きいただき、あり
  がとうございます。最高級の神戸牛が味わえると聞いて、楽
  しみにしてきました。
  金丸:松尾先生のご専門は、人工知能(AI)です。ここ最
  近、AIのニュースを聞かない日はありませんし、先生のこ
  とはメディアでもよく拝見しています。
  松尾:ありがとうございます。
  金丸:先生とは経済産業省のプロジェクトでご一緒していま
  す。いまAIのなかでも、ディープラーニングという新しい
  技術が注目されていますが、どういうものなのか簡単に教え
  ていただけますか?
  松尾:ディープラーニングとは、人間の脳の神経回路をまね
  た「ニューラルネットワーク」を使って、人間の脳と同じよ
  うな情報処理を行う技術です。これまでコンピュータに画像
  を認識させるには、たとえばネコなら「目が丸い」「耳がと
  がっている」というようなネコの特徴を人間が入力しなけれ
  ばなりませんでした。それがディープラーニングの技術によ
  り、コンピュータに大量の画像データを読み込ませることで
  コンピュータ自らが学習し、その特徴を見出せるようになり
  ました。            https://bit.ly/2kZXTNu
  ───────────────────────────

松尾豊東京大学准教授.jpg
松尾豊東京大学准教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月14日

●「IBMワトソンはどんなマシンか」(EJ第4785号)

 IBMが開発した「ワトソン」という名前のコンピュータがあ
ります。今やAI(人工知能)とワトソンは同義語として語られ
るほど有名な存在です。実は、当のIBMは、ワトソンについて
次のようにいっているのです。
─────────────────────────────
 ワトソンとAI(人工知能)は目指すゴールが決定的に違う
                       ──IBM
─────────────────────────────
 「ワトソン」という名前を聞くと、アーサー・コナンドイルの
推理小説『シャーロック・ホームズシリーズ』の登場人物で、名
探偵シャーロック・ホームズの友人のワトソン博士を想起する人
が多いと思います。小説でのワトソンは、いろいろな場面でホー
ムズにアドバスする役割であり、AIコンピュータ「ワトソン」
の役割にぴったりですが、まったく関係がありません。
 ワトソンの名は、IBMの事実上の創立者であるトーマス・J
・ワトソンから取られています。創立者ではありませんが、初代
社長で、1914年から1956年までIBMのトップとして、
IBMを世界的大企業に育て上げた人物であり、IBMを代表す
るコンピュータの名前を冠するのに相応しい人物です。
 ところで、なぜ「ワトソン」とAIとは目指すところが違うの
でしょうか。キーワードは次の言葉です。
─────────────────────────────
  IBMの「ワトソン」は、コグニティブシステムである
─────────────────────────────
 コグニティブ(cognitive) とは、日本語で「認識」とか「認
知」のことであり、コグニティブシステムとは、ある事象につい
てコンピュータが自ら考え、学習し、自らの答えを導き出すシス
テムを意味します。「コグニティブ・コンピューティング」とも
いわれています。
 米IBM基礎研究所バイスプレジデントで、ディープラーニン
グの応用や神経細胞のシナプスのように働く新しい「シナプス・
チップ」の研究を牽引するダリオ・ギル氏は、コグニティブシス
テムについて、次のように説明をしています。
─────────────────────────────
 AIの技術が、コグニティブシステムに使われていることは間
違いないが、AIとコグニティブシステムは「ゴール」が違う。
AIは、科学分野における技術であり、人間ができることのイミ
テーションを目指している。一方、コグニティブシステムは人間
が中心。人がより良い作業が行えるようにサポートするものだ。
 コグニティブシステムは、学習能力を持った点が大きな特徴。
これまでのようにルールを書かなくても、システム側が事例を通
じて学習することが可能だ。ソフトウェアの世界を抜本的に変え
ることになる。普通、コンピュータというのは、購入した日が最
も性能が高い日であるが、コグニティブシステムは最もパフォー
マンスが悪いのが購入した日。学習することで、日に日に性能が
向上する。その学習の成果をもとに、コグニティブシステムは、
人間が持っている専門知識を補完するものだ。私は、コンピュー
タが人を置きかえるという考え方は根本的に間違っていると思っ
ている。    ──ダリオ・ギル氏 https://bit.ly/2l5bFPd
─────────────────────────────
 ワトソンは、自然言語処理ができるマシンですが、早押しの人
気クイズ番組「ジョパディ!」で優勝しています。当時のワトソ
ンには音声認識機能は搭載されておらず、問題は文章で出題され
シリンダーでボタンを押す装置を用いて回答したことがわかって
います。
 現在では、ワトソンにはかなり強力な音声認識機能が装備され
ており、日本のメガバンクのコールセンターでも、ワトソンが使
われています。文字は解読できるし、人の会話を聞き取り、文章
化できる能力も持っています。しかも、知識のソースを与えれば
ワトソンは、自動的に機械学習できる能力も持っています。
 ダリオ・ギル氏はこうもいっています。現在のコンピュータは
現存する2・5エクサバイトのデータのうち、80%のデータの
意味が理解できない。これらは、SNSなどによって発信されて
いる自然言語のデータですが、人間にとってもこれらのデータは
あまりにも分量が多いので処理できない。ワトソンのコグニティ
ブシステムは、これらの80%のデータを読んで、理解できるよ
うにするものである、と。
 これらのことから、ワトソンとは、自動学習でき、豊富なデー
タから、高度な推論のできるエキスパートシステムではないかと
思われます。既にIBMは、ワトソンによる「コグニティブビジ
ネス」を展開していますが、課題は多くあるようです。
 しかし、IBMのワトソンについて、松尾豊東大准教授は、次
のように絶賛しています。
─────────────────────────────
 IBMのワトソンがすごいのは、自然言語処理に優れていると
ころだ。コンピューターが扱えるデータが爆発的に増えていると
いっても今はまだ紙に書かれた情報が山のようにある。書籍をス
キャナで読み取って、文字を認識したとしても、コンピュータに
は、その書籍の内容がどういうものなのかは理解できない。どの
部分が書籍のタイトルで、どれが著者名かということさえも、そ
のままでは分からない。
 ところがワトソンは、コンピューター向けに作られていない文
字情報を、コンピューターに理解できるような形に変えるところ
でさまざまな工夫がされているのだという。クイズ番組「ジョパ
ディ!」に出演したワトソンは、書籍や百科事典、ウィキペディ
ア上の情報など、2億ページ分のテキストデータ(70GB程度
約100万冊の書籍に相当)をスキャンして取り込んでいた。
       ──松尾豊東大准教授 https://bit.ly/2LFgAl9
─────────────────────────────
          ──[次世代テクノロジー論U/029]

≪画像および関連情報≫
 ●ワトソンで苦戦のIBMが狙う「AIでの反撃」
  ───────────────────────────
   人工知能(AI)分野ではグーグルやマイクロフト、フェ
  イスブックらが優秀な人材をかき集める一方、IBMのよう
  な古くからの大手は苦戦を強いられている。
   IBMは、莫大な費用を同社のAIのワトソンに注いでい
  るが、目立った成果をあげられていない。健康情報メディア
  「Stat」は先日、ワトソンのガン治療分野への導入が遅延し
  ている状況を詳細にレポートした。
   IBMは大学の研究機関とともに、この状況への対処を始
  めた。2017年9月7日、IBMは、マサチューセッツ工
  科大学(MIT)と実施するAI研究プロジェクトに、今後
  10年間で2億4000万ドル(約260億円)を出資する
  とアナウンスした。「MIT-IBM Watson AI Lab」と 呼ばれる
  このプロジェクトは、100名の研究者らを4つのAI領域
  の研究に割り当てる。
   その4領域とはニューアルゴリズム、ハードウェア、ソー
  シャルインパクト、ビジネス活用だ。アルゴリズム開発にお
  いて同プロジェクトは、マシンラーニング(機械学習)の一
  分野であるディープラーニング(深層学習)に続く新領域に
  注力する。「今回の提携で、ディープラーニングを超える新
  たなアルゴリズムの発見に向けた基礎研究を開始する」とM
  ITのエンジニアリング部門学部長は述べた。
   研究チームが特に注力するのは、人間による監視や手作業
  によるデータのタグづけ無しで実行可能なAIアルゴリズム
  のトレーニングだ。現状のディープラーニングのトレーニン
  グには、人間の目視による確認が必須で、個々のデータにラ
  ベルづけを行う必要がある。例えば車の画像データがあれば
  これは車だと教えてやる必要があるのだ。
                  https://bit.ly/2Mix7MR
  ───────────────────────────

ダリオ・ギル米IBM基礎研究所副社長.jpg
ダリオ・ギル米IBM基礎研究所副社長
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月15日

●「ワトソンの無期限無料試用の狙い」(EJ第4786号)

 2017年10月27日に、日本IBMは、ワトソンについて
次のアナウンスを行っています。
─────────────────────────────
 IoTのシステム構築には試行錯誤がつきもので、PoC(概
念検証)などでは試作や検証に時間がかかる傾向がある。そうし
た課題に対し、日本IBM、同社のAIプラットフォームである
ワトソンなどを開発者が無料で、かつ無期限に利用できるサービ
スを2017年10月27日から開始した。  ──日本IBM
─────────────────────────────
 このIBMのサービスは「IBMクラウド・アカウント」と呼
ばれます。これまでは、無料試用トライアルは30日に限定され
ていたものが、無期限に無料で利用できるようになったのです。
AIを試してみたい企業や個人のデベロッパーにとって、またと
ないチャンスが訪れたといえます。なぜ、IBMは、このかなり
思い切ったサービスに打って出たのでしょうか。
 これには、諸説がありますが、AI(人工知能)の分野におい
て先行していたはずのIBMが、優秀な人材を集め、集中的にA
Iに投資を行っているグーグルやマイクロソフト、フェイスブッ
クなどから遅れをとっているからであるといわれています。確か
に、これまでにIBMは莫大なコストをワトソンに注いでいます
が、目立った成果を上げられないでいるからです。
 それに、IBMはワトソンをグーグルなどで開発を進めるAI
とは別のビジネスシステムとして位置づけようとしているフシが
あります。10月27日のユーザーイベントで基調講演をしたエ
リー・キーナン日本IBM代表取締役社長は、世界を変える6つ
の技術として、@AI、AIoT、Bブロックチェーン、C量子
コンピュータ、Dニューロモーフィックコンピュータ(脳型コン
ピュータ)、E世界最小コンピュータの6つを上げ、コンピュー
タが現在、人間の生活を大きく革新しつつあると述べたうえで、
AIについて次のように述べています。
─────────────────────────────
 AIには、人々の生活を直接的に助けるAIと、ビジネスを支
援するAIがある。ワトソンはビジネスを助けるAIである。限
られたゲーム盤の上でさらにルールが固定化されたゲームとビジ
ネスの世界は大きく異なる。AIをビジネスで活用するためには
業界用語や文脈、ワークフローをAIが理解できないと難しい。
ワトソンは、すでに医療現場で医者の診断を支援するサービスを
開始しており、ビジネスの世界で実績がある。他のAI技術では
そういう実績はまだない。      https://bit.ly/2t6IQFG
─────────────────────────────
 これでわかるように、IBMは、ワトソンをグーグルなどが主
導する、いわゆるAIとは別のものであるとしているようです。
ワトソンは既に業務に役立つレベルに達しており、さらに多くの
成功事例を生み出そうとして「IBMクラウド・アカウント」を
スタートさせたものと考えられます。
 その成功事例を担っているのは、ワトソンの展開において日本
のパートナーとしてIBMに協力してきたソフトバンクグループ
です。10月27日のユーザーイベントで、日本IBMエリー・
キーナン社長に続いて登壇したソフトバンクの代表取締役社長兼
CEOの宮内謙氏は、EC(電子商取引)の市場規模が200兆
円以上になっているが、これからの10年間は、それよりももっ
と大きな変化が起きるとして、テクノロジーによる企業の成長戦
略の可能性について、次のように述べています。
─────────────────────────────
 成長戦略を描くうえで、考えなければいけない3つの経済変化
として、「コネクテッドエコノミー」
    「シェアリングエコノミー」
    「スコアリングエコノミー」を挙げる。
 コネクテッドエコノミーは、通信により人と人がつながり、場
所も時間を選ばないコミュニケーションができるようになったこ
とで生まれる価値を示す。今はこれがさらに広がり、人だけでな
くモノもつながることができる。
 さらにこのコネクテッドエコノミーを土台として、完全にモノ
の管理が行えるようになったことで、シェアリングエコノミーが
生まれた。カーシェアリングや自動車シェアリングなどのほか、
ウーバーなどの自動車配車サービスなどもこれに当たる。
 さらに、あまり注目されていないが、今後重要になることにス
コアリングエコノミーがある。コネクテッド化により、モノの完
全な管理が可能となることで、例えばシェアされた自動車をどの
ような使い方をしているのかが把握できる。
そこで利用者がスコアリングされるような状況が生まれる。これ
らはさらにさまざまな産業に広がっていき、新たなチャンスを生
み出すだろう。           https://bit.ly/2t6IQFG
─────────────────────────────
 ソフトバンクでは、AIを活用した革新的企業との協業や出資
などを展開しています。その分野としては、セキュリティ、ライ
ドシェア、医療、自動運転、ロボット、半導体、室内農業、産業
IoTなど、多方面に及んでいます。
 日本IBMは、「IBMクラウド・アカウント」のサービス開
始を機会にワトソンのユーザーを一挙に増やすことを計画してい
ます。日本IBM三澤智光取締役は次のように述べています。
─────────────────────────────
 ワトソンの国内での展開は既に350社以上におよんでいるが
日本語APIを自由に触りたいという声が非常に多かったので、
今回「IBMクラウド・アカウント」を用意した。より多くの開
発者にさまざまな形で触れてもらうことが重要だと考えている。
 ──日本IBMクラウド事業本部長/三澤智光取締役執行役員
                  https://bit.ly/2JO4GVe
─────────────────────────────
          ──[次世代テクノロジー論U/030]

≪画像および関連情報≫
 ●「IBMクラウド・アカウント」の価値
  ───────────────────────────
   今回リリースされた「IBMクラウド・アカウント」は、
  利用期間に制限がない。使用料金が発生することがないため
  クレジットカードなどの登録も不要だ。これまでのフリート
  ライアルは30日間の期間限定だったが、今度はじっくり試
  すことができる。また、学生などでクレジットカードを所持
  していない人とっても利用のハードルが下がったことは大き
  な意義がある。
   しかし、有料プランと比較した場合、当然ながらいくつか
  の制約が存在する。利用可能な組織・地域とも各1つ。CF
  メモリが256MB、主要サービスはライトプランのみで、
  インスタンスもプランごとに1つといった機能面の制限。そ
  して、10日間の開発停止でアプリが停止し、30日間の活
  動停止でサービスが削除される。これらの制限は実際の開発
  において、どれほどの障壁となるのか。また、無料化におけ
  る社会的な意義や今後、どんな可能性を秘めているのか。
   川合氏は「ストーリーAI」と呼ばれる、物語における感
  情の動きをビジュアライズするAIの開発者。現在はアルゴ
  リズムの強化と商用化に向けたサービス開発を行っている。
   「私が開発するストーリーAIは、物語における感情の振
  れ幅と時間軸(X軸)と感情軸(Y軸)でビジュアライズし
  表現するものです。物語の登場人物たちがストーリー中にど
  のような感情を抱いているのかをテキストから理解し、物語
  の盛り上がりを判断するアルゴリズムをつくりました」。
                  https://ibm.co/2lcG7ad
  ───────────────────────────

宮内謙ソフトバンク社長兼CEO.jpg
宮内謙ソフトバンク社長兼CEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月18日

●「3つの『認識』は可能になるのか」(EJ第4787号)

 現代のAI(人工知能)は、ニューラルネットワークのディー
プラーニングが主流になっています。このディープラーニングは
「革命」といわれます。なぜ、革命なのでしょうか。それは、次
の3つのことが可能になりつつあるからです。
─────────────────────────────
        1.3つの認識が可能になる
        2.運動ができるようになる
        3.言語の意味が理解できる
─────────────────────────────
 上記「1」の「3つの認識」とは何でしょうか。1つは「画像
認識」、2つは「文字認識」、3つは「音声認識」です。ひとつ
ずつどこまでできるようになっているか考えることにします。
 「画像認識」については、これまでは悪戦苦闘していたのです
が、「グーグルの猫」が認識できるようになり、AIは明らかに
ブレークスルーを成し遂げたのです。画像を認識するということ
は、その特徴点を見分けるということです。猫を見分けるために
動画から取り込んだ1000万枚の画像を解析し、1000台も
のコンピュータで3日かけて学習し、やっと認識したのです。
 画像認識がうまくいけば、「文字認識」と「音声認識」はクリ
アできるのです。実際に現在のAIは、まだ課題はあるものの、
文字認識も音声認識もできるようになりつつあります。
 上記「2」の「運動ができるようになる」は、ロボットの開発
に応用され、少しずつ実現しつつあります。これには、自動運転
車の問題も含みます。自動運転車は現在進んでいるように見えま
すが、まだまだ多くの難題を抱えています。
 上記「3」の「言語の意味が理解できる」は、翻訳や通訳に応
用できますが、実はこれが一番難しいのです。ペッパーなどのロ
ボットは、人の言葉を理解し、それに対応した行動をとりつつあ
るように見えますが、ペッパーは相手の声と自分が発する声の見
分けがつかないのです。そのため、ペッパーなどのコミュニケー
ションロボットは、自分が話すときは、マイクはオフになってい
るのです。なぜなら、ロボットは自分が話す音を認識してしまう
と、それに対しても答えようとする無限ループに陥ってしまうか
らです。そのため、ロボットが話すときは、マイクは自動的にオ
フになります。
 「ディープマインド」という英国の人工知能企業があります。
2010年にディープマインドテクノロジーとして起業されたの
ですが、2014年にグーグルに買収され、ディープマインド社
になったのです。
 このディープマインド社が開発したのが、碁のAIアルゴリズ
ム「アルファ碁」です。2016年3月、「アルファ碁」は、世
界トップレベルの韓国のイ・セドル九段に4勝1敗で勝利し、世
界的に有名になります。
 このディープマインド社のCEOであるデミス・ハサビス氏は
ゲームの世界では、「DQN」という汎用学習アルゴリズムの天
才的開発者として知られています。
─────────────────────────────
             「DQN」
           Deep Q-Network
 DQNは画像認識に多く用いられる深層学習と強化学習(Q学
習)を組み合わせたアルゴリズムにより動作し、ゲームのルール
を教えていない場合でも、どのように操作すれば高得点を目指す
ことができるのかを判断することができる。
        ──ウィキペディア https://bit.ly/2ina8Ef
─────────────────────────────
 「DQN」は、どのようなゲームにも適用できる画期的な汎用
学習アルゴリズムで、ゲーム画面の出力信号と「高いスコアを出
せ」という指令のみで動くといわれます。つまり、「高得点を出
せ」と命令すると、得点を上げるメカニズムを超スピードで学習
し、そういう結果を出してくるのです。
 DQNは、49種類のゲーム中、43種類で従来のAIによる
得点を上回り、29のゲームでは、プロゲーマーと同等またはそ
れ以上のパフォーマンスをみせたといわれます。
 ディープマインド社は、このDQNをベースに「アルファ碁」
を開発したのです。「アルファ碁」は、イ・セドル九段を破った
ことで、「名誉九段」の称号が与えられていますが、その後につ
いて次の話があります。
 韓国に「東洋囲碁」というインターネット囲碁サイトがありま
す。2016年12月29日から31日にかけて、その囲碁サイ
トに「マジスター/Magister」というIDの棋士が現れ、世界ラ
ンクトップの中国のケ・ジェ九段や韓国ランキング1位のパク・
ジョンファン九段など、世界トップ級の棋士と対局しています。
結果は30戦全勝です。
 2017年1月1日から5日にかけて、中国で韓国と同じよう
なことが起きたのです。中国の囲碁サイト「野狐囲碁」に「マス
ター/Master」と名乗るID棋士が現れ、世界トップ級棋士とさ
らに30戦戦い、全勝しています。韓国の「東洋囲碁」と中国の
「野狐囲碁」の戦績を合わせると、60戦60勝、勝率100%
ということになります。
 実は、デミス・ハサビ氏は、マジスターIDもマスターIDも
「アルファ碁」の進化型であることを明かしています。今後の公
式戦に備えて、テストを行ったのです。もはや囲碁とか将棋の世
界では、AIに人は勝てないといっても過言ではないようです。
 しかし、将棋にしても囲碁にしても、すべての情報が開示され
ているゲームです。しかし、ポーカーや麻雀などは、相手の手は
隠されていてわからないゲームです。そういうゲームで、AIが
勝利を収めたという話はありません。したがって、AIによって
すべてのゲームが支配されたということにはならないのです。し
かし、ビジネスというゲームには、AIは無限の活用の余地があ
ります。      ──[次世代テクノロジー論U/031]

≪画像および関連情報≫
 ●囲碁の最強人工知能「アルファ碁」の仕組みとは?
  ───────────────────────────
   2017年5月27日、人類最強の呼び声が高い棋士ケ・
  ジェにグーグル社傘下のイギリスの人工知能企業のディープ
  マインド社が開発する「アルファ碁」が勝利しました。
   27日の対局に先立ち23日、25日にも「アルファ碁」
  はケ・ジェを相手に勝利し、ケ・ジェは人工知能を相手にま
  さかの全敗を喫したのです。囲碁は元々、AI(人工知能)
  にとって、もっとも難しいゲームの一つとされていました。
  最強棋士を破る囲碁AIは、どのようにして、生まれたので
  しょうか?
   2015年10月、碁のヨーロッパ王者であるファン・フ
  イ2段に5戦5勝を収め、続く2016年3月には、21年
  間のプロキャリアで18回に渡って世界王者になった経歴を
  持つイ・セドル9段に4勝1敗で勝利しました。
   敗北はとてもハードなことだった。アルファ碁と対局する
  前は、僕は「きっと勝てるだろう」と考えていた。最初の対
  局の後には戦術を変えて挑んだのだけど、それでも負けてし
  まった。人間には時に大きなミスをするという問題がある。
  なぜなら、僕たちは人間だからだ。時には僕たちは疲れてい
  るし、時には「何が何でもゲームに勝ちたい」と望んで、大
  きなプレッシャーを感じる。でも、プログラムはそうじゃな
  い。まるで壁のようにプログラムはとても強く、安定してい
  る。この違いは、僕にとってはとても大きなものなんだ。僕
  はアルファ碁がコンピューターであることを元々知っていた
  けれど、もしも誰一人としてその事実を僕に伝えていなかっ
  たら、僕は対局相手のことを少々奇妙だがとても強い本物の
  人間のプレイヤーだと感じただろうね。
                  https://bit.ly/2tfyKlI
  ───────────────────────────

中国最強棋士と対局する「アルファ碁」.jpg
中国最強棋士と対局する「アルファ碁」
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月19日

●「人工知能最大の難問フレーム問題」(EJ第4788号)

 ディープラーニング革命によって、AI(人工知能)に関わる
難問が次々と解決されています。画像認識、文字認識、音声認識
などが急速にクリアされています。しかし、AIには根本的に解
決できない難問があります。それは「フレーム問題」です。
 フレーム問題とは何か──これは基本的に人間と機械の違いに
直面する難しい問題です。まずは、フレーム問題とは何かについ
て、雑賀美明氏の著書から引用します。
─────────────────────────────
 フレーム問題というのもあります。
 これは、1969年にジョン・マッカーシーとパトリック・ヘ
イズが指摘した人工知能研究の最大の難問です。今からしようと
していることに関係のある事柄だけを選び出すことが、実は非常
に難しいと言う問題です。周りの環境から、何が関係あって、何
が関係ないかを調べるために、無限の計算が必要になって人工知
能が止まってしまうことを「フレーム(枠)問題」と言います。
 人工知能は、チェスやオセロのような閉じられたルールの枠の
中では有効に働きますが、現実の世界のように開かれた世界に飛
び出すと、情報を処理しきれずに動きが停止してしまいます。コ
ンピュータには有限の処理能力しかないので、何も動作できずに
止まってしまうのです。    ──雑賀美明著/マルジュ社刊
      『人工知能×仮想現実の衝撃/第4次産業革命から
                  シンギュラリティまで』
─────────────────────────────
 フレーム問題について、身近の事件から探っていくことにしま
す。このところ新幹線でのトラブルが相次いでいます。6月9日
の新幹線「のぞみ265号」での乗客殺傷事件、これに続く14
日の「のぞみ176号」による人身事故など。とくに人身事故で
は、運転手はトンネル内で異音を聞いているのに、小動物である
と思ってそのことを運転指令に報告せず、列車を停止しなかった
のです。これは明らかに業務規則違反です。こんなことはあって
はならないことです。
 このケースとはまるで違いますが、車に乗っていてフロントガ
ラスに何かがぶつかったとします。そういうことはよくあること
です。小石が跳ねたかもしれないし、何らの虫がぶつかったかも
しれない。そういう場合、人間の運転者であれば、車を止めるこ
とはないはずです。人間なら、何がぶつかったか見当がつくし、
それが運転継続に支障をきたすことではないかわかるからです。
 ところが、この車がAIによる自動運転車であった場合、仮に
ぶつかったものが虫であっても、急停車するはずです。AIには
ぶつかったものが虫なのか、小石なのか、人なのかを判断できな
いからです。しかし走っているのですから、フロントガラスには
いろいろなものがぶつかりますが、そのたびに、車が止まってし
まったら、不便きわまりないことになります。
 このように、人間なら簡単にできることが、AIにはできない
し、逆に人間なら到底できないことが、AIなら短い時間で正確
に仕上げてしまうことが多いのです。このことは、フレーム問題
と関係があります。
 5月25日付/EJ第4771号で「マイシン」というエキス
パートシステムをご紹介しました。この「マイシン」について、
中島秀之東京大学大学院特任教授がフレーム問題との関連で、次
のように対談で述べています。
─────────────────────────────
――エキスパートシステムというのは、まるで人間のエキスパー
ト(専門家)のように、与えられた知識から推論して複雑な問題
を解くよう設計されたAIのことですね。医療系のエキスパート
システムだったマイシンは、伝染性の血液疾患の患者さんを診断
していたと聞いたことがあります。
中島:そうです。マイシンは、感染症の診断が、トップクラスの
   医者には負けるけれど、人間のインターンよりは優れてい
   ました。さまざまな医学知識を取り込んで、いろんな推論
   を展開するのは、AIの得意分野です。ところが、マイシ
   ンのようなAIは、一部の例外を除いて、結局、実用化さ
   れませんでした。
――なぜですか?
中島:大きな理由の1つは、感染症を調べるためにいろいろ検査
   するとき、「子どもに注射を打つ検査をあんまりやると、
   痛がるからだめだよ」という知識が、医学書には書いてい
   なかったからです。
――つまり、マイシンは、検査に必要となれば、子どもにも注射
をバンバン打つよう指示してしまったわけですね?
中島:そうです。「子どもが注射を嫌う」というのは、人にとっ
   ては常識です。しかし、AIであるマイシンには、わから
   ない。じゃあ、AIに読ませる医学書に「子どもは注射が
   嫌い」と書けば済むのかというと、そういう常識の類は、
   ほかにもいっぱいあるわけです。
                  https://nkbp.jp/2JYiG2m
─────────────────────────────
 「マイシン」というエキスパーシステムには、感染症の検査に
必要な医学知識やノウハウはすべて入れてあるのですが、医師は
それだけで診断するわけではありません。それに人間であれば誰
でも持っている「常識」に基づいて診断を下すのですが、AIは
それを持っていないのです。
 それなら、それらの「常識」をAIに与えればよいということ
にはならないのです。人間の持っている知識は、驚くほど多く、
人間自身も自分がどれだけの知識や情報を持っているか意識して
おらず、人間はそれらを基にして総合的に判断を下しているので
す。そういう知識をAIに学習させることは困難です。こういう
ことから、フレーム問題は起きてくるのです。これについては、
明日のEJでももっと詳しく取り上げて考えてみます。
          ──[次世代テクノロジー論U/032]

≪画像および関連情報≫
 ●人工知能の大半は、ないものを「ない」と認識できない
  ───────────────────────────
   例えば、会社の歓迎会で花見を開催したとしましょう。ブ
  ルーシートに並べられた缶ビールを見て、「どうしてキリン
  ビールはないの?」「私はよなよなエールが好きなのに」と
  文句を言われた経験はありませんか?一見、自然な会話に見
  えますが、人工知能にこれを言わせようとすると非常に大変
  です。
   まず、日本で販売されている全ての缶ビールを学習させた
  (覚えさせた)上で、目の前に置かれた缶ビールのラベルを
  1つ1つ認識させれば、どのビールがあって、どのビールが
  ないかが分かります。しかし、重み付けなどを行って1つだ
  けを選ばせるといった制御をしない限り、「キリンビールが
  ない」とは言わずに、そこにないビールを全て列挙すること
  になるでしょう。
   その人工知能が「花見で買ってきていないビールすぐ認識
  する君」のような超特化型のAIならよいですが、人間のよ
  うな汎用的思考を持った、いわゆる「汎用人工知能」が認識
  しようとすると、実現性は一気に低くなります。日々新たな
  商品が生まれる、全ての缶ビールを学習させるなど事実上不
  可能だからです。これがもし、ハイボールや缶酎ハイも加え
  ることになったら・・・と考えればキリがありません。
                  https://bit.ly/2JUkHJt
  ───────────────────────────

中島秀之東京大学大学院特任教授.jpg
中島秀之東京大学大学院特任教授
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月20日

●「松岡正剛氏が斬る/フレーム問題」(EJ第4789号)

 フレーム問題の存在を指摘する有名なロボットの問題がありま
す。それをわかりやすく一部を変更して記述します。
 AIロボット1号は、危険な場所へ荷物を運んだり、運び出す
仕事をするロボットです。あるとき、倉庫に爆弾が仕掛けられた
という情報が入ったので、AIロボット1号に、爆弾が仕掛けら
れたとする倉庫から、高価な美術品を運び出してくるよう命令し
たのです。
 AIロボット1号は、倉庫に行き、台車に美術品を乗せて倉庫
の外まで運び出したのですが、爆弾は台車に仕掛けられていたの
で、倉庫を出たところで爆弾が爆発し、目的を果たすことができ
ませんでした。
 これに対してAIロボット2号は、さまざまな安全確認をして
から荷物を運び出すロボットです。このロボットに爆弾が仕掛け
られている倉庫から美術品を運び出す命令を与えたのです。AI
ロボット2号は倉庫に行ったのですが、美術品の前で動きを止め
てしまい、そのうち爆弾が爆発して倉庫ごと吹き飛んでしまった
のです。AIロボット2号に何が起きたのでしょうか。
 AIロボット2号は、倉庫から美術品のところに行き、安全性
を次のようにチェックしたのです。それは、あらゆる安全項目の
チェックだったのです。
─────────────────────────────
    ・台車には本当に爆弾が仕掛けられていないか
    ・美術品の内部に爆弾が仕掛けられていないか
    ・台車を動かしても天井は落ちたりはしないか
    ・台車を動かしても壁の色は変わったりしない
    ・台車を動かしても倉庫内の電気は消えないか
    ・台車を動かしても・・・・・
─────────────────────────────
 倉庫に入ったAIロボットは、美術品を台車に積んで運び出す
に当たって、あらゆる安全項目の確認を行い、時間がなくなって
爆弾が爆発してしまっています。
 AIロボット2号は、人間の立場から見ると、このさいどうで
もいい安全確認をやって無駄な時間を費やしています。目的は美
術品を安全に倉庫の外に運び出すことであり、美術品や台車に爆
弾が仕掛けられていないかをチェックするだけよかったのです。
つまり、限定された重要な「フレーム」に絞って、安全確認をや
れぱよいだけの話です。
 しかし、それは人間にはできても、AIにはできないのです。
ある行動の目的を果すために、関連のある物事だけにフレームを
絞って安全な確認をやることは、AIはできないのです。これを
AIのフレーム問題といいます。
 このフレーム問題について、もう少し明解に説明している文章
があります。少し長いですが、これを読んでください。
─────────────────────────────
 人間は「あのコップを取ってきてくれ」というお題には誰だっ
てたやすく判断行動をおこす。幼児もよろこんでこのタスクに挑
戦し、よちよち歩いてお母さんに両手に挟んだコップを渡す。
 ところがコンピュータやロボットでは、「あのコップ」がテー
ブルや棚やお盆に所属するのかどうかから、判断しなければなら
ない。コンピュータやロボットが持っている知識マップに、コッ
プの帰属や所属が一義的に記述されていればそれでいいというも
のではない。
 「コップはときにお盆にのっている」という知識マップがあれ
ば、AIロボットはそのお盆と分けられるコップだけを持ってく
ることをするが、仮に、「コップは棚にある」という記述だけが
あって、「コップは、棚板でできている棚の上にある可能性が高
い」という記述がないと、ロボットは棚板ごと引きちぎってコッ
プを持ってきてしまう。
 つまり言語や概念がどんな知識のフレームをもっているのか、
そのことを機械が峻別しようとするとかなり難しい処理が必要に
なるわけだ。これを「フレーム問題」と言ってきた。
 ちなみにイシス編集学校では、比較的早い時期に「コップの言
い換え」というエクササイズをする。コップに内属している要素
・機能・属性を確認しつつも、コップに内包されうる意味をあら
かじめふくらませておくためだ。編集学校は世間の分節常識にと
らわれないで、自由なフレームや分節に遊ぶことを奨励する学校
なので、そこは人工知能がめざすところとはいささか異なってい
るのである。
 もっとも近い将来は「編集工学的人工知能」も大いにありうる
ことで、その場合は入力と出力との「あいだ」が見えるようなも
の、その「あいだ」からタスクやイメージが発見できるものにな
るだろう。             https://bit.ly/2Myn3PW
─────────────────────────────
 松岡正剛という人物がいます。この人は「書評作家」というべ
き存在です。「知の巨人」ともいわれています。書評といっても
特定の分野に偏らず、幅広い分野にわたって本の書評を書いてい
るのですが、それは書評というよりも、ひとつの立派な文藝作品
になっています。もちろん科学の分野にも鋭くメスを入れます。
それらの書評は「千夜千冊」というサイトにまとめられ、多くの
人に読まれています。私は、自分の読んだ本を松岡正剛氏がどう
評しているか興味をもって読んでいます。その逆もあります。
 上記の一文は、AI界の第一人者である松尾豊氏の次の著書の
書評の一部で、フレーム問題を論じています。こういう難解な問
題にも逃げずに挑戦する凄い人です。
─────────────────────────────
              松尾 豊著/角川EPUB選書
      『人工知能は人間を超えるか
          /ディープラーニングの先にあるもの』
─────────────────────────────
          ──[次世代テクノロジー論U/033]

≪画像および関連情報≫
 ●人工知能は禅によってフレーム問題を解決する
  ───────────────────────────
   「自我を持つ人工知能を開発するには、人工知能開発のベ
  ースとなった西洋哲学だけでは限界がある。東洋哲学の考え
  も取り込むべきだ」としてスタートした「人工知能のための
  哲学塾東洋編」。荘子からはじまり、イスラム哲学、仏教、
  インド哲学と進んできた本セミナーも2017年11月13
  日、いよいよ最終回を迎えました。「人工知能と禅」をテー
  マに掲げた第5回目では、おなじみSIG−AIの三宅陽一
  郎氏が、これまでの議論を巻き取りながら、「禅によって悟
  る人工知能」のビジョンについて解説しました。
   大前提として、現在の人工知能が抱える問題とは何でしょ
  うか。それは「問題を自分で設定できないこと」に行き着き
  ます。いくら強化学習でアルファ碁が人間を打ち負かしたと
  しても、それは碁というゲームの中での最適解に過ぎず、新
  しいゲームを創り出すことはできないというわけです。実際
  現在の大半の人工知能は「問題特化型」にすぎません。古今
  東西の人工知能研究者を悩まし続けてきたフレーム問題は、
  依然として高くそびえ立っています。
   それでは、このフレーム問題はどのようにすれば解決でき
  るのでしょうか?そして、フレーム問題の解決は「自我」と
  どのような関係性を持つのでしょうか。三宅氏の講演をまる
  っとまとめると、「人工知能がフレームを自力で設定するに
  は、人工知能が『悟る』ことが重要」で、フレームを自力で
  設定できる力が、自我の獲得にもつながるということになり
  ます。なぜ、そのような結論になるのか。そもそも「悟る」
  とは何なのか。         https://bit.ly/2JTFEEs
  ───────────────────────────

松岡正剛氏.jpg
松岡正剛氏
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月21日

●「AIの全体像はどうなっているか」(EJ第4790号)

 本日のEJから、AI(人工知能)の正体をもっと具体的に明
らかにしたいと考えています。改めて考えてみると、「AI」と
は何なのかわからなくなります。ハードウェアなのでしょうか、
それともソフトウェアなのでしょうか。
 「AI」という言葉は、あまりにも抽象的です。たとえば、自
動運転車というのは、AIシステムを搭載した乗用車であるとい
われますが、車にハードウェアとしてコンピュータが搭載されて
おり、その上でAIシステムが動いているのでしょうか。あれこ
れ考えていくと、何だかわからなくなります。
 このあたりことをはっきりさせたいと思います。つまり「AI
の構造がどうなっているか」について、そろそろはっきりさせる
必要があります。
 PCの構造について考えてみましょう。PCの構造を図であら
わすと、3層構造になっています。一番下はハードウェア、その
上にOS(基本ソフト)があり、さらにその上にアプリケーショ
ンがあります。OSはハードウェアに合わせて作られており、そ
のOSの環境の下で、アプリケーションが動くのです。このさい
ハードウェアとは、具体的には「CPU」のことであると考えて
ください。簡単にいうと、これがPCの構造です。
 このことを頭において添付ファイルの図を見てください。これ
は、AIの全体像を階層的に示しています。階層ごとに簡単に説
明していきます。
 一番下にはハードウェアがあります。これらはニューラルネッ
トワークの高速処理を支えるハードウェア(処理チップ)です。
代表的なものは、次の4つです。
─────────────────────────────
        1.NVIDIA GPU
        2.  グーグル TPU
        3.      FPGA
        4.      ASIC
─────────────────────────────
 その上層に「ライブラリ」があります。ニューラルネットワー
クの処理を行うのがライブラリ、すなわち、フレームワークのこ
とです。AIアプリケーションを作成するときは、これらのライ
ブラリを使います。
 さらにその上層に、これらのフレームワークを使って目的別に
開発されたAIサービスを提供するAIプラットフォームがあり
ます。これはOSのようなものと考えればいいでしょう。AIの
技術は現在発展中であり、統一的なものはなく、プラットフォー
ムは、各社から提供されています。
 その上にあるのは、各種のアプリケーションです。アプリケー
ションは、次のように3つに分けることができます。
─────────────────────────────
 上 層:ビジネス活用AIアプリケーション
     医療、教育、製造業、小売業、農業など
 中間層:単一要素アプリケーションを組み合わせたもの
     パーソナルアシスタント、ロボティクスなど
 下 層:単一要素のアプリケーション
     音声認識、画像認識、機械翻訳など
─────────────────────────────
 結論からいうと、AIの性能を左右するのは、ハードウェア、
つまり、コンピュータの頭脳に該当する処理チップなのです。な
かでも、ディープラーニングの精度向上のカギを握っているのは
エヌビディアの「GPU(グラフィックス・プロセッシング・ユ
ニット)」です。エヌビィディアコーポレーションという米国の
企業が製作しています。カルフォルニア州サンタクララにある半
導体メーカーです。この企業は、もともとはゲーム用半導体のメ
ーカーとして知られていたのですが、2012年頃からはAIの
発展にとって欠かせない企業になっています。
 ところで、「GPU」とは何でしょうか。「CPU」とはどう
違うのでしょうか。英語の表記は次のようになります。
─────────────────────────────
      CPU   Central Processing Unit
      GPU  Graphics Processing Unit
─────────────────────────────
 CPUとGPUの違いを知るには、少し詳しい説明が必要にな
ります。これについては、これから逐次説明していきますが、そ
ういう説明なしで、ズハリその特色を述べると、その違いは次の
ようになります。
─────────────────────────────
    CPU ・・・ 複雑な計算処理に優れている
    GPU ・・・ 大量の単純計算に優れている
─────────────────────────────
 CPUもGPUも計算をするチップという点では同じですが、
その違いがわかる有名な動画があります。解説は英語ですが、英
語の意味がわからなくても映像で十分理解できるので、ぜひご覧
ください。時間は1分33秒です。
─────────────────────────────
      ◎CPUとGPUの違いが分かる動画
            https://bit.ly/2lnlbgK
─────────────────────────────
 この動画では、前者のスプレーガンをCPU、後者のスプレー
ガンをGPUに見立てています。前者は、ひとつ一つていねいに
処理をしているのに対し、後者は、一気に同じ処理を並列して、
行っています。
 CPUとGPUの位置づけとしては、コンピュータでは何でも
できるCPUが中心チップであり、GPUは、グラフィックスの
計算に特化して処理を行い、CPUを助ける存在と理解してくだ
さい。詳しい説明については明日以降のEJで説明します。
          ──[次世代テクノロジー論U/034]

≪画像および関連情報≫
 ●爆進・エヌビディアは「三日天下」を招くのか
  ───────────────────────────
   「エヌビディアは頭がおかしくなった」「まったくナンセ
  ンス」。世界のITエンジニアが利用する複数の英語掲示板
  ではそんな意見が頻繁に交換されている。AI(人工知能)
  開発インフラを提供する非営利団体、米ファストAIのジェ
  レミー・ハワード氏は、ツイッター上で「エヌビディアは、
  長年の信用を、たったひとつの恐るべき決断で失うだろう」
  とまで批判している。
   詳細を書く前に、エヌビディアについて簡単におさらいし
  ておこう。エヌビディアは、近年の世界的なAIブームで躍
  進した企業の代表格だ。開発に特化したファブレス型の半導
  体メーカーで、GPU(グラフィック・プロセッシング・ユ
  ニット)と呼ばれる半導体の最大手。GPUは本来、CG制
  作やインターネットゲームで画像を処理する際に使われてき
  たが、近年AIの計算処理にも多用されている。
   パソコン普及期の米インテル製プロセッサのように、GP
  UはAIの普及を支える「コア部品」なのだ。AI需要を背
  景に、エヌビディアの時価総額は直近で約13・4兆円。過
  去3年で10倍に伸びており、伸び率ではグーグルやアップ
  ルを大きく上回る超成長銘柄となった。
                  https://bit.ly/2MAOGrL
  ───────────────────────────

AIの全体像.jpg
AIの全体像
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月22日

●「GPUはどのように誕生したのか」(EJ第4791号)

 コンピュータとは何でしようか。「コンピュータ」という言葉
を聞いて、何を連想するでしょうか。
 多くの人は、PC(パソコン)やスマホやタブレットを連想し
ます。なぜなら、自分のごく身近にあるコンピュータであるから
です。もっともスマホをコンピュータであるとを認識していない
人もいます。しかし、多くの場合、スマホは、PCよりも高性能
なコンピュータなのです。スマホは5年前のスパコンに匹敵する
ともいわれています。それに現在のスマホには、AI機能まで搭
載されています。
 しかし、これからは、コンピュータの定義を次のようにすべき
ではないかと思います。
─────────────────────────────
      コンピュータとはCPUそのものである
─────────────────────────────
 スーパーコンピュータというと、多くの人は、いわゆるPCな
どは違う、何か特殊な構造を持つ大型のコンピュータをイメージ
しますが、基本構造は、普通のPCと変わらないコンピュータな
のです。
 日本には「京(けい)」というスーパーコンピュータがありま
す。年に2回、その処理速度を計測して上位500位を発表する
「TOP500」ランキングで、「京」は、2011年において
2期連続で1位を獲得した高速コンピュータです。
 少し専門的にいうと、「京」は、CPUを8万8128個搭載
し、整数の計算よりも処理に時間のかかる浮動小数点演算と呼ば
れる計算を毎秒1京510兆回実施できるコンピュータです。こ
れは、2011年の演算レベルですから、現在ではもっと高速に
なっている可能性は十分あります。
 このように、スーパーコンピュータは、CPUを8万個以上搭
載しているものの、基本的にはPCと変わらないのです。極端な
ことをいえば、企業の終業後のPCを複数並列に接続して計算し
ても基本的にスパコンに似た処理ができるのです。「京」は、汎
用のCPUを並列に搭載する「スカラー型」というタイプのスー
パーコンピュータです。
 このように、コンピュータの能力はCPUで決まるので、CP
Uはコンピュータそのものです。それでは、CPUとGPUはど
のように違うのでしょうか。
 どうしてGPUが登場したのかというと、PCのOSの変遷に
関係があります。CPUは、コンピュータの「頭脳」といわれま
す。コンピュータ上のあらゆる処理はCPUが行います。しかも
ムーアの法則に従い、CPUの高速化は1年半ごとに倍速のペー
スで進化したのです。
 しかし、CPUが扱うデータ量も急速に増加し、CPUの負担
は、年々増加する一方です。ひとつのきっかけは、1995年に
訪れたのです。
─────────────────────────────
        MS−DOS ・・・ CUI
       WINDOWS ・・・ GUI
─────────────────────────────
 1995年以前、1981年に発売のIBMの16ビットPC
「5150」──このPCに搭載されたOSが「PC−DOS」
(マイクロソフト社提供のMS−DOS)です。このOSは基本
的には文字ベースの「キャラクタ・ユーザー・インターフェース
/CUI」だったのです。
 しかし、DOS時代の後半にはCADなどの作業には、専用の
ハードウェアを用意してグラフィック処理を行っていますが、そ
れらの需要は限られたものだったのです。この時代がしばらく続
きます。この時代に個人がPCで扱うグラフィックス・データの
量はたいしたことはなく、若干の補助装置を付ければ、当時のC
PUでも十分に対応できたのです。
 ところが、1990年頃から、32ビットCPU搭載のPCが
出現します。1991年には「ウインドウズ3・0」搭載のPC
が登場し、「グラフィック・ユーザー・インターフェイス/GU
I」の時代が始まります。32ビットCPU時代の幕開けです。
このときから、PCの扱うグラフィック・データ量は激増するよ
うになり、CPUによるグラフィックスデータの処理負担はきわ
めて重くなります。
 「ウインドウズ3・0」──よほど専門的なユーザーでない限
り、このOSのことを当時知る人は少なかったと思います。その
後に出る「ウインドウズ3・1」は知っていても、このウインド
ウズを使った人は少ないと思います。当時明治生命情報システム
部の私のチームは、3・0のベータ版を入手し、さまざなアプリ
ケーションをテスト的に構築しています。そして、ウインドウズ
3・0の解説本も、チームで執筆しています。この準備があった
ので、生保業界で一番先にウインドウズを導入できたのです。
 1993年に「ウインドウズ3・0」の改良型「ウインドウズ
3・1」が登場し、それを踏まえて1995年に「ウインドウズ
95」搭載のPCが登場し、本格的なウインドウズ時代が始まる
ことになります。
 このときから、激増したCPUのグラフィック・データ処理の
一部を「グラフィック・アクセラレータ」というハードウェアで
処理するようになります。つまり、激増するグラフィックス・デ
ータの処理を、専用のアクセラーレータというハードウェアで肩
代わりするシステムが実現したのです。
 今になって考えると、これが後の「GPU」の開発に結びつい
てきます。PCのグラフィックス・ユーザー・インターフェイス
(GUI)の定着とともに、その後、動画や3Dグラフィックス
など、処理しなければならないグラフィックス・データ量は激増
し、その高速処理の実現が求められたのです。これはPCの根本
的なハードウェアの構造変化を促すことになります。
          ──[次世代テクノロジー論U/035]

≪画像および関連情報≫
 ●グラフィックカードってどんな役割をするの?
  ───────────────────────────
   パソコンがディスプレイモニター上に映し出す映像は、文
  字や写真といった「2D(平面)映像」と、立体的な三次元
  コンピュータグラフィックス(3DCG)に代表される「3D
  (立体)映像」に大きく二分されます。(※ここでいう3D
  は、最近話題のメガネをかけて映像が飛び出てくる3Dとは
  別の話)。基本的に、2Dではあらかじめ用意された画像を
  映し出すのに対し、3Dでは縦・横・高さ・奥行きなどの位
  置情報から計算して映像を作り出します。その為、3Dの方
  が2Dよりも高度な処理を必要とし、より美しい3D映像を
  よりスムーズに描画するには、高性能なグラフィックス機能
  が必要となってきます。
   多少強引な説明となりますが、2Dを表示するためには、
  グラフィックスチップ(GPU)の性能よりも、VRAMと
  呼ばれる映像処理に使う、グラフィックスメモリの容量の方
  が重要となります。実は、フルHD解像度(1920×10
  80)を超える2048×1536もの高解像度な映像をフ
  ルカラー表示するのに必要なVRAM容量は16MBであり
  一昔前のパソコンでも十分な性能を持っています。このよう
  な状況から、現在のグラフィックカードは「3D映像を美し
  く高速に描画させるためのもの」と言っても過言ではないで
  しょう。では、3Dを使わない人にはグラフィックカードは
  不要なのか?という疑問が湧きますが、最近ではOSで3D
  機能を使用したり、グラフィックカードをグラフィックス処
  理だけでなく汎用的に利用する動きも広がりを見せているの
  で、グラフィックカードを搭載しなくても良いとは一概には
  言えなくなってきています。   https://bit.ly/2K8U9aM
  ───────────────────────────

スーパーコンピュータ「京」.jpg
スーパーコンピュータ「京」
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月25日

●「GPUとディープラーニング演算」(EJ第4792号)

 「GPU」の話を続けます。GPUは、AI(人工知能)を理
解するには不可欠なものです。GPUがわからないと、AIは抽
象的にしか理解できません。それにGPUを知るには、CPUを
理解する必要があります。
 まず、「CPU」と「コア」という言葉の違いについて知る必
要があります。かつては、PCには1個のCPUしか装着されて
いなかったので「CPU=コア」だったのです。しかし、現代で
は、PCに複数のCPUがつく「マルチコア」の時代になってい
るので、CPUとコアを分けて考える必要があります。インテル
の最新チップで考えてみます。
 添付ファイルをご覧ください。左上は、インテルの最新のチッ
プ「コア・アイ・セブン/Core i7」をの上から見たものです。一
般的にはこれをもって「CPU」であるとしています。それは間
違いないことですが、このチップには、2個か4個の「コア」が
装着されています。
 この場合、「コア」とはCPUの核にあたる部分であり、かつ
てのCPUと同じものと考えればよいのです。左上の図はコアお
よびその他の部分をパッケージにしたもので、正確には「ダイ」
というべきです。
 ダイは、薄いシリコン基板の上に数千万〜1億個のトランジス
タが集積され、回路を形成していますが、その回路がコアです。
チップの名称が印刷されているフタように見えるものは、「ヒー
トスプレッダ」といいます。ただのフタではなく、ダイの保護と
放熱を助ける働きをします。そして、この上には、動作時の高熱
を冷やす冷却装置を取り付けます。ファンが主流ですが、水冷方
式のヒートシンクもあります。
 右上と右下の図はダイの拡大図とその裏面です。ダイはそれぞ
れの機能によって、複数のユニットに区分けされています。ダイ
の裏面には「パッケージ」といわれるものがあります。これは、
ダイを保護し、内部はピンとダイを接続するための回路配線が組
み込まれています。
 左下の図はダイの裏面です。中心部は「コンデンサ」、周囲は
「ピン」です。コンデンサは、電気を蓄えて信号や電源を安定さ
せる役割をします。ピンは、マザーボードのCPUソケットに接
続するための端子です。ピンの本数はパッケージの種類によって
異なります。
 コンピュータでやれることが増えてくると、コアの数も増えて
きます。1コアから10コアまでの名称をご紹介します。
─────────────────────────────
         1コア:シングルコア
         2コア:デュアルコア
         3コア:トリプルコア
         4コア:クアッドコア
         6コア: ヘキサコア
         8コア: オクタコア
        10コア:  デカコア
─────────────────────────────
 これに対して「GPU」とは何でしょうか。
 GPUという言葉は、NVIDIA(エヌビティア)という米
国のチップメーカーが作った言葉です。GPUを一言でいうと、
次のようになります。
─────────────────────────────
   GPUは並列処理を行うことで高速に回す装置である
─────────────────────────────
 これだけではわからないと思うので、GPUというチップが何
をするものかについて、NVIDIAの井崎ディープラーニング
部長のインタビューでの話をご紹介します。
─────────────────────────────
 3Dグラフィックのことからお話ししますね。3Dグラフィッ
クを表現するためには、ポリゴン三角形の頂点の座標位置の計算
と、そこにのせるピクセルデータの計算が必要です。
 それぞれの計算に専用エンジンがあったんですが、片方が暇で
片方が忙しいみたいなことが課題としてありました。効率よくな
いんです。そこで効率よく、かつ汎用的な計算を行えるように、
ハードをズラーッと並べて、プログラムで制御できるようにした
のです。この技術が2000年以降の3Dグラフィックのアーキ
テクチャを大きく変えたとのことでした。
 つまり、GPUというモノでそれぞれの専用エンジンをひとつ
にまとめたってことのようです。これって計算が高速で行えるっ
てことなので、べつに3Dグラフィックだけに限った話ではない
んです。GPUはアクセラレータとして動作するため、CPUと
相まって使われることになります。  https://bit.ly/2K4m8sU
─────────────────────────────
 グラフィックスの計算は、単純な計算の繰り返し処理なのです
が、とにかく量が多いのです。CPUでもできますが、量が多い
ので時間がかかる。そこで、多くのPCをずらっと並列につない
て、処理をやらせたところ、やっと満足できる計算レベルに達し
たというのです。井崎部長によると、それをひとつのチップにし
たものがGPUであるといっています。
 結局、高速にするには、コアの数を増やすことが必要なので、
GPUはコア数が多いのです。CPUの最大は24個だそうです
が、GPUは3000〜4000個も入っています。このコアの
違いが並列処理を加速させているのです。
 ディ―プラーニングの計算量はとても凄いのです。10層ぐら
いのディープラーニングでも10億個ぐらいのパラメータのチュ
ーニングが必要になるといわれます。これをCPUでやると丸1
年かかるが、GPUを使うと30日で終るといいます。企業では
30日は待てないので、GPUを複数使って時間を短縮します。
このように、ディープラーニングにはGPUは不可欠な存在なの
です。       ──[次世代テクノロジー論U/036]

≪画像および関連情報≫
 ●なぜ人工知能研究でNVIDIAのGPUが使われるのか
  ───────────────────────────
   自作PC派にとってなじみ深い「NVIDIA」のロゴ。
  ビデオカード(GPU)のドライバをインストールする際に
  目にした人は多いはずだ。そんなNVIDIAの名前を意外
  なところで見掛ける機会が増えた。2017年5月、日本経
  済新聞は、「トヨタの自動運転、米エヌビディア提携で開発
  加速」と報じた。GPUのメーカーが、「なぜ、トヨタと提
  携?」と不思議だった。
   調べてみると、フォード・モーター、ボルボ、メルセデス
  ベンツ、アウディ、テスラなど、名だたる自動車メーカーと
  自動運転研究の分野で提携済みであり、その後においても、
  Robert Bosch、ZF Friedrichshafen、Continental といった
  大手自動車部品メーカーと提携を加速させている。エヌビィ
  ディアのパートナー紹介サイトには、多くのグローバル企業
  のロゴが誇らしげに並んでいる。筆者は、恥ずかしながら、
  “ある分野”におけるNVIDIAの活躍をそれまで知らな
  かった。
   その“ある分野”とは、人工知能(AI)の研究開発にお
  ける「計算」である。グラフィックの表示を行うGPUが、
  なぜAI研究の計算で活躍するのかを、AIについてズブの
  素人である筆者が、超初心者目線で取材し、調べ、まとめた
  のが本コラムである。      https://bit.ly/2yCjWnc
  ───────────────────────────

CPUについて知る.jpg
CPUについて知る
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月26日

●「マザーボードの変化が進んでいる」(EJ第4793号)

 AI(人工知能)のディープラーニングに関連して、CPUと
GPUの話になっているので、最新のPCのCPUの話にも触れ
ておきます。このところの第4次産業革命の進展に関連して、コ
ンピュータの設計には、大きな変化が起きているのです。
 「マザーボード」というものがあります。PCは、CPUを中
心に、さまざまな電子部品が連携しながら処理を行っていますが
これらの電子部品を電気的につないでいるのが「マザーボード」
です。マザーボードは、まさしくPCを構成する母体回路そのも
のであるといえます。実はいまこのマザーボードに大きな変化が
起きつつあるのです
 昨日のEJで取り上げたインテルの最新CPU「コア・アイ・
セブン」では、GPUがCPUに内蔵されています。コア・アイ
・セブンの第2世代「サンディ・ブリッジ」からです。2011
年のことです。
 もともとPCのグラフィックス処理は、OSがGUIになった
ときから、「AGPバススロット」というビデオカード専用のイ
ンタフェースをマザーボードに装着し、CPUの演算の負担を助
けています。AGPインタフェースは、ビデオラムというメモリ
も備えているので、グラフィックス専用CPUともいうべきもの
です。AGPとは次の言葉の頭文字をとったものです。
─────────────────────────────
        AGP
        Accelerated Graphics Port
─────────────────────────────
 ここで「バス」というものについて知る必要があります。バス
とは「情報の通り道」のことです。マザーボードは、CPUやメ
インメモリなどの多くの電子部品の集合体ですが、互いに指示や
制御情報などのやり取りをしています。このさい、やり取りされ
る情報の伝送路となる信号線が「バス」です。
 それまでPCの機能を拡張するには、PCI拡張バスのスロッ
トにボードを差し込むことで実現していたのですが、画像の描画
には、PCIバスの速度では対応するのが困難で、AGIバスと
いう高速バスを用意したのです。
 このように、同じマザーボード上で、速度の違うバスが出てき
たことによって、これらをコントロールする装置が必要になりま
す。それが「チップセット」です。
 チップセットというのは、マザーボードの中枢的存在であり、
マザーボードに接続されるCPUやメインメモリ、拡張カードな
どのあらゆる電子部品を相互に接続し、それらを制御する役割を
担うコントローラーのことです。チップセットには次の2種類が
あったのです。
─────────────────────────────
  1.ノースブリッジ ・・ CPUに近いところにある
               高速部分をコントロール
  2.サウスブリッジ ・・ CPUから遠い位置にある
               低速部分をコントロール
─────────────────────────────
 なぜ、「2種類あった」と過去形で述べたのかというと、「コ
ア・アイ・セブン」の第1世代「ネハレム」が登場した2008
年に、「ノースブリッジ」の機能は、CPUに内蔵されたからで
す。これによって、これまで、AGPが担ってきたグラフィック
スの処理機能は、CPU内部に移され、より高速に処理が行われ
るようになったのです。
 添付ファイルを見てください。これは、インテル社の「コア・
アイ・セブン」のチップセットとCPUからのデータの流れを示
しています。ここで重要なことは、CPUは画像処理ができない
わけではないということです。ただ、CPUは逐次的に仕事を処
理して行くので、画像処理のような大量のデータを処理するには
どうしても遅くなってしまうのです。しかし、GPUをCPU内
部に取り込んだことによってその速度は格段に向上したのです。
 これによってマザーボード内のチップセットは、1個になって
しまいましたが、これは「サウスブリッジ」の機能(低速部分を
コントロール)を担うことになります。
 この頃には、グラフィックスはとくにゲームなどで、3Dグラ
フィクスの需要が高まり、このことがマザーボードの拡張スロッ
トの大変革を促したのです。その目的は「3D映像を美しく高速
に描画させる」ことにあります。その成果が「PCIエクスプレ
ス規格」であり、現在急速に普及しつつあります。かつては、P
CI規格だったのですが、これら2つには、決定的な形式の違い
があるのです。
─────────────────────────────
       PCI規格拡張スロット パラレルバス形式
 PCIエクスプレス規格拡張スロット シリアルバス形式
─────────────────────────────
 かつては、CPUとチップセットは、パラレルバス形式でつな
がっていたのですが、「コア・アイ・セブン」の登場と同時に、
高速転送に適したシリアルバス形式の専用線で接続されるように
なったのです。もちろんこの変化は、インテル社だけでなく、ラ
イバルのAMD社も同様の仕様変更を行っています。
 これにより、「コア・アイ・セブン」による画像データの表示
は2つに形式に分かれます。1つは、CPU内蔵のGPUで処理
した画像データは、GPUと直接接続しているチップセットを介
してディスプレイに表示される形式です。
 2つは、PCIエクスプレススロットに装着されたグラフィッ
クボードで処理し、VRAMでディスプレイに表示できる信号に
変換し、ディスプレイにデータを転送する形式です。これはCP
Uから直接転送される形式です。3Dグラフィクスの処理などは
これによって行われています。グラフィックボードには、もちろ
んGPUが装着されていることはいうまでもありません。
          ──[次世代テクノロジー論U/037]

≪画像および関連情報≫
 ●GPUによるAIの高速化/NVIDIA
  ───────────────────────────
   先日、ヤン・ルカン氏に招かれ、ニューヨーク大学におい
  て「AIの未来」の立ち上げシンポジウムで講演をしてきま
  した。この分野をリードする人々が大勢集まり、AIの現状
  とその進歩について語りあうすばらしい会でした。今日は、
  そこでお話ししたことをご紹介しましょう。ディープラーニ
  ングとは新しいコンピューティング・モデルが必要な新しい
  ソフトウェア・モデルであること、GPUアクセラレーテッ
  ド・コンピューティングがAI研究者に普及しているのはな
  ぜか、AIは爆発的に普及しつつありますが、NVIDIA
  は、その普及を継続的に推進していること、そして、登場か
  ら長い年月が経過した今、AIの普及が始まったのはなぜか
  をお話させていただきました。
   コンピュータというものが登場して以来、ずっとAIは最
  後のフロンティアだと考えられてきました。この50年間、
  人間と同じように世界を認識したり言語を理解したり、事例
  から学んだりできるインテリジェントなマシンを構築するこ
  とがコンピュータ科学者のライフワークだったのです。ヤン
  ・ルカン氏の畳み込みニューラルネットワーク、ジェフ・ヒ
  ントン氏のバック・プロパゲーションと確率的勾配降下法に
  よるトレーニング、アンドリュー・ン氏による大規模なGP
  Uを活用してたディープ・ニューラル・ネットワークの高速
  化が組み合わさるまで、最新型AI――すなわち、ディープ
  ラーニング――のビッグバンは起きませんでした。
                  https://bit.ly/2ltp9nV
  ───────────────────────────

インテル最新CPUとチップセット.jpg
インテル最新CPUとチップセット
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月27日

●「スマホで将棋カンニングは可能か」(EJ第4794号)

 AIのディープラーニングには、ハードウェアとしてのGPU
が不可欠であることはここまでの説明でわかっていただけたと思
います。本来はその上の段階である「ライブラリ/フレームワー
ク」及び「プラットフォーム」の説明が必要ですが、プログラミ
ングレベルの話になり、難解な印象を与えてしまうので、これは
省略し、次の話題に進むことにします。
 2016年10月のことです。プロの将棋棋士が対局中に席を
離れ、スマホでAI将棋ソフトを使ってカンニングしたという疑
いをかけられ、年内の公式戦の出場停止処分を受けるという事件
がありました。調査の結果、その疑いを裏付ける証拠がないこと
がわかり、疑いをかけられた棋士は無罪放免になったのです。し
かし、その騒動の責任を取って、当時の日本将棋連盟の会長が辞
任しています。
 この話は、ワイドショーで連日取り上げられ、ちょっとした騒
ぎになったのです。このとき、あるコメンテーターがいった言葉
がとても気になったので、この記事を書いています。
 このコメンテーターは、Tさんといい、京都大学卒業で、とて
もよく勉強していて、どのような問題についても、なかなか鋭い
コメントをするので、大変人気が高い人です。そのTコメンテー
ターは、カンニングしたという疑いをかけられたプロ棋士を擁護
したのです。私が気になったのはその擁護の理由です。彼は次の
ようにいったのです。
─────────────────────────────
 スマホのような小さいコンピュータでは、素人の遊び程度のも
のは別として、プロ棋士の指し手を予測するのは困難です。だか
ら、彼はやっていませんよ。      ──Tコメンテーター
─────────────────────────────
 Tコメンテーターは、スマホのことを何もわかっていません。
確証はありませんが、おそらく彼はスマホを持っていないのでは
ないでしょうか。30代後半から40代で、コメンテーターが職
業である人が、今どきスマホを持っていないとは考えられません
が、どうやら彼はICTには関心が薄いようです。今やコンピュ
ータは、その大小では語ることはできないのです。
 スマホやタブレットは、つねにネットワークに接続されており
アプリケーションによっては、必要に応じて、自律的にサーバー
にアクセスして、情報を得ることができます。したがって、別の
場所に将棋のAIシステムが搭載されているコンピュータがあり
そこに現在の棋譜が入力されているとしたら、そこへスマホで問
い合わせれば、AIが予測する次の最良の指し手の情報を得るこ
とは十分可能です。スマホのアプリには、外部のサーバーにアク
セスして答えを得るものが少なくないからです。
 しかし、疑いをかけられた棋士は、そこまではやっていなかっ
たことがわかったので、事件は決着したのです。それ以来、将棋
連盟では、対局前にスマホなどの一切の電子機器は、ロッカーに
預ける決まりになっています。
 しかし、疑惑はあったのです。『ドキュメント・コンピュータ
将棋』(角川新書)などの著書のあるライター・松本博文氏は、
これについて、次のように解説しています。
─────────────────────────────
 関係者の間で話題となったのが、7月26日、棋界最高位であ
る竜王戦の挑戦者決定トーナメントの準決勝です。終盤、M九段
は、離席から戻った後、『6七歩成』という一手を指します。
 その一手は、一見すると自玉が危うくなるように見えるものの
先の先まで読んでいくと勝ちにつながるという、プロでもなかな
か指せない一手で、その“超人的な読み”がきっかけで、対局相
手や周囲から疑念を抱かれるようになった。
                  https://bit.ly/2lzpk1c
─────────────────────────────
 これに関係してアップルのアイフォーンに搭載されている「シ
リ(Siri)」という音声アシスタントという機能があります。誰
でも利用できる身近なAI(人工知能)です。2011年に発売
されたアイフォーン4Sから標準装備されています。これは、一
体どういう仕組みになっているのでしょうか。ちなみに、アップ
ルからはその仕組みについての情報は一切ありません。したがっ
て、その仕組みについては推測するしかありません。
 「シリ」の開発には、間接的ではありますが、米国政府がかか
わっています。まず、次の2つの機関について、知る必要があり
ます。米国防総省傘下の機関です。
─────────────────────────────
    ◎ ARPA/高等研究計画局
     Advanced Research Projects Agency
    ◎DARPA/国防高等研究計画局
     Defense Advanced Research Projects Agency
─────────────────────────────
 1957年のことです。ソ連のスプートニク・ショックを受け
た米アイゼンハワー大統領の命令で、国防長官に進言する防衛科
学技術担当長官を国防総省内に設置したのがはじまりです。この
ARPAは、1969年に現在のインターネットの原型になるA
RPAネットの構築やGPSの開発に成功しています。
 1996年にARPAは、DARPAに改められ、現在も続い
ています。大統領と国防長官直轄の組織であり、軍隊使用のため
の新技術開発や研究を行う組織ですが、米軍から直接的干渉を受
けない組織になっています。
 「シリ」は、DARPAが資金を拠出した研究プロジェクトか
ら生まれたのです。そのプロジェクトは、「CALO」という名
前の史上最大規模のAI研究プロジェクトです。技術系シンクタ
ンクであるSRIインターナショナルが元請け業者として、この
仕事を受注したのです。全米の一流大学と研究機関から300名
以上の研究者が参加したといわれています。
          ──[次世代テクノロジー論U/038]

≪画像および関連情報≫
 ●カンニング疑惑/騒動の結末
  ───────────────────────────
   思えば昨年の今頃、将棋界は凍り付いていた。たった1年
  前のことだ。その前年秋、渡辺明竜王が挑戦者に躍り出た三
  浦弘行九段と対局できないと言い出し、挑戦者が変わる前代
  未聞の出来事があった。いわゆるスマホカンニング疑惑事件
  である。三浦は竜王挑戦権を剥奪され、3カ月の対局停止と
  いう厳罰が下った。
   三浦はカンニングを全面否定し、調査委員会が開かれ、疑
  惑は完全に否定された。しかし3カ月の出場停止は解けず、
  三浦はA級順位戦で不戦敗に。疑惑が否定されたことで緊急
  的に降級は回避された。よって毎年2名の降級者はその年は
  1名、翌年3名が降級することで決着した。繰り返すがたっ
  た1年前の話だ。
   日本将棋連盟の理事会はほぼ総解散状態、将棋界は行方を
  危ぶまれた。そんなとき棋士生命をなげうってでも、と立ち
  上がったのが佐藤康光九段、現会長である。棋士生命をなげ
  うってでも、と書いたが私の想像で本人に確かめたわけでは
  ない。違ったらごめん。
   「将棋界の最も長い日」といわれるA級順位戦最終局は、
  今年は3月2日に全棋士が静岡に集結し、行われた。くじの
  関係ですでに6勝4敗で全対局を終えている羽生善治竜王が
  大盤解説会で解説役を務めた。いつものんきな羽生さんのこ
  とだからこの日もひときわ陽気に解説していた。まさか自分
  に何かが降りかかってくるとは微塵(みじん)にも思ってい
  なかったろう。しかし将棋界をめぐるドラマはあまりにもめ
  まぐるしい。          https://bit.ly/2KgEEdB
  ───────────────────────────

将棋カンニング疑惑事件.jpg
将棋カンニング疑惑事件
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月28日

●「シリはフロントエンド機能である」(EJ第4795号)

 CALO──それは、DARPAが資金を拠出し、技術系シン
クタンクのSRIインターナショナルが元請け業者として立ち上
げた米国史上最大のAI研究プロジェクトです。2003年に創
設され、2008年まで続けられたのです。CALOは次の言葉
の頭文字をとったものです。
─────────────────────────────
    CALO
    Cognitive Assistant that Learns and Organizes
─────────────────────────────
 このCALOの語源は、ラテン語の「calonis (戦士に付き従
うもの)」であり、兵士を戦場でサポートするための研究だった
のです。そのCALOから分社化して設立されたのが「シリ社」
という企業です。
 このシリ社が一番最初にやったことは、アップルストアに「シ
リ・アシスタント」というアプリを無料公開したことです。20
10年2月5日のことです。まだ精度はそんなに高くないものの
現在の「シリ」とほぼ同じ機能を持っていました。
 しかし、このアプリは、一部のユーザーからは歓迎されたもの
の、特別センセーションを巻き起こしたり、支持されたわけでも
なかったのですが、別のことで話題になります。
 それは、2010年4月28日にアップルがシリ社を買収する
と発表したことです。これについては、相当の驚きをもってネッ
ト上の大きな話題になっています。
 当時、アップルのCEOはスティーブ・ジョブズ氏です。ジョ
ブズ氏が、いつこのアプリのことを知ったかはわかりませんが、
彼がこのアプリの存在を知ったとき、おそらくこれはアイフォー
ンの「フロントエンド機能」として使えると確信したものと思わ
れます。「シリ」の音声操作のレベルがかなり高いからです。フ
ロントエンド機能とは、ユーザーがアイフォーンを使うとき、最
初に使う機能のことです。
 「シリ」の音声機能の高度さについて、自然言語処理研究者の
工藤友資氏は、ネットで次のように述べています。
─────────────────────────────
 シリがここまで注目を浴びたのは、会話の応答がインテリジェ
ントであることはもちろんだが、それに付け加えてインターフェ
ースが音声であることが重要なポイントだろう。シリの音声認識
精度は驚くべきものだ。これは、ニュアンス・コミュニケーショ
ンズの技術だとされる。ひと昔前の音声認識技術は、個々人に応
じて教育する必要があった。たとえば筆者の音声をある程度正確
に認識できるようになったとしても、筆者以外の音声は正しく認
識できない。これに対し、ニュアンス・コミュニケーションズの
システムは誰が話した音声でも、高精度で認識する。
                  https://bit.ly/2N0aUnk
─────────────────────────────
 開発者だから当然ですが、ジョブス氏はアイフォーンの弱点を
よく掴んでいたのです。アイフォーンは高性能なコンピュータで
すが、何しろ小さいし、文字入力に難があります。キーボードも
マウスも使えないので、特殊な入力が求められます。つまり、使
い勝手はけっしてよくないのです。
 しかし、音声であれば、誰でも使えるし、手が不自由な人でも
使えるので、フロントエンド機能として最適です。そこで、ジョ
ブス氏は、自らシリ社に電話をかけ、買収交渉をはじめます。
 このときの状況について、小林雅一氏の著書には次のように書
かれています。
─────────────────────────────
 シリ創業者の一人で、CEOでもあったダグ・キトラウス氏は
あるテレビ番組の中で、ジョブズ氏から買収打診の電話を受けた
時の様子を次のように語っています。「受話器の向こうから『も
しもし、私はステイープ・ジョブズだが・・』という声を聞いた
ときは、夢でも見ているのかと思った。
 ジョブス氏は、十分な買収金額を提示した上で、キトラウス氏
らシリのオリジナル・スタッフを全員雇用し、買収後も彼らが、
自由に研究・開発して構わないと約束しました。
                 ──小林雅一著/朝日新書
                  『クラウドからAIへ/
    アップル、グーグル、フェイスブックの次なる主戦場』
─────────────────────────────
 シリ社はこの申し入れを受託し、アップルは、シリ社を約2億
ドルで買収します。そして、2011年発売のアイフォーン4S
から「シリ」は標準機能として組み込まれたのです。
 自然言語処理研究者の工藤友資氏が指摘するように、「シリ」
の音声認識は、ニュアンス・コミュニケーションズという会話型
AI会社の技術を使っています。それでは「シリ」自体は、何を
しているのでしょうか。
 「シリ」は、ユーザーからの要求に応じてそれに対応できるそ
れぞれのウェブサービスに対して、仕事を割り振る「知的エージ
ェント」の機能を果しているのです。ユーザーが何かを知りたい
という要求を出すと、それに対応できるウェブサイトを検索し、
そのサイトから戻された適切な回答を音声や文字でアイフォーン
に表示します。
 また、「シリ」に対して、「近くの雰囲気の良いフランス・レ
ストランを教えて」と話しかけると、「シリ」は、そういうロー
カル・ビジネスの紹介サービスのサイトを呼び出し、GPSによ
る位置情報と組み合わせて、最適と思われるレストランを選定さ
せ、現在ユーザーのいる場所に近い、いくつかのレストランを写
真とともにアイフォーンに表示するのです。
 こんなことは、かつては考えられなかったことですが、現在の
スマホなら、簡単にできるようになっています。もちろん、アイ
フォーンだけでなく、他のスマホでもこんなことは簡単にできる
ようになっています。──[次世代テクノロジー論U/039]

≪画像および関連情報≫
 ●アンドロイドアプリ「アイリス/Iris」がある
  ───────────────────────────
   発売前の予想を上回る勢いで、世界中で好調に売れている
  アップルのアイフォーン4S。同機には、ユーザーを虜にし
  そうな魅力的な機能として音声アシスタントの「シリ」が搭
  載されている。これは音声を認識するだけでなく、ユーザー
  の発言内容を理解し、メールを送ったり、スケジュールを確
  認してくれたりする優れた機能だ。
   アンドロイド端末を使っているユーザーは、うらやましい
  と思ってしまうのではないだろうか。しかし、がっかりする
  にはまだ早い。海外のソフトウェア開発会社が、シリっぽい
  アプリを開発し、提供を開始したのである。その名も「アイ
  リス(Iris)」。本当に使えるのか?と侮るなかれ、なかな
  か優れたアプリケーションなのである。
   このアプリを開発したのは、デクセトラ社だ。同社は、ア
  イフォーン4Sが発売されたわずか4日後の2011年10
  月18日に、「Iris」を発表した。お察しの良い方ならすぐ
  に気づかれたと思うが、「Iris」は「Siri」の名前を逆にし
  て名付けられている。ふざけたネーミングと思われるかもし
  れないが、意外にもしっかりとした機能を備えている。シリ
  同様に、端末に向かって話しかけると応えてくれるのだ。音
  声認識はアンドロイド端末の機能を用い、回答はグーグルの
  音声検索と紐付けられている。  https://bit.ly/2K9J7mA
  ───────────────────────────

スティーブ・ジョブズアップル前CEO.jpg
スティーブ・ジョブズアップル前CEO
posted by 平野 浩 at 00:00| Comment(0) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする

2018年06月29日

●「シリは外部サーバーのなかにある」(EJ第4796号)

 「シリ」の音声認識技術は非常に高いレベルにあります。私が
アイフォーン4Sではじめてシリを使ったとき、その認識力の高
さに驚嘆したことを覚えています。なぜなら、事前の学習なしで
どのような人の声でも、ほぼ正確に認識できたからです。
 かつて私は、コンピュータに向って音声で話すと、その音声を
文字に直してディスプレイに表示してくれるシステムに挑戦した
ことがあります。第1回の「AIの冬」の後のエキスパートシス
テムのブームの時代にAIの仕事をしていたからです。このとき
も音声認識は重要なテーマだったのです。
 しかし、この場合、自分の声をシステムに相当時間をかけて学
習させなければなりませんでした。しかし、シリは、そのような
学習をすることなく、誰の声でも言葉を正確に認識することがで
きたのです。
 アイフォーン7を入手したとき、さらに驚きがありました。ア
イフォーン7では、「ヘイ!シリ」の設定というものがあり、自
分の声をアイフォーンに登録することによって、シリが登録者の
声しか反応できないようにするレベルにまでなっていたのです。
ほかの人の声には反応せず、登録したユーザーの声のみを認識し
処理を行うようなレベルにまで到達しているのです。
 ところで、シリはどういう仕掛けになっているのでしょうか。
アップルからは公開されていませんが、推理を交えて探ってみる
ことにします。なお、本文は、松林弘治氏の以下の論文を参考に
して執筆しています。
─────────────────────────────
                    松林弘治著
   『世界の裏側でプログラムは何をしているか?』
              https://bit.ly/2tLhGEG
─────────────────────────────
 アイフォーンのホームボタンを長押しすると、シリが起動して
「ご用件は何でしょう?」と聞いてきます。ユーザーは、自分の
アイフォーンと話しているつもりですが、実はアイフォーンを介
して、遠く離れた場所にあるアップルのサーバーと話をする仕組
みになっています。
 その証拠があります。アイフォーンのホーム画面の「設定」の
アイコンをタップすると、「機内モード」のボタンがあります。
通常は「オフ」になっていますが、これを「オン」にしてシリを
呼び出すと、「Siriは利用できません」というメッセージが
表示されます。これは、シリを使うには、ネットワークを使うこ
とが前提になっていることをあらわしています。
 このように、スマホのアプリのなかには、スマホ本体のみで処
理をするのではなく、外部サーバーにアクセスし、解を得るもの
が多いのです。アプリがネットワークを使っているかどうかは、
「機内モード」を「オン」にして使ってみればすぐわかります。
 ところで、この「機内モード」に意外な活用法があります。ス
マホは何もしていなくても通信機能は動いていて、その分、電池
を消費しています。充電するときでも通信をしながら充電するの
で時間がかかります。ところが「機内モード」を「オン」にする
と、通信機能がストップするので、それだけ充電速度が速くなる
のです。知っておいて損はないと思います。
 シリを起動し、ユーザーがシリに話しかけると、それは通信機
能によって、アイフォーンを介して、アップルのサーバーにつな
がるというところまで話しました。この場合、話しかけた音声そ
のものが直接サーバーに伝わります。このあと、サーバーはどの
ような処理をするのでしょうか。
 これについては添付ファイルをごらんください。松林弘治氏の
論文に出ている図です。音声として入ってきたデータを、音の波
形データを読み取って、テキストとしての文章に変換し、そのう
えで意味の解析を行います。
 一般論ですが、音声認識には「音響モデル」と「言語モデル」
の2つがあります。これについて松林弘治氏は次のように解説し
ています。
─────────────────────────────
 一般的に音声認識には、音響モデルと言語モデルというものが
使われます。音響モデルは、音の波形データとそれらをテキスト
として書き起こしたもの、その2つを大量に持っています。こう
いう波形だと「あ」、こういう波形だと「い」というように覚え
ておいて、話かけた波形をもとに音素(ひらがなやアルファベッ
ト、発音記号など)に変換するために使います。どんな人のいろ
んな発声でも正しく認識するために、大量の音声データを使って
統計的に処理(こういう音声データの場合は、この音素の確率が
高い、など)するための仕組みとなっています。
 それに対して 言語モデル は、単語そのものを集めた辞書と、
単語の並び方の知識を確率的に表現した辞書を持っています。こ
れらを使って、音素の並びから最もありそうな文章となるよう、
統計的に処理して(この音素の並びだと、この漢字やかなの並び
になる確率が高い、など)文字列に変換するための仕組みです。
                  https://bit.ly/2MpDo8O
─────────────────────────────
 ここでいう言語モデルは、ちょっと難しくなりますが、要する
に「形態素解析」というものを行うのです。形態素解析というの
は、私たちが普段生活の中で一般的に使っている言葉、つまり、
「自然言語」を形態素にまで分割する技術のことです。ここで形
態素というのは、言葉が意味を持つまとまりの単語の最小単位の
ことです。
 形態素解析は、日本語の場合、難しいのです。日本語は、英語
のような単語や品詞の区切りがはっきりしている言語と違って、
名詞や動詞、助詞などがひとつながりになっているからです。そ
れを辞書と統計モデルを使って、単語や品詞に分割していくので
す。来週のEJで詳しく説明します。
          ──[次世代テクノロジー論U/040]

≪画像および関連情報≫
 ●Siriも進化?特定の声だけ聞きとるメカニズムが明らかに
  ───────────────────────────
   人間にはあたり前のように備わっている能力がたくさんあ
  りますが、じつは異常に複雑なメカニズムを持っていたりし
  ます。たとえば、騒がしい環境でノイズの中から特定の声だ
  けを聞きとる能力は、何十年も科学者たちを悩ませてきまし
  た。しかし、ようやくその仕組みが明らかになり、音声認識
  技術に革命をもたらす可能性がでてきました。
   この現象の代表例として挙げられるのはカクテルパーティ
  ー効果。複数の会話が同時進行していても、私たちは特定の
  誰かの声を拾うことができますよね。この仕組みを解明する
  ため、カリフォルニア大学の研究チームは脳外科手術を受け
  る患者に対して実験を実施。この調査結果はネイチェア誌に
  掲載されています。
   手術を行う際、被験者の神経活動を記録するために、聴覚
  皮質がある側頭葉に256枚の電極シートを設置します。そ
  して手術後、複数の声を重ねた音声トラックを再生して特定
  の話し手の言葉を認識してもらい、患者の脳活動を観察して
  いきます。観察には脳活動の様子を再構築するソフトウェア
  が使われ、複数の声が聞こえる環境でどのような変化が起き
  るかを評価。すると驚くべきことに、聴覚皮質が一度に認識
  するのはひとつの声で、そのほかの音は効果的にシャットア
  ウトしていることが見えてきたのです。
                  https://bit.ly/2tAqihX
  ───────────────────────────

音響モデルと言語モデル.jpg
 
音響モデルと言語モデル
posted by 平野 浩 at 00:00| Comment(1) | 次世代テクノロージ論U | このブログの読者になる | 更新情報をチェックする
RDF Site Summary