2010年09月08日

●「アマゾンとグーグルのアルゴリズム比較」(EJ第2894号)

 プラットフォーム企業の雄といえば、マイクロソフト、アップ
ル、グーグル、アマゾン──EJでは、マイクロソフトとアップ
ルは既に取り上げているので、アマゾンとグーグルを少し研究し
てみたいと思います。日本企業は、これらのプラットフォーム企
業に対抗できるのでしょうか。
 アマゾンから考えましょう。
 アマゾンは「ネットでものを売る」ノウハウを一番持っている
企業であるといえます。そのノウハウを確かなものにするために
何しろ7年間も赤字を重ねながら、ノウハウを積み上げ、その目
的を果たしているからです。
 アマゾンのショッピングサイトは、オリジナル商品を販売して
いるわけでなく、どこのネットショップでも買える商品ばかりを
販売しているのです。それでいてアマゾンがこの世界で優位に立
てたのには、品揃えの豊富さ、強力な物流網などゆえであろうが
他のライバルと比較して、ダントツなのは、購買データ、お客の
行動データの豊富さであり、その徹底的な活用なのです。
 そのデータ活用のひとつに「商品推薦システム」があります。
アマゾンで買い物をした人なら誰でも知っている「この商品を購
入された方は次の商品を購入しています」や「この商品を購入さ
れた方に次の商品をお勧めします」というあのメッセージです。
 これは「協調フィルタリング」というアルゴリズムで自動的に
計算されるのです。
 協調フィルタリングは別に難しいものではなく、その考え方は
シンプルです。最も簡単な例で説明します。
―――――――――――――――――――――――――――――
      太郎 ・・・ 商品A、B、Cを購入
      花子 ・・・ 商品A、B、Dを購入
      一郎 ・・・ 商品B、E、Fを購入
―――――――――――――――――――――――――――――
 これを見ると、購入実績で一番類似性の高いのは、太郎と花子
です。違う点は、太郎は花子の購入したDを購入していないので
Dを推薦し、花子にはCを推薦するのです。
 原理はこれだけのことです。しかし、膨大な数の商品を対象と
し、何百万人ものユーザーを抱える大規模サイトでこの類似度の
計算をやろうとすると巨大なデータベースとコンピュータが必要
になります。
 アマゾンは、当初からデータの重要性に着眼し、時間をかけて
インフラを構築してきたのです。設立から7年間も赤字が続いた
理由はこれだったと考えられます。そして現在ではインフラ構築
のノウハウを生かして、クラウド環境の提供というビジネスにも
力を入れているのです。
 続いてグーグルについて考えましょう。
 グーグルは、アマゾンと同様に巨大なデータをストックし、膨
大なデータベースを有している企業です。当初は検索可能なペー
ジの総数を競っている時代があったのですが、現在では検索結果
の順位付けを決めるアルゴリズムを開発し、その評価に基づいて
検索順位を並べる方法を開発したのです。このランキングアルゴ
リズムを「ページランク」というのです。
 このページランクをベースにして検索結果の順位を並べること
によってグーグルは莫大な広告収入を得ているのであり、グーグ
ルの成長にとってページランクは重要な開発だったのです。
 グーグルのページランクは、0〜10点法であり、評点によっ
て、サイトは次のように評価されます。
―――――――――――――――――――――――――――――
      〇   ・・・・・ 評価なし
      1〜3 ・・・・・ 標準サイト
      4〜6 ・・・・・ 人気サイト
      7〜9 ・・・・・ ポータルサイト
     10   ・・・・・ 最高ランク
―――――――――――――――――――――――――――――
 つまり、ホームページやブログには、グーグルによるランクが
付いており、誰でもそれを調べることができるのです。いまそれ
を知りたければ、次のURLをクリックして、[  ]の中にラ
ンクを調べたいホームページやブログのURLを入力し、となり
の「ページランクをチェック!」ボタンをクリックすればページ
ランクが表示されます。そのさい、「www」 を省略しないで入力
してください。
―――――――――――――――――――――――――――――
       http://www.pagerankon.com/
―――――――――――――――――――――――――――――
 ちなみに私のブログのランクは「4」です。しかし、11点法
なので、「3」までは比較的簡単に行けるのですが、それ以上に
上げるのは大変です。問題は、どういうメカニズムで、評点が決
められるかですが、グーグルは公表していないのです。しかし、
そのメカニズムはある程度わかっています。国立情報学大向一輝
准教授の説明が明快なので、ご紹介します。
―――――――――――――――――――――――――――――
 10人が所属するグループで、各人が他のメンバーに対して1
 票ずつ投じることができることとする。メンバーは、残りの9
 人全員に1票ずつ入れることも、数人だけに入れることもでき
 る。これを集計すると、それぞれのメンバーの得票数は0〜9
 票となり、これを基本的な評価(持ち点)とする。次に、個別
 の票が誰から誰に投じられたかを確認し、持ち点の高い人から
 の票には加点を、持ち点の低い人からの票は減点する。こうし
 て持ち点を調整したうえで、その持ち点をもとに再び票の調整
 を繰り返していき、変動がなくなるまで続けると、最終的な評
 価が定まる。        ──国立情報学大向一輝准教授
         「週刊エコノミスト」臨時増刊8/9号より
―――――――――――――――――――――――――――――
               ──[メディア覇権戦争/33]


≪画像および関連情報≫
 ●「協調フィルタリング」とは何か
  ―――――――――――――――――――――――――――
  協調フィルタリングは、多くのユーザの嗜好情報を蓄積し、
  あるユーザと嗜好の類似した他のユーザの情報を用いて自動
  的に推論を行う方法論である。趣味の似た人からの意見を参
  考にするという口コミの原理に例えられることが多い。協調
  フィルタリングにはユーザの評価付けによる明示的なものと
  システムの操作履歴(例えばブラウザの閲覧履歴)などを利
  用した暗黙的なものがある。     ──ウィキペディア
  ―――――――――――――――――――――――――――
 ●表出典/『週刊東洋経済』7/3号より

米プラットフォーム企業の業績.jpg
米プラットフォーム企業の業績
posted by 平野 浩 at 04:11| Comment(0) | TrackBack(0) | メディア覇権戦争 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス: [必須入力]

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。