starposの日記

思ったこと感じたこと考えたことを書く

Reference Cloudの提案

Cloud computingSaaSに関して,昨日今日と計9時間ほどの集中講義を受けた.その後の1時間半でレポートを書く時間があったため,学生の身分でない私は本来書く必要はなかったのであるが,インターン絡みで講師の方へアピールでき,cloudについて考えをまとめることも出来ると思い,レポートを書いた.その中で cloud を使ったサービスを提案しなさい,というものがあったが,思ったよりも本質的なところを捉えたサービスを考えることが出来た気になった(独り善がりかも知れないが...)ため,ここに公開してしまうことにする.


タイトル: Reference Cloud の提案

背景: クラウドのコストメリットとデメリット

クラウド上にシステムを構築する場合に問題となってくるのがクラウドと外の世界との通信コストである.CPUやストレージなどは,大量の資源を集積することにより,コスト低減メリットを最大限に享受できるが,外部世界との通信に伴うコストは,集積によるコストメリットを享受できない.つまり,CPUおよびストレージは大量に使うが,定常的には外部との通信量の少ないサービスを行わなければクラウドのメリットを活かせない.


課題: 参考文献データへの自由な付加サービス

コンピュータソフトウェアに関するオンライン文献データベースとして,ACMIEEE,DBLP,citeseerなどで既に基本となるメタデータ(title,author,references 等)はある程度集約されている.現状では当該データを用いてあるカテゴリの論文を検索したり,Pagerank に代表されるランキング(Google scholar では一部実現している)や,可視化による検索者(人間)の時間効率の改善,取りこぼし防止などが難しい.クラウド登場以前は,当該データに基づく上記のような付加サービスを実施するためには,離れたネットワークに存在する当該データへの頻繁かつ大量の通信が必要であるため,このようなサービスは簡単には実現できなかった.


提案サービス: Reference Cloud

上記で述べたクラウドの性質を活かせるシステムとして,文献管理に関してKnowledge connectivity と Social connectivity の両方を増大させるべく,Reference Cloud を提案する.Reference Cloud は,主に文献内で他の文献を引用したり,参照したりされているいわゆる reference 情報を,集積および分類し,その情報を用いた様々なアプリケーションの開発を可能とするプラットフォームである.キラーアプリケーションは検索であるが,講義であったように,様々な企業,組織,そして個人が様々な分類手法,ランキング手法,そして可視化技術を自由に構築し,サービスとして提供でき,課金することも自由である.

具体的なシステムの特徴として,以下の2点が挙げられる.

1. Reference 情報は誰もが自由にアクセス可能,もちろんサービスも自由に立ち上げ可能,お金を取るなりビジネスをやっても良い.

2. Wikipedia のようにボランティアによるデータの追加,編集.

1. に関して,基盤としてのデータは皆の資産であると位置付け,無償とするが,データへアクセスするための技術,すなわち,より便利で効率的な検索,分類を可能にするサービスはビジネスとして成り立つような二段モデルである.

2. に関して,情報の確度の問題が発生するが,個々の文献にはその著者や発行者,読者も含むステークホルダーがいるため,彼等が間違いを正そうとするインセンティブは大きく働くことが期待され,Wikipedia のようにデータの整合性は常時メンテナンスされると思われる.

Reference Cloud ではデータの側にアプリケーションを置くことができるため,当該データに対する大規模な処理を低コストで実施することが出来る.しかし,ユーザからのクエリの結果は,ランキング等で質の高い情報を量を絞って提示したり,可視化エンジンを RIA などの技術を用いてクライアント側に用意することで,大量の通信をする必要がなくなる.つまり,クラウドのデメリットは無視でき,メリットのみを享受できる.

これらの考えを実現するために,世の中の全ての文献情報を集積するつもりで作ることが必要である.近年は,全ての仕事について,細分化が進み,異なる分野で同じようなアイデアや方法論などが複数回提案されている恐れが高い.全ての文献情報を一箇所に集約すれば,他分野であっても,似た議論をしている文献を発見することが容易になると考えられる(Knowledge connectivityの増大).また,文献データに対して,review や コメントなどをユーザが常時追加していくことにより,文献同士の有機的な繋がりだけでなく,それに関わる人々の関係もさらに増していくことが期待される(Social connectivityの増大).

基盤データの保持,通信にかかるコスト等はそのデータを使う者全てが負担する必要があるが,外部効果が高いので,将来的には税金などで賄われることも考えられる.

ちなみに,ここまで書いたが,Google が今後このようなサービスを提供することは十分に考えられる.しかし,Linux が Microsoft による OS の独占状態を破壊したように,データを share することで Google によるデータの独占を防ぐ可能性が見出せるであろう.