Top > Research > ネットワーク上の分散データ管理・制御
■ ネットワーク上の分散データ管理・制御
1. データ管理とは?
まずここで言うデータ管理という言葉について説明します。 ネットワークのいくつかのノードにデータのコピーが分散して 配置されているとします。 各ノードはデータが必要なときに最寄りのコピーに対して通信を行って データを取り寄せますが、この際に通信線に負荷がかかります。
データ読み出しの様子
負荷を軽減するには、 データを要求してくるノードの近くにコピーを配置しておければ良いですが、 要求はいつどこから来るか分からないので簡単ではありません。 次の策として、コピーをたくさん配置しておくことが考えられます。
コピーがたくさんあるので負荷が少ない
しかしコピーがたくさんあると、今度は維持するのにコストがかかるようになります。 データを更新する際に全コピーに更新情報を送る必要があるからです。
多くのコピーを更新するには多くの通信が必要
したがって、データのコピー数は多すぎても少なすぎても効率的ではなく、 ちょうど良い数に保つことが重要です。 また先ほど、要求ノードの近くにコピーを配置することは難しいと書きましたが、 実は全く手の施しようがないというわけでもありません。 こうしたことを踏まえて、ネットワークを浪費しないように うまくデータを配置するのがここで言うデータ管理です。
2. 応用
最初にこの問題が研究された目的は、 分散共有メモリ型のマルチプロセッサ並列計算機の効率的なキャッシュ管理 を行うことでした。 ネットワーク上に動的なサーバ&クライアントシステムが構築される状況では 同じデータ管理の問題が発生すると考えられます。 典型的な例としてはP2Pアプリケーションがあります。
3. 研究内容
当研究室では、負荷の計り方やネットワーク構造に応じて 良いデータ管理方法を作ること、そのようなデータ管理方法の 性能限界を明らかにすることを目指して研究しています。