2.故障耐性のある分散アルゴリズム
ネットワーク,中でもインターネットは,通信の確実性を強く保障するものではありません. したがって,ネットワークを利用したアプリケーションを使っているときでも,急にネットワークが切断されてしまい,それ以上仕事が進まなくなることは,多くの人が経験していることでしょう
ネットワークの切断(障害)と一口に言っても,さまざまな原因がありますが,大きく分けると次のふたつになるでしょう.
- ネットワークに接続された計算機やルータの障害
- ハブやケーブルを含めた通信路の障害
これらの障害は,分散アルゴリズムのモデル上では,それぞれプロセッサの故障,通信リンクの故障として扱います.そして,このような障害がおきても正しく問題を解くことができるアルゴリズムを「故障耐性のある分散アルゴリズム(fault tolerant distributed algorithm あるいは dependable distributed algorithm)」と呼びます.ネットワークが大規模になるにつれ,たった一箇所の障害が大規模な障害に発展する可能性が増大しています.そのような状況で,故障耐性のある分散アルゴリズムの開発が期待されています.