分散プログラミングと同期

並列分散ソフトウェア

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/sie/pdsoft-2003/2003-12-25
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/sie/
http://www.is.tsukuba.ac.jp/~yas/index-j.html
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html

■復習

■今日の重要な話

分散アルゴリズム

分散システムにおける同期

論理クロック、Lamportの論理クロック同期アルゴリズム,
物理クロック、UTC、NTP
分散相互排除、集中、分散、トークンリング
選出アルゴリズム
(アトミック・トランザクション、直列化可能性、楽観的並行性制御)
(デッドロック検出)

資料：

Ａ．Ｓ．タネンバウム著、水野忠則、鈴木健二、西宮洋太郎、佐藤文明訳、分散オペレーティングシステム、プレンティスホール (1996)
第３章分散システムにおける同期

■分散システムの性質と目標

◆分散システム

離れていても心は１つ。

複数の構成要素（コンピュータ）から構成される
ネットワークで接続されている。共有メモリはない。
使っている人には、あるレベルでは１台の集中システムのように見える。

◆集中システム

一組みのハードウェア
ＣＰＵ、メモリ、ハードディスク
１つのオペレーティング・システム
自律システムを作り出す技術がある
- 一貫性がある、矛盾がない
- 方針（policy）が完全に反映できる
セキュリティの確保に物理的な位置が使える

◆分散システムの利点

安い－－マイクロプロセッサ
速い－－並列処理
本質的に分散－－ＷＷＷ、電子メール
段階的成長が可能。毎年買い足し。
がんばれば、信頼性を高くできる
システムの一部が故障しても、全体は動き続ける

◆分散システムの弱点

ソフトウェア技術が遅れている
ネットワークが飽和することがある
セキュリティの確保が難しい

◆分散システムの設計目標

透明性
フォールト・トレランス
拡張性
性能（並列処理）

◆透明性

分散透明性 (network transparency)

システムが複数のコンピュータから構成されていることを、使っている人が気が付かない

地理的な位置、移動、複製
並行、並列、時間

◆フォールト・トレランス

システムが部分的に壊れる(partial failure)

システムの一部が故障した時、サービスを続ける。
分散システムは、潜在的には、フォールト・トレランスを実現できる。
下手に作ると、１台でも止まると全部止る。

１台のシステムが故障する確率：0.05

４台同時に故障する確率：0.05⁴==0.00006

４台のどれかが１つでも故障する確率＝＝１-（４台すべてが動いている確率）：1-(1-0.05)⁴==0.18549375

◆スケーラビリティ

構成要素の数が増えた時にどうなるか。 10台で動くものが100台、1000台で動くか。

◆（集中）アルゴリズム

（集中）システムで問題を解くための指令の集まり。

ｉｆ文
ｗｈｉｌｅ文
手続き呼び出し

◆分散アルゴリズム

要素間のメッセージの伝達の方法の集まり

どのコンピュータもシステム全体の状態に関して完全な情報を持たない
コンピュータは、ローカルな情報だけで決定する。
１台のコンピュータが故障しても、全体が破滅しない。 singlepoint of failure を回避したい。
(グローバルな時計が存在しない)

時計を使うアルゴリズムもある。

◆分散アルゴリズムの例

電話で放送
電話で多数決
時計を合わせる
戸籍、住民登録
筑波大学安否確認アルゴリズム

◆キーワード

キャッシュ、局所性、ヒント
木構造
冗長性
重複の除去
時間切れ
暗号、認証
トレードオフ

完全を目指そうとすると、急激にコストが高くなる。

実用になり、かつ、利益に見合うコストで実現できる範囲を探すことが大事になる。

■分散システムにおける同期

◆集中システムの問題

マルチスレッド、共有メモリ

臨界領域(critical region)
セマフォ(semaphore)、モニタ(monitor)
デッドロック
アトミック・トランザクション

C:
struct account
{
    lock_t l ;
    int    balance ;
};

withdraw( struct account *a, int amount )
{
    lock( &a->l );
	balance = a->balance ;
	balance -= amount ;
	a->balance = balance ;
    unlock( &a->l );
}

struct account a1, a2 ;

thread1()
{
	withdraw( &a1,100 );
}

thread2()
{
	withdraw( &a1,200 );
}

transfer( struct account *a, *b, int amount )
{
    lock( &a->l );
    lock( &b->l );
	balance_a = a->balance ;
	balance_a -= amount ;
	a->balance = balance_a ;
	balance_b = b->balance ;
	balance_b += amount ;
	b->balance = balance_b ;
    unlock( &b->l );
    unlock( &a->l );
}

thread3()
{
	transfer( &a1,&a2,100 );
}

thread4()
{
	transfer( &a2,&a1,100 );
}

詳しくは、マルチスレッド・プログラミングで。

Linda:
withdaw( int a, int amount )
{
    in("account", a,  ?balance)
    balance -= amount ;
    out("account", a,  balance)
}
transfer( int a, int b, int amount )
{
    in("account", a,  ?balance_a)
    in("account", b,  ?balance_b)
    balance_a -= x ;
    balance_b += x ;
    out("account", a,  balance_a)
    out("account", b,  balance_b)
}

◆分散システムの問題

クロックの同期
相互排除
選出アルゴリズム
アトミック・トランザクション
デッドロック

なぜ難しいか

メッセージが紛失する
通信遅延がある
時計がたくさん
システムが部分的に壊れる(partial failure)

集中システムで、１つ壊れて動かない時は、あきらめがつく。

◆なぜクロックを同期させないといけないか

クロックを使うアルゴリズムのため
- ファイルの最終更新時刻
  - make コマンド。
- キャッシュの一貫性, HTTP if-modified-since
- メッセージ配信、ネットワーク・ニュース
- 認証チケットの時間切れ
- トランザクション
時間は、人間の思考の基本
- 電子メールの日付を正確にする

■論理クロック

◆クロック

コンピュータは、時間を追跡する回路を持っている。水晶発振とカウンタとラッチ。

タイマ割込み。１秒間に５０回～６０回割込みがかかる。水晶発振か、電源の周波数を使う。一回の割込みを、clock tick という。

単一のコンピュータでは、水晶でも問題がない。

複数のコンピュータでは、クロックの進み方(clock skew)が違うので、だんだんずれてくる。

◆論理クロックと物理クロック

論理クロック: 内部で一貫性がとれていればいい
物理クロック: 実際の時計と大きくずれていてはいけない

相互作用しないプロセスは、同期がとれてなくてもよい。

◆Lamportの論理クロック同期アルゴリズム

事前発生(happens-before)。

「a→b」は、「aはbの前に発生する」

もしaとbが同じプロセスの事象で、bより前にaが生じるなら、a→bは真である。
もしaがあるプロセスがあるメッセージを送信したという事象で、 bが別のプロセスでそのメッセージを受信したという事象なら、a→bは真である。 (送信まえには受信できない。メッセージの到着には、有限の時間がかかるので、送信と同時にも受信できない。)

「→」は、推移律(transitive law)が成り立つ。

「a→bかつb→cならばa→cである」

並行性がある：「x→y」も、「y→x」も両方とも偽であることある。 xとyが別々のプロセスで発生して、それらの間でメッセージを交換しない時など。どちらが先に起きたかということを言えない（言う必要がない）

◆時間値C(x)

イベント aについて、次のような性質を持つ時間値C(a) を割り当てる。

a→b ならば、C(a)＜C(b)
常に前進する。逆戻りしない。

C() が与えられたら、論理クロックが実現されたことを意味する。

◆Lamportのアルゴリズム

図(a) 独自のクロックを持つ３つのプロセス。進み方が異なる。

図(b) Lamportのアルゴリズムによるクロックの修正。

２つのイベントの間に必ず１ティック進める。小数点。同時なら、プロセスＩＤで適当に。

１つの四角には、１つのメッセージだけ。１つのホストが「同時」に複数のメッセージを送受信することはできない。

この方法でクロックを修正すると、次の性質が得られる。

同じプロセスにおいてaがbの前に発生すれば、C(a)＜C(b)となる。
もしaおよびbが同じメッセージの送信と受信の事象ならば、C(a)＜C(b) となる。
すべての事象a,bについて、a≠bならば、C(a)≠C(b)。 (total ordering)

casual ordering。因果律が成り立つ。

■物理クロック

基準

太陽: 地球の公転、自転は一定ではない。ふらつきがある。だんだん１日が長くなってきている。
原子時計: セシウム１３３が 9,192,631,770 回振動。実際の日とずれる。
UTC (Universal Coordinated Time)。: 閏秒で調整。

http://www.zdnet.co.jp/mobile/0308/04/n_crl.html
ZDNet Mobile 真の1秒を求めて～原子時計

http://jjy.crl.go.jp/index.html
通信総合研究所（ＣＲＬ）／日本標準時グループ

http://jjy.crl.go.jp/QandA/time_qa.html
周波数と時刻に関するＱ＆Ａ

◆物理クロックを合わせる

GPS の普及で、正確な時刻が簡単に取り出せるようになった。 NTP で合わせる。

以前の方法。

Sun rdate

問題点

時間が逆行することがある
時間が不連続に飛ぶ

◆adjtime(2)

進みすぎたクロックを逆行させて戻す変わりに、ペースを落とす。

UNIX

int adjtime(const struct timeval *delta, struct timeval *olddelta)

◆Cristianの方法

UTCを持っている時刻サーバに問い合わせる。

T₀: クライアントが要求を送る。
I : サーバ内の割込み処理
T₁: クライアントが応答を送る。

図？　時刻サーバに問い合わせる

単純な方法：クライアントの時刻を、送られた UTC に合わせる。

問題1: 時刻が逆行することがある。adjtime() を使う。
問題2: サーバの割込み処理の時間(I)だけずれてしまう。
問題3: 応答メッセージの転送時間は、0ではない。しかも、変動する。

Cristianの方法は、応答メッセージの遅延時間を測定するものである。転送時間や割込み処理の時間が不明な時には、次の式で転送時間を見積もり、補正する。

遅延を(T₁-T₀)/2 とする。
何回かやって、最小値を調べる。

サーバが１つなら、アルゴリズムとしては問題なし。しかし、次のような問題がある。

サーバが落ちている／ネットワークが落ちている
サーバが狂う

◆The Berkeley algorithm

マスターとスレーブがある。

マスターを１台選ぶ。
スレーブから情報を定期的に集める。
時計の進み具合いの傾向を調べる。
あまりに大きくずれているものを除外する

単純に平均すると、嘘つきに弱い。実際にクロックが１００倍速く進むシステムがあった。

fault-tolerant average。往復時間の誤差。

◆NTP(The Network Time Protocol)

インターネット上のクライアントに UTC を提供
通信が切れても耐える。冗長性を持たせる。
高いスケーラビリティ。合わせる頻度を調整。
競合に強い。一種の認証技術を含む。

サーバが木構造で構成される。

レベルを stratum (ストレータム) と呼ぶ。
レベルの値が小さいほど正確。
Stratum 1 は、UTC の供給源に直接接続されている。原子時計やGPSなど。

図？　NTP(Network Time Protocol)サーバのレベル(stratum)

同期方法

手続き呼出しモード
対称モード
マルチキャストモード

■相互排除

共有データを他のプロセスが同時に利用しないようにすることを保証する。

◆集中システムでの方法

ロック
セマフォ
モニタ
ランデブ
Mutex
Java synchronized

◆コーディネータを使うアルゴリズム

集中システムのエミュレーション。１つのプロセスをコーディネータとして選ぶ。

図？　コーディネータを使う相互排除

普通のプロセス：

臨界領域に入る前に、コーディネータに要求メッセージを送る。
コーディネータから許可の応答が得られれば、臨界領域に入る。
臨界領域から出る時には、解放メッセージをコーディネータに知らせる。

コーディネータのプロセス：

要求メッセージを受け付けた時に、他に利用しているプロセスがいなければ、許可の応答を送る。
他にプロセスがいれば、待ち行列に入れる。
解放メッセージを受け取った時に、待ち行列からプロセスを取り出し、それに応答メッセージを送る。

性質

公正(fair)
飢餓が起きない
メッセージが３種類(要求、応答、解放)
コーディネータの単一箇所性(single point of failure)
コーディネータへの負荷の集中

故障の単一個所性を避けたい。

◆分散相互排除

仮定

Lamportのアルゴリズムなどで、論理クロックが同期しており、事象の全順序が保証されている。
メッセージ伝送は、信頼性(reliable)がある。

プロセスが臨界領域に入ろうとする時、領域の名前、自分のプロセス番号、現在時刻のメッセージを用意する。

このメッセージを他のプロセス（自分も含む）に送信する。

あるプロセスがメッセージを受け取った時、次の３つの場合がある。

自分が臨界領域にいないし、入ろうともしていないなら、送信者にＯＫのメッセージを送信する。
自分が既に臨界領域にいる時には、応答せず、待ち行列に入れる。
自分が臨界領域に入ろうとしていたまだ入っていない時には、到着したメッセージのタイムスタンプと他のプロセスに送ったタイムスタンプを比較する。一番タイムスタンプの低いもの（古いもの）が勝つ。もし到着した方のメッセージが低いなら、ＯＫを返す。自分のタイムスタンプが低いなら、待ち行列に入れてなにもしない。

すべてのプロセスからＯＫをもらったら、臨界領域に入る。

臨界領域から出る時には、待ち行列のすべてのプロセスにＯＫを送る。

図？　コーディネータを使わない相互排除の例

アルゴリズムの性質：

デッドロックも飢餓もない
プロセス数がnの時、メッセージ数は、2(n-1)
故障の単一箇所性は、ない（コーディネータのような死ぬとやばいプロセスがない。）
しかし、単一箇所ではなくて、n箇所に増えている。涙。
遅いプロセスがいたら、そこがボトルネックになる。
グループ通信プリミティブが必要。

結論：元の集中アルゴリズムよりも、遅く、複雑で、高価で、ロバスト性も小さい。

分散アルゴリズムの可能性が示されたこと、将来への課題、ほうれん草やラテン語。

◆トークンリング・アルゴリズム

たとえネットワークがバス型でも、ソフトウェア的にトークンリングを作る。

図トークンリング

トークンは、point-to-point のメッセージで送られる。（グループ通信は使われない。）

隣のプロセスからトークンを受け取ると、自分が臨界領域に入りたければ入る。

性質

簡単に正しいことがわかる
トークンが失われると、再生しなければならない。実際には失われたことと遅いだけを区別することが難しい。
プロセスがクラッシュすると、トークンの送信に失敗するという形で検出できることがある。その時には、クラッシュしたプロセスをリングから外す。

◆まとめ

相互排除アルゴリズムの比較
アルゴリズム	１回当たりのメッセージ数	入る前の遅れ	問題
集中	3	2	コーディネータのクラッシュ
分散	2(n-1)	2(n-1)	プロセスのクラッシュ
トークンリング	1～無限	0～n-1	トークンの紛失、プロセスのクラッシュ

■選出アルゴリズム

分散アルゴリズムでは、しばしばコーディネータが必要になる。どうやって、コーディネータを選ぶか。

プロセスには、番号が振られている。
すべてのプロセスは、他のプロセスの番号を知っている。

生きているプロセスの中で、もっとも高い番号のプロセスを探す。

◆Bully algorithm

コーディネータが応答しないと気が付いたプロセスが起動する。

プロセス P は、ELECTION メッセージを高い番号を持つプロセスに送る。
もし誰も応答しなければ、P が選ばれ、コーディネータとなる。
高い番号のプロセスから１つでも応答があれば、そのプロセスが引き続き探す(1.にもどる)。

低い番号のプロセスから ELECTION メッセージを受け取ると、OK を返す。

最後に残ったプロセスが、自分がコーディネータだと他のプロセスに知らせる。

ダウンから復帰したプロセスは、この選出アルゴリズムを起動する。

◆Ring algorithm

仮定

各プロセスは、次のプロセス(successor)を知っている。
トークンはつかわない。

コーディネータがクラッシュしていることに気が付いたプロセスは、自分の番号を含む ELECTIOIN メッセージ作成し、次のプロセスに送る。
次のプロセスがダウンしていれば、スキップして次のプロセスに送る。この時、自分の番号をメッセージに付加する。
メッセージが最初のプロセスに戻ってくる。自分のプロセス番号を含むメッセージを受け取ると、１週したことがわかる。一番高い番号のものがねコーディネータとなる。
コーディネータを知らせるメッセージを、次のプロセスに送る。
4. が一週すると終り。

複数のプロセスが同時にこのアルゴリズムを起動しても、問題ない。

■アトミック・トランザクション

相互排除、デッドロックより高いレベルの抽象が欲しい。

ロックよりも楽にプログラムを作りたい。

特に分散では。集中でも、フォールト・トレランスの実現では必要。

◆トランザクションの意味

商談は、成立するか、しないか。 all or nothing。

歴史：１９６０年代、テープの時代。失敗したら、巻き戻す。

銀行口座間の預金の移動。

口座１から出金
口座２に入金

◆トランザクション・モデル

仮定

プロセスは、ランダムに故障する。
メッセージの紛失は、タイムアウトと再送で回復されている。

必要なもの

安定記憶(stable storage)。ディスク２台で作る。

リカバリ

◆トランザクション・プリミティブ

Begin_Transaction
Commit (End Transaction)
Abort
Read
Write

◆特性(ACID)

Atomic: 外の世界からみると１つ。中間状態が見えない。不可分。
Consistency: 不変量(invariant)を保つ。例：口座間の預金の移動。預金の総額は不変。
Isolated: 並行するトランザクションは、孤立している。直列化可能(serializable)
Durable: Commit すると永続的。

◆直列化可能(serializable)

注意：Javaの serializable とは意味が全く違う。

複数のトランザクションは、並行に実行可能。しかし、その複数のトランザクションの最終結果は、それらを「ある順序」で逐次的に実行した時と同じ結果になる。

逆に、トランザクションは、直列化可能なスケジュールが存在するなら、並行に実行してもよい。直列化可能でないなら、トランザクションは、開始を遅らせるか、アボートする。

◆例

航空券の乗り継ぎの予約のプログラム

Begin_Transaction();
  reserve("NRT-SFO");
  reserve("SFO-JFK");
Commit();

プログラムの記述としては、これだけ。どこにもロックは出てこない。内部的には、ロックは行われる（ことがある）。

途中の reserve() が失敗したら、トランザクション全体を abort() する。

◆入れ子トランザクション(nested transactoin)

目的

効率
プログラミングの容易さ

親が abort されたら、子供が commit したものも無効になる。

◆トランザクションの実装(集中)

プライベート作業空間。書き換える前にコピーを作り、コピーを更新。
先行書き込みログ。更新作業をログに記録して、後で戻せる(rollback) ようにする。

◆プライベート作業空間

全てのデータをコピーすると重たい。

読み込みではコピーしない
ファイル全体だけではなく、インデックス(inode)だけをコピーする。シャドー・ブロック。

◆先行書き込みログ(write-ahead log)

実行予定リスト(intentions list)

シャドー・コピーを作らず、ファイルのその場所を書き換える。その前に、次の情報を安定記憶に書き込む。

トランザクションの識別子
古い値
新しい値

コミットされると、何もしない。アボートされると、ログを後ろから前に読み込み undo する。

クラッシュからの回復もできる。

◆トランザクションの実装(分散)

二相コミット(two-phase commit)（二相ロック(two-phase lock)ではない）。

２種類のプロセス

コーディネータ・プロセス、１つ
サブオーディネート（残りの関連するプロセス）。従属。

２つの相

第１相

全プロセスを Commit も Abort もできる状態にする。

コーディネータは、ログに「準備」と書く。
コーディネータは、サブオーディネートに「準備」メッセージを送る。
サブオーディネートは、ログに「準備完了」と書く。
サブオーディネートは、コーディネータに「準備完了」メッセージを送る。
コーディネータは、全てのサブオーディネートからの応答を待つ。

第２相

実際に Commit する。

コーディネータは、ログに「コミット」と書く。
コーディネータは、サブオーディネートに「コミット」メッセージを送る。
サブオーディネートは、ログに「コミット完了」と書く。
サブオーディネートは、コーディネータに「コミット完了」メッセージを送る。
コーディネータは、全てのサブオーディネートからの応答を待つ。

クラッシュした時には、ログから回復させる。

◆並行性制御

できるだけ効率のよい、直列化可能なスケジューリングを求める。

ロッキング
楽観的並行性制御
タイムスタンプ

◆ロッキング

もっとも単純な方法： Begin Transaction で、ファイルをロックする。 Commit/Abort でアンロックする。

注意：プログラマは、ロックを意識しない。

制約が強すぎる。

読み取りロック：read lock と write lock を分ける。

ロックの粒度(granularity)が大事

小さくする: 並列性が高まる。ロック自体のオーバヘッドが増える。デッドロックが起こりやすくなる。
大きくする: 逆

２相ロック：デッドロックが起きにくい、直列化可能な方法。

第１相(growing phase): ロックの数が増える一方
第２相: ロックの数が減る一方

定理：トランザクションの実現で２相ロックを使うならば、インターリーブされることで作られるスケジュールは直列化可能である。

実際のシステムでは、Commit/Abort するまで、一度確保したロックをはなさない。第２相で、まとめて全部ロックを解放する(strict two-phase locking)。

利点

中間的な状態を外から見られることがない。無駄な計算が起きない。
連鎖アボート(cascaded abort)が起きない
デッドロックの検出に時間切れが使えることがある。

２相ロックでも、デッドロックは起きる。

ロックの順番を決める
グラフのループを検出する
時間切れ

注意：２相ロックと２相コミットは別。

◆楽観的並行性制御

どんどんやって、後でまずかったことがわかつた時点で abort する。衝突が稀である時に有効。

実現（衝突時の対応）：プライベート作業空間を使う実現が便利。どんどんプライベート作業空間上のファイルを更新して、最後にコミットするか削除する。

性質

デッドロックがおきない。
並列性が高い。
衝突して失敗する確率が高くなると辛い。

◆タイムスタンプ

操作にタイムスタンプを付けて、まずいものをアボートする。

前提：

Lamport のアルゴリズムでタイムスタンプが一意になっている。

アルゴリズム：

ファイルには、読み取りのタイムスタンプと書き込みのタイムスタンプが付けられる。
あるプロセスがファイルをアクセスする時、トランザクションのタイムスタンプとファイルのタイムスタンプを比較する。ファイルの方が古ければ、問題なし。
ファイルの方が新しければ、トランザクションをアボートする。

楽観的：同じファイルを独立したトランザクションで同時にアクセスすることは、あまりない。

◆長期トランザクション

直列化可能性という制限はきつすぎる。

■分散システムにおけるデッドロック

デッドロックの扱い

ダチョウ・アルゴリズム。(問題を無視する。)
検出。デッドロックを起させて、検出し、回復する。
予防。静的に構造的にデッドロックが起きないようにする。
回避。資源を注意深く配置することで回避する。銀行家アルゴリズム。

分散では、非常に難しい。回避は、無理。

◆検出

検出して、プロセスを kill する。

kill では済まないものもある。

トランザクションが使える場合には、回復は単に abort すればよい。

◆集中型検出アルゴリズム

集中型のアルゴリズムを、コーディネータを使って模倣する。

各マシンは、ローカルのプロセスの資源要求グラフを管理する。
コーディネータは、大域的なグラフを管理する。サイクルを検出すると、ドットロックと判定する。

情報の収集方法

各マシンが、変更（資源要求、資源確保）があると、コーディネータに通知する。
各マシンが、定期的に前回との差分をコーディネータに通知する。
コーディネータが各マシンに問い合わせる。

単純にやると、偽のデッドロックを検出する。

対策：タイムスタンプを使う。

コーディネータがデッドロックを検出したように見えた時に、各マシンにその時刻より前のメッセージをフラッシュさせる。

◆分散型検出アルゴリズム

プロセスがブロックする時に起動される。

プローブ・メッセージ：３つ組

ブロックしたプロセス
メッセージを送信しているプロセス
送信相手のプロセス

プロセスがブロックする時、プローブ・メッセージを送る。
メッセージを受け取ると、他のプロセスを待っていたら、第２、第３フィールドを書き換えて転送する。
メッセージが一巡してもどってきたら、デッドロック。

単純に最初のプロセスを殺す方法では、複数のプロセスが同時にこのアルゴリズムを起動すると問題になる。

改良：プローブメッセージに待っているプロセスのリストを付ける。リストの中で犠牲となるプロセスを一意に決める。

理論的には、改善の余地が大きい。

◆分散デッドロック予防

もっとも代表的な方法：

全ての資源を順序づけし、順序どおりに確保させる

集中システムでも使われている。

大域的な時間とトランザクションを利用した方法(1)：待機消滅(wait-die)型アルゴリズム

プロセスが別のプロセスが保持している資源を要求してブロックしようとする時、タイムスタンプを比較する。
要求しているプロセスが古い時には、そのプロセスを待たせる。
要求しているプロセスが新しい時には、そのプロセスを殺す。（トランザクションで回復。）

トランザクションの時刻の増加方向にしか延びない。

大域的な時間とトランザクションを利用した方法(2)：負傷待機(wound-wait) 型アルゴリズム

プロセスが別のプロセスが保持している資源を要求してブロックしようとする時、タイムスタンプを比較する。
要求しているプロセスが古い時には、横取り(preempt)させ、資源を保持しているプロセスを殺す。（トランザクションで回復。）
要求しているプロセスが新しい時には、そのプロセスを待たせる。

wait-die型アルゴリズムでは、若者は繰り返し死ぬことがある。

■まとめ

分散アルゴリズム

分散システムにおける同期

論理クロック、Lamportの論理クロック同期アルゴリズム,
物理クロック、UTC、NTP
分散相互排除、集中、分散、トークンリング
選出アルゴリズム
(アトミック・トランザクション、直列化可能性、楽観的並行性制御)
(デッドロック検出)

↑[もどる] ←[12月18日] ・[12月25日] →[1月8日]

Last updated: 2004/01/08 01:51:33

Yasushi Shinjo / <yas@is.tsukuba.ac.jp>