プロセス間通信、マーシャリング、クライアントサーバモデル、遠隔手続き呼び出し

並行システム

                               システム情報系情報工学域,
			       システム情報工学研究科コンピュータサイエンス専攻
                               新城 靖
                               <yas@cs.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.cs.tsukuba.ac.jp/~yas/cs/csys-2011/2011-12-22
あるいは、次のページから手繰っていくこともできます。
http://www.cs.tsukuba.ac.jp/~yas/cs/
http://www.cs.tsukuba.ac.jp/~yas/

■今日の重要な話

通信プリミティブの分類
marshaling
クライアント・サーバ・モデル
遠隔手続き呼び出し

■marshaling/unmarshaling

プログラム中のデータ項目とネットワーク上を流れるメッセージに対応づける。

marshaling (整列化): メモリ中からデータ項目を集めて、ネットワークでメッセージとして転送するのに適した形式にまとめる。
unmarshaling (非整列化): 逆。

英語の綴りは、l が１つのものと２つのもの(イギリス綴り)がある。教科書によって違う。

図? marshalingとunmarshaling

４個の要素からなる構造体を整列化して送信している。

整数
文字列
ビットマップデータ（可変長）のバイト数
ビットマップデータ（可変長）の本体

整列化する基本的な方法

構造体や配列の要素を先頭から順にバッファに追加する。
可変長のデータの場合、まず、要素数を追加し、それに続いて本体を追加する。

ネットワークからデータを受け取ると、先頭から解釈して元のデータを再現する。

ネットワーク上を流れている時には、整列化されたデータの先頭にはネットワークのヘッダが付加されている。

◆整数のmarshaling

分散プログラムでは、メッセージを送信するプロセスと受信するプロセスが異なる CPU で実行されることがある。整数をmarshalingする時には、次のような点を考慮する必要がある。

ワード(基本的な整数データ)が 8bit/16bit/32bit/64bit と違うことがある。 C 言語の int 型のビット数が違う。
1バイトのビット数は、現在は、8ビットのものが主流。 (1バイトが9ビットのものもあった。)
メモリには、バイト単位で番地が付けられているものが主流。 (ビット単位、ワード単位で番地を付ける方法も考えられる。)
バイト・オーダが違うことがある。

◆バイト・オーダ

整数を送るだけでも、バイトオーダに気をつける必要がある。

Ｃ言語で扱える整数

1 バイト(char)
2バイト(short)
4バイト(long)

(現在のコンピュータのほとんどは、バイト単位でアドレスを付けているので、１バイトの整数については、バイトオーダの問題はない。)

2バイト、または、4バイトの整数をメモリに保存する方法 : メモリの下位番地に上位バイトを置くか下位バイトを置くか

リトルエンディアン: 下位番地に下位バイトを置く。x86 (Intel Pentium/Core, AMD Athlon/Phenom)。
ビッグエンディアン。: 下位番地に上位バイトを置く。PowerPC, SPARC, m68k

PowerPC は、両方切り替え可能だが、ビッグエンディアンで使うことが多い。

図? バイト・オーダー

◆ビッグエンディアンとリトルエンディアンの比較

リトルエンディアンがよい
- 32ビットの整数のうち、下位 8 ビットや 16 ビットだけが必要な場合、番地の計算をし直す必要がない。
- 多倍長の整数を足し算したい場合は、下位からアクセスする
ビッグエンディアンがよい
- 多倍長の整数の比較や割り算

◆送り方

送信側、または、受信側で相手に合わせて変換する。バイトオーダが同じ場合は何もしない。
標準的なバイトオーダ(ネットワーク・バイト・オーダ) を定める。送信側では、ネットワークにデータを流す時には、常に自分自身のバイト・オーダ（ホスト・バイト・オーダ）をネットワーク・バイト・オーダに変換する。受信側では、ネットワーク・バイト・オーダから自分のホスト・バイト・オーダに変換する。

現在、ネットワーク・バイト・オーダとしては、ビッグエンディアンが広く使われている。

TCP/IP の IP アドレスやポート番号
XDR

◆バイトオーダを変換するライブラリ関数

名前	方向	ビット数
uint32_t htonl(uint32_t hostlong)	ホストからネットワークへ変換	32ビット
uint16_t htons(uint16_t hostshort)	ホストからネットワークへ変換	16ビット
uint32_t ntohl(uint32_t netlong)	ネットワークからホストへ変換	32ビット
uint16_t ntohs(uint16_t netshort)	ネットワークからホストへ変換	16ビット

◆htonl() を使った整数の送信

unsigned long int hostlong, netlong;    
hostlong = 0x12345678 ;    
netlong = htonl( hostlong );    
send(conn, &netlong, sizeof(netlong), 0);

◆snprintf()/strtol()

snprintf() で文字列に直して送り、strtol() や atoi() でもどす方法もある。文字列文化。インターネットのアプリケーションでよく使われる。

送信側:

    char buf[BUFSIZE];
    hostlong = 0x12345678 ;    
    snprintf(buf,BUFSIZE,"%d\n",hostlong );
    send(conn, buf, strlen(buf), 0);

思ったほど遅くはない。

注意：sscanf() は、整数をデコードするために使う分には問題ないが、文字列を受け取るために使うとバッファ・オーバーフローが生じる可能性があるので、使わない方がよい。

◆文字列のmarshaling

文字コードを合わせる。
複数バイトの場合、バイト・オーダも合わせる。

Unicode BOM (byte order mark) 0xffef。

◆XDR

SunRPC (後述) で使われているデータ形式。バイナリ文化。

rpcgen というスタブ・コンパイラがある。データ構造を与えると、marshaling を行う手続きを自動生成する。

SunRPC を使わなくて、XDR だけを使う方法もある。

xdrmem_create(XDR *, const caddr_t, const uint_t, const enum xdr_op): メモリの指定されたの番地に保存／回復／メモリの解放。
void xdrstdio_create(XDR *, FILE *, const enum xdr_op): FILE * を通じて、構造体の読み書き。

◆その他

XML でタグ付けすると、値だけでなく、意味まで送れる。
JSON (JavaScript Object Notation)
CSV (Comma Separated Values)
S式
MessagePack。バイナリ。多言語対応。

■クライアント・サーバ・モデル

手続き呼出しの形に見えたら RPC (Remote Procedure Call)。

通信を構造化。send()/receive() を直接使うのは、goto (jump) でプログラムを書くようなもの。call/if/while で書きたい。

プロセスを２種類に分類する。通信は、次のパタンを繰り返す。

クライアント: 先にメッセージ(要求)を send() １回、後でメッセージ(応答)を receive() １回
サーバ: 先にメッセージ(要求)を receive() １回、後でメッセージ(応答)を send() １回

send() の回数と receive() の回数は同じ。相互に繰り返す。

図? 通信のパタンからみたクライアントとサーバの定義

◆クライアントとサーバに分けて考える意義

混沌とした通信を「構造化」してわかりやすくする。

図? 構造化されていないもの

図? 構造化されたもの

構造化プログラミング：分かりにくいgoto文をつかわないで、わかりやすい goto文だけ使う。

◆サービスの授受

元々の意味

クライアント(client): サービスを受ける方、顧客
サーバ(server): サービス(service)を提供する方

図? サービスの授受によるクライアントとサーバの定義

◆利用者数

サービスを提供する方は、１つのプログラム（コンピュータ）で複数の利用者の面倒をみる。その結果、１台のサーバに複数のクライアントがつながる。

クライアント: 一人で使うもの
サーバ: 複数人で共有するもの

図? 複数のクライアントによるサーバの共有

◆接続方法

TCP/IP の通信では、通信を始める前に、まず、通信路を作る作る必要がある。これは、電話で話をする前に、まず、電話をかける操作を行うことと似ている。

クライアント: 電話を掛ける方に相当する
サーバ: 電話を待っている方

以上のように、クライアントとサーバは、いろいろな意味で使われる。これらの意味は、多くの場合、一致しているが、一致していないこともある。

◆能動的・受動的

通信を開始するパタンで、コンピュータ、プログラム、人間は、次の２つに分類される。

能動的(active): ほっといても自分でメッセージを発信し始める
受動的(passive)、受け身: 何か言われると答えるが、自分ではメッセージを発信し始めることはない

クライアントとサーバから作られたシステムは、クライアントが能動的になり、サーバは、受動的になることが多い。

図? 能動的なクライアントと受動的なサーバ

例：ＷＷＷサーバは、ＷＷＷクライアントから何か要求が来ない限り、ずっと黙っている。

コンピュータを使う時には、人間が能動的になり、コンピュータが受動的になる。

テレビを見ている時には、人間が受動的になり、テレビが能動的になる。

講義形式の授業では、サービスの授受では、教官がサーバで、学生がクライアントになる。通信の開始の方法では、教官が能動的になり、学生が受動的になる。

大学以上では、学生は、能動的になることが求められている。

◆Peer to Peer (P2P)

P2P (Peer to Peer) という用語の意味は、怪しい。

混沌とした通信を構造化してわかりやすくしたものが、クライアント・サーバ・モデルである。

サーバあるシステムでは、サーバが落ちるとシステム全体が動作しなくなる。このように複数の要素から構成されているシステムで、ある要素が故障した時に、全体が動作しなくなるような場所を、単一障害個所(single point of failure) という。

コンピュータサイエンスでは、古くから、単一障害個所を避けるための研究が行われてきている。もっとも成功している方法は、サーバを複数用意する方法である。

サーバがないシステムでは、下手に作るとどの要素が故障してもシステム全体が止まってしまうことになる。

サーバがないシステムで成功している例はある。

インターネットの基幹のルータ。(IPv4 の BGP (Border Gateway Protocol) は、スケーラビリティ的に厳しい所には来ている。)
ニュースシステム (後述)

peer は、「対等の仲間」の意味。「通信相手」という意味もある。

検索は、サーバで索引を集めた方が速い。Web 上の検索エンジンなど。

サーバがない方法の利点(特徴)

うまく作れば、単一障害点がなくなる。
サーバを維持するコストが不用である。
サーバを経由しないで通信が行われると、サーバの負荷が減る。
無政府的で面白い。

サーバがない方法の問題点

下手に作ると、どの要素が故障しても全体が止る (single point of failure はないが、multiple points of failure になる)
検索などは遅い
責任の所在が不明になる
通信相手が本物かどうか確かめるのがたいへん

◆RPC

クライアント・サーバ・モデルに基づくプロセス間通信で、手続き呼出しの形に見えたら RPC (Remote Procedure Call) ( 遠隔手続き呼び出し )

■Socket API

ソケットAPIは、TCP/IP をBSD 系 Unix に導入する時に設計された API である。

今後 TCP/IP 以外にも様々な通信プロトコルが開発され、Unix で利用できるように設計されている。TCP/IP で使う時には、煩雑である。

◆ソケットAPIでのプロトコルの指定

    int socket = socket(int domain, int type, int protocol)

主に domain と type で利用するプロトコルを指定する。最後の引数 protocol は、普段は 0 を指定する。

ドメイン(domain)	型(type)	プロトコル(protocol)
PF_INET	SOCK_STREAM	TCP(IPv4)
PF_INET	SOCK_DGRAM	UDP(IPv4)
PF_INET6	SOCK_STREAM	TCP(IPv6)
PF_INET6	SOCK_DGRAM	UDP(IPv6)
PF_UNIX	SOCK_STREAM	同一ホスト内(UNIXドメイン)のストリーム
PF_UNIX	SOCK_DGRAM	同一ホスト内(UNIXドメイン)のデータグラム
PF_NS	SOCK_STREAM	XNS のストリーム(SPP)
PF_NS	SOCK_SEQPACKET	XNS の順序付きパケット(IDP)
PF_NS	SOCK_RDM	XNSの信頼性のあるデータグラム(SPP)

◆ソケットAPIの主要なシステムコール、または、ライブラリ関数

名前	説明
socket()	通信プロトコルに対応したソケット・オブジェクトを作成する
connect()	結合(conection)を確立させる。サーバのアドレスを固定する。
listen()	サーバ側で接続要求の待ち受けを開始する。
accept()	サーバ側で接続されたソケットを得る。
bind()	ソケットにアドレス(名前)を付ける。
getpeername()	通信相手のアドレス(名前)を得る。
getsockname()	自分のアドレス(名前)を得る。
send(), sendto(), sendmsg()	メッセージを送信する。
recv(), recvfrom(), recvmsg()	メッセージを受信する。
shutdown()	双方向の結合を部分的に切断する。
getsockopt()	オプションの現在の値を取得する。
setsockopt()	オプションを設定する。
select(), poll()	複数の入出力(通信を含む)を多重化する。
write()	メッセージを送信する。
read()	メッセージを受信する。
close()	ファイル記述子を閉じる。他に参照しているファイル記述子がなければ、ソケット・オブジェクトを削除する。

write(), read(), close() はファイルと共通。

◆講義用TCP Librar(講義用のTCP接続を作成するためのライブラリ)

情報科学類の講義、システムプログラムで新城が例題を示すために作成したAPI。実際の通信は、send(), recv(), write(), read() 等で行う。

tcp_acc_port( int portno ) (サーバ側): TCP/IP で、サーバ側の接続を受け付けるためのソケットを作る。引数 portno は、サーバ側の TCP のポート番号。これ以降、クライアントは接続要求を行える。
int tcp_connect( char *server, int portno ) (クライアント側): サーバ名 server のポート番号 portno に TCP の接続を確立させる。

その他に、サーバ側では、Socket API のaccept() をそのまま使う。 accept() は、１つのクライアントから接続要求を受け付ける。第1引数の socket は、tcp_acc_port() で作成したソケットを渡す。

◆JavaのAPI

Java言語は、基本的に TCP/IP と UDP/IP しかサポートしていない。したがって、TCP/IP や UDP/IP のプログラムを作成する場合には、分かりやすくなっている。

TCP/IP では、クライアント側とサーバ側でソケット・オブジェクトの作成するクラスが違っている。

クラス名説明

Socket TCP/IP のクライアント側のソケット

ServerSocket TCP/IP のサーバ側のソケット

DatagramSocket UDP/IP のソケット

Java でも、実際の通信には、ファイルと同じ API を用いる。例： Socket クラスのオブジェクトに対して getInputStream() というメソッドを実行すると、InputStream クラスのオブジェクトが返される。 InputStream は、ファイルからの入力と共通。

クラス名	説明
Socket	TCP/IP のクライアント側のソケット
ServerSocket	TCP/IP のサーバ側のソケット
DatagramSocket	UDP/IP のソケット

以後、ネットワークから文字列を入力するには、InputStreamReader や BufferedReader のオブジェクトを生成して利用する。

出力側では、Socket クラスのオブジェクトに対して getOutputStream() して、 OutputStream クラスのオブジェクトを得て、 PrintStream オブジェクトを生成して利用できる。

■遠隔手続き呼び出し（RPC）

手続き呼出しの形でプロセス間通信を行う方法。 1984年 Birrel and Nelson。

◆スタブによるRPCの実現

例：手続き put()。ハッシュ表にデータを格納する手続きで、引数にキーとなる文字列と値となる整数を取る。

図? スタブによるRPCの実現

特徴

サーバ側のプログラムを書く人は、手続き(put())を定義する。
クライアント側(main()関数)のプログラムを書く人は、手続き(put())を呼び出すプログラムを書く。

スタブの働きで、クライアント側のプロセスとサーバ側のプロセスは、自動的にプロセス間通信を行うことができる。

クライアント側スタブ

引数と結果は、サーバ側のものと同じである。
内容は、要求メッセージの送信(send())、応答メッセージの受信 (receive())を含む。
要求メッセージを、引数を整列化(marshaling)して作成する。応答メッセージを非整列化(unmarshaling) し、それを手続きの返り値として呼出した関数に返す。

サーバ側スタブ

無限ループを含む。
普段は要求メッセージの受信 receive() で止まっている。要求メッセージを受け取ると、それを非整列化し、非整列化した結果を引数として、目的の手続き(put())を呼び出す。
目的の関数から返ってくると、その返り値を整列化し、応答メッセージとしてクライアントに返す。

◆スタブの作り方

手書き
インタフェースを与えて自動生成

◆スタブの自動生成

インタフェース記述の例: ハッシュ表 key_t は文字列。

int put(key_t key,int value)
int getvalue(key_t key)
keyarray_t getkeys()

SunPRC での記述方法

typedef string key_t<256>;
struct keyvalue_t { 
   key_t key; 
   int   value ;
};
typedef key_t  keyarray_t<>;

program HASHTABLE_PROG { 
   version HASHTABLE_VERSION {
       int        PUT(keyvalue_t)  = 11 ; 
       int        GETVALUE(key_t)  = 12 ; 
       keyarray_t GETKEYS(void)    = 13 ; 
   } = 1 ;
} = 0x20051001 ;

インタフェース定義をスタブ生成器に与えると、クライアント側スタブ、サーバ側スタブが自動的に生成される。

インタフェース記述の内容

型定義
- 構造体の定義
手続きの定義
- 名前
- 引数の型
- 結果の型
- 手続きの番号、バージョン番号、プログラムの番号

自動生成されるもの

クライアント側スタブのプログラム
サーバ側スタブのプログラム
構造体や手続きの引数の型を定義したヘッダファイル
構造体等利用者定義のデータを整列化／非整列化する手続き

◆遠隔手続き呼び出しのまとめ

ある手続きがクライアント側スタブを通常の方法で呼び出す。
クライアント側スタブは、引数を整列化することでネットワーク用のメッセージを作成し、そのローカルのオペレーティング・システムを呼び出す。
クライアント側のオペレーティング・システムは、メッセージをリモートのサーバ側のオペレーティング・システムに送る。
サーバ側のオペレーティング・システムは、メッセージをサーバ側のスタブに渡す。
サーバ側のスタブは、メッセージを非整列化することで引数を取り出し、サーバ側の手続きを呼び出す。
サーバ側の手続きは、その仕事を行い、結果をサーバ側スタブに返す。
サーバ側スタブは、結果を整列化することでネットワーク用のメッセージを作成し、そのローカルのオペレーティング・システムを呼び出す。
サーバ側のオペレーティング・システムは、そのメッセージをクライアントに送る。
クライアント側のオペレーティング・システムは、メッセージをクライアント側スタブに渡す。
クライアント側スタブは、メッセージを非整列化して、結果を取り出し、その結果を呼び出された手続きに返す。

◆遠隔手続き呼び出しと通常の手続き呼出しの違い

遠隔手続き呼び出しの意味「意味(semantics)」を、通常の手続き呼出しと同じ (透明)にしたい。しかし、完全に同じ「意味」を提供にすることは難しい。

RPCでは、引数はコピーが基本。ポインタが渡せない。
RPCでは、「バインディング」が必要。
RPCでは、通信に時間がかかる。
(RPCでは、メッセージが失われる、クライアントが落ちる、サーバが落ちるなどの障害に対する対策が必要になる。)
(RPCでは、アクセス制御や認証が必要が必要になる。)

◆通常の手続き呼出し

プログラミング言語における手続き呼出しでの引数の渡し方

call-by-value (値呼び)
call-by-reference (参照呼び)
call-by-name (名前呼び)
call-by-copy/restore (Fortran方式)
Ada in out

プログラム言語によって、方法が違う。

	intなど基本型	構造体	オブジェクト	配列
C言語	値	値	-	自動ポインタ値化^*
Java	値	-	参照	参照

^* C言語の配列を「参照呼び」と説明している教科書もある。

言語が持つ意味を、RPCでは再現できないことがある。

◆call-by-value

C言語の通常の方式。変数の値のコピーが渡される。

   1:	#include <stdio.h>
   2:	
   3:	int square( int a ) {
   4:	    a =  a * a ;
   5:	    return( a );
   6:	}
   7:	
   8:	main() {
   9:	    int x, y, result;
  10:	    x = 10;
  11:	    y = 20;
  12:	    result = square( x );
  13:	    printf("x==%d, result==%d\n", x, result);
  14:	    result = square( y++ );
  15:	    printf("y==%d, result==%d\n", y, result);
  16:	}

実行結果

% make square-value 
cc     square-value.c   -o square-value
% ./square-value  
x==10, result==100
y==21, result==400
%

◆call-by-reference

C++ の参照型は、call-by-reference に近い。

   1:	#include <stdio.h>
   2:	
   3:	int square( int &a ) {
   4:	    a =  a * a ;
   5:	    return( a );
   6:	}
   7:	
   8:	main() {
   9:	    int x, y, result;
  10:	    x = 10;
  11:	    y = 20;
  12:	    result = square( x );
  13:	    printf("x==%d, result==%d\n", x, result);
  14:	//  result = square( y++ );
  15:	//  printf("y==%d, result==%d\n", y, result);
  16:	}

実行結果。引数で渡した変数 x の値が書き換えられている。

% make square-ref 
g++     square-ref.cc   -o square-ref
% ./square-ref  
x==100, result==100
%

C++の参照型では、引数には、変数しかかけない。y++ のような式では、コンパイル時にエラーになる。

% cat -n square-ref.cc 
     1  #include <stdio.h>
     2
     3  int square( int &a ) {
     4      a =  a * a ;
     5      return( a );
     6  }
     7
     8  main() {
     9      int x, y, result;
    10      x = 10;
    11      y = 20;
    12      result = square( x );
    13      printf("x==%d, result==%d\n", x, result);
    14      result = square( y++ );
    15      printf("y==%d, result==%d\n", y, result);
    16  }
% make square-ref 
g++     square-ref.cc   -o square-ref
square-ref.cc: In function 'int main()':
square-ref.cc:14: error: invalid initialization of non-const reference of type 'int&' from a temporary of type 'int'
square-ref.cc:3: error: in passing argument 1 of 'int square(int&)'
make: *** [square-ref] Error 1

C++の参照型は、プログラムが読みにくくなるので使ってはいけない。

main() {
   int x ;
   x = 10 ;
   f( x );
   printf("%d\n",x);
}

C言語のレベルでは、f(x) と呼んでも、決して x の値は、変化しない。C++の参照型を使えば、f() の型宣言を見ないと、変化するか変化しないかわからない。「型宣言を見る」という手間の分だけ、プログラムが読みにくくなる。全部の関数について、見ていたら疲れる。

◆ポインタ

「参照」は、ポインタに似ている。ただし、Ｃ言語で渡されるのは、ポインタのコピー(値)が渡される。

   1:	#include <stdio.h>
   2:	
   3:	int square( int *a ) {
   4:	    *a =  *a * *a ;
   5:	    return( *a );
   6:	}
   7:	
   8:	main() {
   9:	    int x, y, result, *xp, *yp;
  10:	    x = 10; xp = &x;
  11:	    y = 20; yp = &y;
  12:	    result = square( xp );
  13:	    printf("x==%d, result==%d, &x==0x%x, xp==0x%x\n", 
  14:	           x, result, &x, xp);
  15:	    result = square( yp++ );
  16:	    printf("y==%d, result==%d, &y==0x%x, yp==0x%x\n", 
  17:	           y, result, &y, yp);
  18:	}

% make square-pointer 
cc     square-pointer.c   -o square-pointer
% ./square-pointer  
x==100, result==100, &x==0xbffff534, xp==0xbffff534
y==400, result==400, &y==0xbffff538, yp==0xbffff53c
%

C++の参照型は、プログラムが読みにくくなるので使ってはいけないが、 C言語のポインタ渡しは、使ってもよい。

main() {
   int x ;
   x = 10 ;
   f( &x );
   printf("%d\n",x);
}

C言語のレベルでは、f(&x) と&を付けた段階で、 f() の内容を知らなくてもx の値が変化することが推察される。値が変化する可能性について、ポインタを渡している関数だけ注意すればよい。

◆配列

C言語では、配列を引数に渡す場合には、自動的にポインタ（先頭要素の番地）に変換される。次のプログラムでは、どれも関数 f() に同じ値（配列の先頭番地）を渡している。配列の名前を書いても、& を書いたものと同じになる。

main() {
   int a[10] ;
   f( a );
   f( &a );
   f( &a[0] );
}

配列を自動的にポインタに変換する歴史的な理由

遅いプログラムを書きにくくするため。配列を値で渡すには、全部の要素をコピーする必要があるが、コピーは遅い。
配列の要素数をコンパイラが知らないことがある。
配列とポインタを混在させるプログラミング・スタイルが定着している。

◆マクロ展開

call-by-name は、C言語のマクロ展開に近い意味がある。

   1:	#include <stdio.h>
   2:	
   3:	#define square( a ) ((a)*(a))
   4:	
   5:	main() {
   6:	    int x, y, result;
   7:	    x = 10;
   8:	    y = 20;
   9:	    result = square( x );
  10:	    printf("x==%d, result==%d\n", x, result);
  11:	    result = square( y++ );
  12:	    printf("y==%d, result==%d\n", y, result);
  13:	}

実行結果。y++ と 1 度書いただけなのに、2 増えている。

% make square-macro 
cc     square-macro.c   -o square-macro
% ./square-macro  
x==10, result==100
y==22, result==400
%

マクロ展開だけして止めてみるとわかる。

% cc -E square-macro.c > square-macro.i 
% wc  square-macro.i 
     421    1135    9164 square-macro.i
% tail -13 square-macro.i  
# 2 "square-macro.c" 2



main() {
    int x, y, result;
    x = 10;
    y = 20;
    result = ((x)*(x));
    printf("x==%d, result==%d\n", x, result);
    result = ((y++)*(y++));
    printf("y==%d, result==%d\n", y, result);
}
%

◆call-by-value-restore

関数呼出し時に、引数で指定された変数を作業領域にコピーする。
関数から戻ってくる時に、コピーしもどす。

古い Fortran の実装。コンパイル時に変数がすべて決まる。スタックに引数を置かなくてもよい。再帰がなかったので、そもそもスタックが不要で、戻り番地を手続きごとの変数に書いていた。

   1:	#include <stdio.h>
   2:	
   3:	int square_a;
   4:	int square() {
   5:	    square_a = square_a * square_a ;
   6:	    return( square_a );
   7:	}
   8:	
   9:	main() {
  10:	    int x, y, result;
  11:	    x = 10;
  12:	    y = 20;
  13:	    square_a = x ; result = square(); x = square_a ;
  14:	    printf("x==%d, result==%d\n", x, result);
  15:	    square_a = y++ ; result = square(); y = square_a ;
  16:	    printf("y==%d, result==%d\n", y, result);
  17:	}

実行結果。

% make square-copy-restore 
cc     square-copy-restore.c   -o square-copy-restore
% ./square-copy-restore  
x==100, result==100
y==400, result==400
%

◆RPCの基本的な考え方と制約

基本的には、値を送受信する (call-by-value)。
基本的には、ポインタや参照は、送受信できない。
基本的には、手続き（関数へのポインタ）は送受信できない。

この制約から、インタフェースを変えなければならないことがある。

◆例:RPCでread()

例: ファイルの内容を読むシステム・コール read()

ssize_t read(int fd, void *buf, size_t nbytes)

buf は、結果を受け取る場所を示したもので、RPCで遠隔に送る意味はない。

方法１。インタフェースを変える。

struct read_result_t {
       ssize_t read_bytes;
       void *buf;
};
read_result_t read(int fd, size_t nbytes)

方法２: スタブで違いを吸収する。

ssize_t read(int fd, void *buf, size_t nbytes)
{
	fd, buf(nbytes分), nbytes を整列化する。
	サーバへ要求メッセージとして送る。
	サーバから応答メッセージを受け取る。
	応答メッセージを非整列化して、結果の read_bytes と読んだ内容を取り出す。
	読んだ内容を buf read_bytes 分へコピーする。
	return read_bytes ;
}

単純に行えば、上のように余計なコピーが入ることがある。スタブで最適化すれば、クライアントからサーバへのコピーを減らせる。

◆SunRPCでのポインタの扱い

SunRPC では、ポインタの先の１要素だけコピーして送る機能がある。この機能を使って遅れるもの。

ポインタによる単純なリスト
ポインタによる木構造

送れないもの

双方向リストなど、内部にループを含むもの
有向非循環グラフ(送ると木構造に展開される)

◆バインディング

バインディングとはクライアントとサーバの対応関係を、個々の手続き呼出しの前に決定すること。

図? RPCのバインディング

クライアント側のプログラムとサーバ側のプログラムの対応はもはや１対１ではない。

サーバ側は一般に複数のクライアントにサービスを提供する。
クライアント側も、利用可能な複数のサーバの中から選ぶことができる。

◆サーバの複製(replication)

RPCのサーバを複数用意することが考えられる。うまく作れば、あるサーバが落ちていても、別のサーバで対応できる。バインディング時に、動いているサーバを選択する。

◆RPCの実装例

オブジェクト指向の考え方が含まれると、ORB (Object Request Broker) や分散オブジェクトと呼ばれることもある。

SunRPC
DCE RPC
OMG CORBA
Windows COM
HORB, Java RMI
XML-RPC
SOAP

◆RPCの利点

単なるメッセージ・パッシングと比較して

RPC の文法と意味は、（いろいろ難しい面をのぞけば）「手続き呼出し」なので明確である。単なるメッセージ・パッシングでは、標準がなく、文法と意味を選択するのは難しい。
RPCのインタフェースを手続きの引数や結果の型で記述できる。
(古典的な)分散OSでは、RPCの速い実装が提供される。

RPC の問題点(単なるメッセージ・パッシングの利点)

単なるメッセージ・パッシングは、自由度がある。たとえば、クライアント・サーバ・モデルにも従わない自由度がある。
テキスト・ベースのプロトコルを使えば、要求メッセージや応答メッセージを手で(telnet で)作り、目で解釈できる。

ただし、自由度は、プログラムが難解になり、開発のコストを上げることがある。クライアント・サーバ・モデルに従うなら、RPCの方がよい。

XML-RPC, SOAPなど、テキストを使う RPC もある。

■練習問題4 プロセス間通信、マーシャリング、クライアントサーバモデル、遠隔手続き呼び出し

欠席した人は、後日、以下のクイズの回答をレポートとして提出しなさい。

★問題(401) プロセス間通信としての遠隔手続き呼び出し

遠隔手続き呼び出しは、プロセス間通信として見た時にどのような性質があるか。以下の項目を答えない。

同期か非同期か
単方向か双方向か
２つのプロセス間に結合(connection，通信路)が形成されるか作られないか

★問題(402) marshaling

htonl() を使った整数の送信では、バイト・オーダを考慮しながら、32ビットの整数(4バイトの整数, long型)を送信するプログラムの一部をしめした。これに対して、次のプログラムは、バイト・オーダを考慮しながら、32ビットの整数(4バイトの整数, long型)を受け取るプログラムの一部である。空欄を埋めて、プログラムを完成させなさい。ただし、conn は、TCP/IPにより実現されたストリームを指定するファイル記述子、receive() は、データを受信するシステム・コールである。

unsigned long int hostlong, netlong;    
receive(conn, /*(A)*/, /*(B)*/, 0);
/*(C)*/ = /*(D)*/ ;
printf("%d\n",hostlong ); // 受け取ったデータの表示。

★問題(403) クライアント・サーバ・モデルと遠隔手続き呼び出し

クライアント・サーバ・モデルに基づき分散プログラムを記述することを考える。この時、単に Socket API を使う方法と比較して、遠隔手続き呼び出しを使う方法の利点を１つ上げて、簡単に説明しなさい。

★問題(404) 手続き呼び出しと遠隔手続き呼び出し

遠隔手続き呼び出しと通常の手続き呼出しで異なる点を１つあげ、簡単に説明しなさい。異なる点としては、今日の講義の中で説明したものの中から選びなさい。

Last updated: 2011/12/22 08:34:27

Yasushi Shinjo / <yas@cs.tsukuba.ac.jp>

名前	説明
gethostbyname()	ホスト名から IP アドレスを調べる。
getaddrinfo()	ホスト名から IP アドレスを調べる。IPv6対応。
gethostbyaddr()	IPアドレスからホスト名を調べる。
getnameinfo()	IPアドレスからホスト名を調べる。IPv6対応。
freeaddrinfo()	getaddrinfo(), getnameinfo() で得られた構造体を解放する。

	TCP	IP	UDP	イーサネット	電話	郵便
send	非同期	非同期	非同期	非同期	非同期	非同期
receive	同期	(非同期)*	同期	(非同期)*	同期	非同期
信頼性	あり	なし	なし	なし	あり	なし
アドレス指定	間接	間接	間接	間接	間接	直接
結合	あり	なし	なし	なし	あり	なし
方向	双方向	単方向	単方向	単方向	双方向	単方向
マルチキャスト	不可	可能	可能	可能	可能	不可
帯域保証	なし	なし	なし	なし	あり	なし