検索,
亀田からのCIMS情報,
Start up Guide,
総合情報メディアセンター,
美濃研,
亀田能成
WWWのブラウザ(Internet Explorer や Netscape Navigator)は、インターネッ
トを使って、世界中に散在するWWWのデータを取ってきてくれます。
ここで、あなたの友達とあなたがどこかのWWWの同じページ
(http://faraway.net/z.html)を見ようとした場合を考えましょう。あなたの友達は隣の計算機を使っ
ているとします。友達が「このページ面白いで、見てみいな」と
URLを教えてくれたので、あなたも見ようと思い、
そのURLを自分のブラウザに入れてみました。
さて、内部では何が起きているのでしょうか。
‥‥といっても単純です。単にあなたの使っているブラウザがそのページのデ
ータをまたはるばる取りに行ってきてくれるだけのことです。しかし、ここで
その友達がそのページのデータを全部見れるようになるまでに5分かかってい
たとします。つまり、「このページめっちゃ遅いけどごっつう面白いで」とい
うような状況です。単純には、あなたも自分のブラウザで楽しむには、やはり
5分ぐらい待って、それから‥‥ということになります。
でも、ちょっと考えただけでなんかアホみたいなことしている気になりません
か?隣の友達が使っている計算機にはもうデータがあるのです。隣からなら、
データ転送は数秒で済むでしょう。直接自分がまた取りにいったために、自分
の時間が5分無駄になるだけでなく、インターネットを混雑させ、結果的に世
の中が住みにくくなっているのです。
この無駄な行為をなんとかしようという結果生まれたのがSquidです。
基本的な考え方は簡単で、WWWのデータを取りにいくときに、どのブラウザも
『代理人』を通して持ってきてもらうようにするのです。代理人はどのWeb
Serverからどのデータを取ってきたかを記録しつつ、データを蓄えていきま
す。こうしておくと、友達がhttp://faraway.net/z.htmlを代理人経由で
取りにいった時点で、代理人はそのデータを取りに行ってその友達に渡すとと
もに、「http://faraway.net/z.htmlをxx時oo分にとってきた」というメ
モをつけて、そのデータを代理人の倉庫に保管します。しばらくして、今度は
あなたがhttp://faraway.net/z.htmlを見ようとしたとします。代理人は
「http://faraway.net/z.htmlを取ってきてね」と頼まれたことになるわけです
が、ここで代理人はfaraway.netのWeb Serverに、「ねえねえ君のところに
z.htmlってデータがあると思うんだけど、それってxx時oo分から後で変更されて
たりする?」とだけ尋ねます。答えが「いいや、変わってへんで、昔のまんま
や」と言われたら、代理人は自分の倉庫に蓄えてあったデータをあなたに送り
つけておしまいにします。もし変更があった場合には仕方がありませんから、
データを送ってもらいます。
Squidはこの『代理人』の役を引き受けてくれます
。
指定されたURLの日付チェックに要する転送データ量は数百から千バイト程度
ですから、この方式ならデータそのもの(画像だったりすると数百キロバイ
トはざらでしょう)を転送するのに比べて数十倍から数千倍もの転送量の削減
になります。
一方、この方式で問題になるのは、「代理人」がひ弱(データの管理が遅かっ たり、倉庫の大きさが小さい)なときで、この場合、効率が悪くかつ遅くて使 いものになりません。そこで、総合情報メディアセンターではSUN Ultra30 (UltraSPARC-II/300MHz)に30GBのディスクをつけて負荷に備えています。な お、Squidの利用状況については、