■実験室

■プロフィール

Sligh'Hand

Author:Sligh'Hand

所属ギルド
Open Travelers
称号
ぐったりたぬぬ
特徴
公園内でマジシャンを目指す新米教師。桜の下で「たぬき寝入り」するのがマイブーム。

■最近の記事
■最近のコメント
■ブログ内検索

■リンク
■RSSリンク
■カテゴリー
■月別アーカイブ

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | --:--:--

補助記憶考

 こんにちは。 ぐったりたぬぬです。

 夏休みも今日含めて残り 3 日。 皆様いかがお過ごしでしょうか。 ツクツクボウシの鳴き声を聞くと、「ぁー、夏休みも終わりかー」 なーんてちょっと切なくなったりするんですけど、どういうわけか、今年はツクツクボウシの声が聞こえません。 そんなわけで、気づいたらこんな時期になってしまっていた、と。

  ところで、知っている方は知っていると思いますけど、この夏スラ←のところでは、メイン PC の HDD (2 TB) のうち 1 台が壊れちゃうという事件がありました。 幸いにして RAID を組んでいたので、データ自体は助かったわけですけど、この機会にってことで、RAID の何たるか、バックアップの何たるかについて、今更ながらに考えてみます。





 スラ←たち HDD のユーザからしてみれば、原因が何であれ、そこに蓄えられているデータが失われてしまうことは最も憂慮すべき事態です。 一般に、ユーザが生成するデータでは 「まったく同じものを作り直す」 ということはできません。 たとえばスラ←がトリスタ上で面白い話題に出会ったときの SS をずーっと撮り貯めているとして、その SS を何かの拍子に消してしまったとしましょう。 数枚の SS だけであれば、もしかしたらその時居合わせたメンバーを集めて、同じ状況を作って、SS を取り直すこともできるかもしれません。 でもでも、月産 6000 枚のペースで SS を撮影していた (そんな頃がなつかしい) りすると、その状況を全部再現するなんて到底無理な話になっちゃいます。

 そんな羽目にならないようにするのが、バックアップなり RAID なりのデータ保全技術です。 バックアップと (データ保全としての) RAID は時として混同されてしまいがちですが、実は両者は異なる概念です。 まずはそのあたりから蘊蓄を少々。 なお、話を簡単にするため、ここでいう RAID は HDD 2 台による RAID 1 構成、つまり単純なミラーリングに限定しておきます。

RAID (ミラーリング)

 まずは RAID。 これは、Redundant Arrays of Independent Disks の頭文字を並べたもので、直訳すると 「独立した円盤の冗長な配列」 っていう意味不明。 平たく言えば、個別の HDD を組み合わせて冗長化しましょう、というお話。 冗長ってのは余分なこと。 ちなみに、スラ←の話はおよそいつも冗長化されています (というくだりが冗長なのです)。

 一定期間使った HDD が、ある確率で壊れるとします。 このことが判っているとき、データが失われないようにするにはどうしたらいいでしょうか? 一つの対応方法として、別の HDD にも全く同じデータを保存しておく、ということが考えられます。 2 つの HDD をひとまとめにして、常に両方に全く同じデータを書き込むので、容量を考えるとちょっともったいない気がします (別々に使えば 2 倍の情報を記録できるわけですからb) けど、HDD の故障を考えると、一つだけのときよりも安心できそうですよね。 これが RAID (RAID1 ミラーリング) の考え方。 このように、本来 1 つあれば事足りるデータを、敢えて 2 つ別々の場所に記録しておくことが冗長化なわけです。

 んでは、冗長化によって、データが失われる可能性をどれくらい下げることができるのでしょうか。

 ここに、ある型式の HDD があったとします。 この HDD を 1 年間使ったときの故障率が 10 % だったとしましょう。 荒っぽい言い方をしてしまうと、同じ型の HDD 10 個を 1 年間使い続けた場合、そのうち 1 個が壊れて、そこに書かれているデータが失われるイメージです。

 ↑な感じの HDD 1 台だけを使った場合、1 年後に HDD が壊れてデータが読めなくなっている確率は 10 % です。 んじゃぁ、RAID を組んで HDD をもう 1 台追加したらどーなるか。 データが失われて読めなくなってしまう確率を考えてみます。

 2 台の HDD に全く同じデータが書き込まれている場合、このデータが読みとれなくなるのは HDD が 2 台とも壊れてしまったときです。 つまり、片側の HDD が壊れているという条件の下、もう一方の HDD が壊れるという状況が最悪の事態、データが失われる状況となります。 この確率は
10 % × 10 % = 1 %
1 %!! つまり、データが失われる確率は HDD 1 台のときの 1/10 の確率となります。 実際の HDD の故障率はもっともっと低いでしょうし、上の式のとおり、データが失われる確率は各 HDD の故障率の乗算になるので、実際に RAID を組んだ時にデータが失われる確率はもっともっと低くなります。 たとえば、HDD の故障率が 1 % だとした場合、RAID を組むとデータが失われる確率は 0.01 % という具合。 RAID すごい!!!

 とまぁこんな具合に、RAID を用いることでデータが失われる確率を各段に下げることができます。 だがしかし、これはまだ完ぺきじゃぁないんですねぇ。 HDD の装置としての故障に対する耐性はつきましたけど、たとえば誤操作なんかの事故に対する耐性は全くないのです。

バックアップ

 あるとき、寝ぼけたスラさんがデータの詰まった HDD にアクセスしたとしましょう。 で、何を思ったかこの寝ぼけスラさんは、HDD のファイルを間違って全部削除してしまったと。 ゴミ箱にいれるならまだしも、あろうことか、フォーマットしちゃった、なーんて場合を考えます。

 このとき、RAID だと何が起こるでしょうか。 RAID では、2 つの HDD には全く同じデータが書き込まれます。 つまり、寝ぼけたスラさんの操作によって、2 つの HDD は正常に削除されてしまうわけです。 したがって RAID を組んであったとしても、この場合データの取り出しは不可能。 まさに忌々しき事態です。

 これを復旧するのに用いられるのが、いわゆるバックアップです。

 これまでの話の流れに乗って HDD を使って話すのであれば、バックアップはある時点の HDD の内容を別の HDD に記録しておくことを指します。 つまり、最新の HDD の内容とバックアップ HDD の内容は、必ずしも一致しないというのがポイントです。 RAID であれば操作と同時にデータ失われてしまいますが、別にバックアップを取っていれば、少なくとも、バックアップ時点のデータまでなら復活できる、と。

 たとえば、1 週間ごとにオリジナル HDD のバックアップを別のバックアップ用 HDD に書き込むようにしていたとしましょう。 仮にバックアップ用 HDD が故障した場合、データは最新のまま残ります。 壊れたことが判った時点でバックアップ用 HDD を新しいものに交換するだけです。 んでは、オリジナル HDD が壊れた場合どうなるか。 残念ながら、最新の状態を復元することはできませんが、データは完全に失われるのではなく、バックアップを取った時点まで巻き戻されて復活することになります。 今の場合、週に 1 回バックアップを取っているという設定なので、最大 1 週間の巻き戻しが発生するわけです。

 最大 1 週間も巻き戻されるなんて堪えられない>< ってなら、バックアップの周期を短くすれば良いわけです。 たとえば、1 日に 1 回とか、1 時間に 1 回とか。 ただし、周期を短くすると、バックアップが保持される期間も短くなってしまいます。 仮に 1 秒に 1 回バックアップを取るとした場合、間違ってオリジナル HDD の中身を削除してしまった場合、1 秒以内にデータを復旧しないと、データが消された状態のバックアップが作成されてしまいます。 これじゃぁ RAID と変わんなくなっちゃいますよね。 しかも今、軽ーく 1 秒に 1 回バックアップなーんて言いましたけど、実際にはオリジナル HDD の内容全部をバックアップ HDD コピーする作業は、当然 1 秒なんかじゃぁ終わらないわけで。 せいぜい 30 分に 1 回とかが現実的なところでしょう。

 つまり、バックアップ方式をとる場合、どうやったってある程度のタイムスパンでの巻き戻しは発生するのです。

まとめ

 うだうだと書いたんですけど、要するに↓こういうこと。 うまいこと使い分けましょう、と。

RAID とバックアップ
方式利点欠点使いどころ
RAIDHDD 1 台の装置故障に対して最新のデータを維持できる誤操作などによるデータ損失には無力常に最新データの安全が確保されていることが重要なシステム
銀行システムとかで、頻繁に書き換えが発生するデータドライブとか。
バックアップRAID では対応できない、誤操作によるデータ損失にも対応できるデータの巻き戻しが発生するデータの長期的安全性が求められるシステム
アーカイブなど、中身があまり書き換えられないデータドライブとか。

 こんだけのために、どんだけ時間かけたんだか……。 というか、ここまで読む人いるのかな……。 ま、間違いとかあったらご指摘お願いします、ってことで。

テーマ:周辺機器 - ジャンル:コンピュータ

たぬぬのねごと | 22:20:47 | Trackback(0) | Comments(0)
コメントの投稿

管理者にだけ表示を許可する

FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。