グリッドストレージとデータマネージメント 2
2009.7.21
ストレージグリッド化
データマネージメントの必要性
データのバックアップの課題
データのレプリケーション
データマイグレーション
階層化ストレージ管理
まとめ
ダウンロード
データマネージメントの必要性
今後数年間で現在のデータ量の10倍を超える勢いで増大するデータを保存する為に、ストレージはますます不可欠な存在となり、ストレージをグリッド化する技術はますます進化するものと予想されます。また、グリッド化され、ネットワーク上で水平に分散された大容量データの保存と利用、さらには、データの保存媒体の移動等を管理するデータマネージメントが重要となってきます。非構造化データの場合、データ容量そのものは構造化データと比較して非常に大きくなります。このデータをネットワークストレージに収納したまま、再利用されることなく長期間そのまま保存することは、ストレージ資源の有効利用という観点からは大きな問題といえます。そこで、データそのものをどのように取り扱うべきかのポリシーを決め、管理するデータマネージメントが必要になります。このデータマネージメントに課せられた課題として、データの安全な保存、万一の場合のデータ修復、更に、使用頻度、更新と更新の間の期間に応じたデータの保存場所、期間の管理、データとしてオンラインアクセス可能期間終了後のストレージからのデータ削除、オフライン化した場合の収納メディアのラベルデータベース管理、収納ロケーション管理等々があり、大容量のストレージ、大容量データを管理する上でこれらの課題を解決する必要があります。
データのバックアップの課題
従来は大容量データのバックアップを取るにはテープバックアップや、光メディアバックアップ装置を使用してきました。しかし、データ容量の急激な伸びにより、従来のバックアップデバイスではデータコピーや、コピーバックを実行するための時間的余裕がなくなってきました。実際に最近実用化され始めたLTO4のドライブでも非圧縮時で120MB/秒、圧縮で240MB/秒の転送速度しかありません。例えば、NASとして一般的な容量の10TBストレージのリストアを行なう場合、LTO4のドライブ1台を使用して、非圧縮でフルバックアップを取ったバックアップデータをリストアするのに約23時間かかります。更に、そのバックアップ時点からの差分バックアップを更新分としてリストアすると1日を遥かに超える時間を要することになり、失われたデータを回復するのに本来のバックアップの目的に適わない非現実的な時間を要することになります。一方、圧縮でのコピー、コピーバックもデータ転送の高速化という点ではソリューションですが、最近の画像、映像コンテンツの様に、すでにデータそのものがコーデックにより圧縮されている場合は簡単非可逆圧縮を行うことはデータの損傷を引き起こす可能性があります。
データのレプリケーション
データの増大と共に、従来の方法でのバックアップ手法が非現実的になるに従って、データのレプリケーション、または、マイグレーションという手法が一般的になりました。レプリケーションは文字通りデータの複製を作成する方法です。米国での9.11の事件以降、1カ所のみでデータを保管する危険性を改めて認識され、事業継続の為にデータの複製を遠隔地のサイトに置く方法が取られる様になりました。レプリケーションは、一般的にはデータのバックアップから始まり、それ以降更新されるデータをリモートサイトにも同様に更新し、常にソース/バックアップを同期させる方法です。この環境を実現する為には、ソース側とバックアップ側のコンピュータ、ストレージのリソースは同一レベルのものを用います。万一、ソース側で障害が発生した場合はデータアクセスに対し、レプリケーション側にリダイレクトし、業務を継続させるます。
この方法は、データベースの様に比較的アクセスの多いアプリケーションデータには有効ですが、一旦データへのアクセスが終了してしまえば、それ以降のアクセス頻度がそれほど高くない デジタルコンテンツの様なデータの場合、レプリケーションという手法はその構築の為の初期費用、システムの維持運用費用の点から、必ずしも有効ではありません。この問題を解消する別の手法としてデータマイグレーションという方法があります。【関連リンク】
・【技術資料】クラウド時代のバックアップ手法 〜事業継続とIT統制のためのデータ保護〜
・【用語解説】グリッドコンピューティングとは
・【用語解説】レプリケーションとは
・【用語解説】マイグレーションとは