NAS vs. SANから 統合、融合へ その22010.01.29
『タイタニック』を上回る史上最高の興行成績を達成した3D映画『アバター』のように映像メディアはますますリッチ化しています。
3D映像の場合、元々の画像は人間の目の視差と同ように、二つのカメラによって撮られ、 2Dの2倍の容量の映像を編集し、その映像の臨場感を表現します。このような先端の映像は映画だけでなく、テレビでにも波及し、ポストプロダクション等の映像関連業界でのデジタル化はますます進化しつつあります。
また、NHKアーカイブスに象徴されるように、これまで人類が造り出してきた多くのコンテンツを100年先の子孫に残すことができるアーカイブとして、従来のフィルム、磁気テープから劣化の無い保存メディアとして磁気ディスクをベースにした超大容量ストレージに保存されるようになってきました。
特に、デジタルコンテンツワークグループに於いては、データの作成、編集、画像合成、修正/調整、各種出力用エンコーディングと各段階を踏んでワークフローを構成し、各プロセス毎に限られた時間でグループメンバーがシステムを駆使し、効率良く作業を行なう必要があります。その過程で常に作成されるデジタルデータをどのように蓄積し、利用し、管理するかということがシステム管理者にとって重要なシステム設計の課題です。過去、弊社ホームぺ—ジの技術情報サイト内ストレージ技術において「NAS vs. SANから、統合、融合へ」というテーマで過去からのNASとSANにおける使用方法の変遷や、技術的な課題などをご紹介いたしました。 今回は、以上のような実業務での「NASとSANの統合から融合」を考察してみたいと思います。
デジタルワークフローにおける、NASとSANのメリットとデメリット
先に述べましたように、多くのデジタルワークフロー現場では「オリジナルのデジタルデータの取込み/作成」→「編集加工」→「出力用エンコーディング」→「出力」という大きくわけで5つの段階があります。このワークフローの想定ではそれぞれの段階で、データの読み込み、 コンピュータでの処理、ストレージへの書き出しというようにデータの成果物がプロセスを移動します。
上図1では、青矢印で示されるデータ書き込み、オレンジ矢印で示されるデータ読み出しが、各プロセス間において発生している様子を示しています。
ここで、問題となるのはデータが数ギガバイト、数百ギガバイトと大きなデータになる場合です。通常の1Gbのイーサネット上でファイルサーバとネットワーククライアント間でデータ転送を行なう場合、1秒当り50MBの転送(1Gbのバンド帯域の約50%)とすると、5GBのデータをファイルサーバにアップロードするのに約100秒間かかります。
一方、SANのストレージにデータを書込む場合、ストレージへの書き出しや、読み出しはコンピュータ、メモリ、ファイルシステムのオーバーヘッドを考慮しても200MB/秒程度でデータ転送が可能ですので、5GBのデータを転送するのに僅か25秒程度で済むことになります。
下図2は、弊社が取り扱っているXRS F6412E RAID装置にSATA ドライブを搭載した場合の連続データのリードライトのベンチデータです。
このデータでは64KBの読み書きのサイズで秒当り、400MB/秒のデータ転送を行なっていますが、実環境では多くの阻害要因があり、1Gbのイーサネット上での転送と同様約50%の実転送容量とみるのが妥当と言えます。しかしそれでもギガビットのイーサネット経由でのデータ転送と比較すると所用時間は大きく異なります。このように、一見するとSANベースでのワークフローには大きなアドバンテージがあるように思われますが、SANは各ワークステーションから見るとローカルディスクと同じストレージデバイスとしてマウントされるが故のデメリットがもあります。それは、各フロー段階でのデータ保存、読み出しの操作でワークステーションが異なる場合で、それぞれが同時に同一ボリュームにアクセスをした場合、其のストレージ内のデータは早晩アクセスすることができなくなることです。
一方、イーサネット経由のファイルサーバであればワークフローに参加する総てのメンバーが同時に同一ネットワークボリュームにアクセスしても、データを破損させる心配はありません。
このように、データへのアクセス性能においてはSANが優れていますが、ワークグループでのデータ共有という観点からはネットワークストレージ(NAS)が優れているということになります。SANの分散ファイルシステム
SANのワークグループでのデータ共有におけるデメリットを補う為に、以前にもご紹介しました、「分散ファイルシステム」という技術があります。同一ボリュームを共有し、内部のファイルに対する同一アクセスを行なわせないようにする排他制御により複数のSANのメンバーが同一ボリューム内のファイルを共有することができます。
弊社がご提供するSANソリューションミドルウエア「metaSAN」は、代表的な分散ファイル共有アーキテクチャーにあたります。これらのミドルウエアを使用することでSAN環境でのファイル共有が可能になり、高いIO性能とワークフローを実現することができます。
SAN環境でのアクセス性能はミッションクリティカルなワークグループの生産性を向上させる決定的なソリューションですが、同一ボリュームに総ての工程のデータを集中させ、総てのワーカーが同一ボリュームにアクセスする場合のデメリットは確認しておく必要があります。
通常のハードディスクとしてよく使用されるSATA-II HDDの回転数は毎分7200回転です。1回転は8.3ミリ秒かかります。また、平均の磁気ヘッドのシークタイムは8.7ミリ秒です。より廉価なものは12ミリ秒のものや、更に遅いものもあります。これらの数値はどのような意味をなすかといいますと、1秒間に1000から500の読み書きの処理をしなくてはならないコンピュータにとっては途方もない時間なのです。そのため、RAID装置などに使用されるハードディスクは与えられた指定ブロックへのアクセスコマンドを内部で溜め込み、回転に従って、出来るだけ効率よく読み出すように工夫さています。しかし、この場合もランダムなシークの数が増えると指数関数的に読み書き速度が劣化します。
以上のように、たとえ高性能なSANにおいても複数のワーカーが多くの処理を同時並行的に行い、一つのボリュームからデータを読み書きする場合、SANの性能は急激に劣化します。下図3は100%のランダムでのデータの読み書きを行なった場合のIO当りのデータサイズと秒当りのデータ転送量を表した図ですが、先に図2でご紹介したシーケンシャルリードライトと比較して100%ランダムにおいては大幅な性能劣化がみられます。
これは、多くのワーカーが同一ボリュームに同時書込み、読み込みを行なっている状況です。ストレージとしては総てのワーカーに出来るだけ均等にサービスを提供するようにしていますが、先程ご紹介したディスク上の回転待ちや、シーク待ちは指数乗数的に影響し、性能劣化が進みます。これらを解決する方法はディスクに対して出来るだけ効率良くリードライトを行なうようにボリュームを分割し、同一物理ボリュームにアクセスが集中しないようにすることが懸命な選択肢と考えられます。
metaSANは、Windowsや、Macintosh OSがサポートする論理ボリューム数を共有ボリュームとしてコントロールすることが可能ですので、ワーカーグループやプロセスに応じたボリューム分割を行なうことでシステム全体の性能マージンを向上させることができます。
また、SANストレージの性能向上においてはハードディスクのシークストロークを縮小するなどの方法があり、更に高速化を実現するには近年注目を集めるようになったSSDと呼ばれる半導体ディスクがあります。最近はNAND型のフラッシュを使ったものでも、コントローラの使用や、中間にDRAMを使用することで高性能なIOを可能にするSSDが比較的低価格で提供されるようになったので、選択肢にいれても良いかもしれません。バックアップ時におけるストレ—ジ分散のメリット
SANにおける共有ストレ—ジ分散には、単に性能面ばかりではなくデータ管理や、バックアップのシステムにおいても大きなメリットがあります。通常のSANボリュームのバックアップはバックアップソフトによりサーバ間で行なわれます。しかし、バックアップ処理中はそのボリュームにアクセスすることができません。大容量で大量のデータの更新が行なわれるSANのストレージにおいては1共有ボリュームに総てのデータを配置することで、バックアップの時間が通常業務の時間を妨げたり、万一のデータ復旧では多くの時間を要します。一方、分散し、ワークフローに対応した共有ボリュームを持つことで、ストレージ装置の保守が必要な場合や、データ復旧が必要な場合の業務停止時間を短縮することができ、且つ、損害の範囲を限定することができるのです。NASにおけるSANの高性能ストレージ化
SANにおける課題とソリューションをご説明いたしましたが、NASにおいてはこれらのSANをストレージとして、高性能化が図られるようになってきました。通常、ファイルサーバでは高性能なIOを要求するアプリケーションを対象とはしませんが、ワークフローの各ステップで必ずしも高性能なIOを必要としない処理があります。この場合、共有SANのボリュームをNASヘッドストレージとしてマウントさせ、ネットワーク経由でその他のワーカーにデータ共有を図る方法です。例えば、metaSANではSANで共有されたボリュームをファイルサーバがマウントしてそのデータをSambaや NFSでネットワークに接続したコンピュータに共有させることが可能になります。この場合はmetaSANによるブロックレベル共有のようにSANメンバーのコンピュータ上の各種アプリケーションから直接データを読み出し、加工することは困難な場合がありますが、最新の更新されたデータの読み出しチェックする等の必ずしも高速IO性能を必要としない場合は既存のインフラを利用でき、システムのコストセーブに繋がります。
また、デジタルコンテンツワークフローではオリジナルのデータと、加工各段階でのデータ、さらには、完成データを保存時、万が一にデータの修正が必要な場合や、将来の再利用の為アーカイブを保存する必要があります。このようなデータの保存に関しては、NASは多くのソリューションを提供することができます。例えば、SANのボリュームをファイルサーバ兼、バックアップサーバに直接マウントさせることでLANを経由することなく、ファイバチャネルーバックアップディバイス間の直接のデータ転送が可能になります。このような方法をLAN Freeバックアップと呼びますが、ネットワークの負荷を軽減し、高速で安全なバックアップを実現することができるソリューションです。
以上、SANの有効利用とNASの有効利用に関しご説明してまいりましたが、SANの導入、NASの導入には実業務が必要とするシステムの要件の詳細な検討と、それにも基づくストレージシステムの設計が欠かせません。今後ますます高度なデジタルデータ処理を必要とするビジネスの世界で、合理的で安全なストレージシステム設計が求められています。