非構造化データをデータドリブン経営に生かすAIとクラウドストレージ活用

データドリブン経営・DXを実践する企業が広がる中、企業にとってストレージを如何に活用するかは競争力向上の重要な要素となっています。

例えば、Office系ファイルなどの頻繁に使用されるデータの管理を始め、ビッグデータや機械学習、IoT(Internet of Things)といった経営活動に影響を与えうる技術が急速な発展を続けていることから、これらを適切に理解し、活用することでパフォーマンスを最大限発揮することができ、その結果、業務の生産性向上に繋がります。

今回はファイルストレージ、ブロックストレージ、オブジェクトストレージを含む多種多様なストレージの種類、活用用途について説明いたします。

オンライン・クラウドストレージ「DirectCloud」へ
NAS・ファイルサーバーの
クラウド移行サービス説明書
  • NAS/ファイルサーバーのクラウド移行をご検討の方におすすめ。
  • ファイルサーバーを超えた厳格な管理機能をクラウドで実現。
    各機能やオプション、導入事例、他社比較など、ボリュームたっぷりの内容。
ダウンロードCTA
ctaダウンロードボタン
オンライン・クラウドストレージ「DirectCloud」へ
NAS・ファイルサーバーの
クラウド移行サービス説明書
  • NAS/ファイルサーバーのクラウド移行をご検討の方におすすめ。
  • ファイルサーバーを超えた厳格な管理機能をクラウドで実現。
    各機能やオプション、導入事例、他社比較など、ボリュームたっぷりの内容。
ダウンロードCTA
ctaダウンロードボタン

1. ストレージを表す3つの要素

ストレージは、データを長期間保存するためのデバイスや領域(記憶装置)を意味する用語です。
これに加えて、社内外や取引先とデータを共有したり、端末からいつでもダウンロードすることも可能です。

ただし、一口にストレージと言っても、あまりにも対象が広いため、ここではストレージの「種類」「設置場所および接続方法」「方式」という3つの要素にポイントを絞って説明します。

ストレージを表す3つの要素

  • 種類
  • 設置場所・接続方法
  • 方式(管理・保存)

ストレージの種類

ストレージの種類は物理的な種類を表しています。
容量が小さいものから大きなもの、安価なものから耐久性の高い高額なものまで多岐にわたります。

ここでは代表的なものだけを取り上げて、ストレージの種類の項目で説明します。

ストレージの設置場所・接続方法

ストレージの設置場所はオフィス内だけでなく、ルーターの外側となるデータセンターなど、複数拠点からの接続を想定したものなどがあります。

また、ハードウェアとの接続も内部と外部という単純なものだけでなく、外部接続でもよりハードウェアに近い接続形態のもの、ローカルエリアネットワーク(LAN)上に存在するもの、そして、管理サーバー経由と光ケーブルで接続するものなど用途に応じて様々な種類が存在します。

ストレージの方式(管理・保存)

最後にストレージの方式とは、扱うデータの種類、ストレージの目的といった用途に応じたものが存在します。
この方式の違いに関しても、メリット、デメリットを交えて後述します。

2. ストレージの種類

まずは物理的なストレージの種類について紹介します。

この後の説明で登場するすべてのストレージは設置場所・接続方法問わず、これらの物理的なストレージで構成されており、各用途に特化した機能を実装することで、設置場所・接続方法に最適化されたストレージが完成します。

HDD(Hard Disk Drive)

HDDは、一昔前まで主流となっていた大容量ファイルを保存できる記憶装置です。

大容量ファイルを低コストに扱うことができる反面、仕組みが不安定なことから回転しているディスクに突然ヘッドが接触(いわゆるクラッシュ)する可能性は構造上ゼロにはできません。

そのため、業務用途ではRAIDをはじめとする冗長化構成が必須となります。

SSD(Solid State Drive)

SSDは、フラッシュメモリで構成されており、現在のPCなどの端末で主流となっているストレージです。

採用されるフラッシュメモリの種類によって、シングルレベルセル、マルチレベルセル、トリプルレベルセルとそれぞれ容量、コスト、耐久性、速度などの用途により使い分けられています。

SSD は、物理的な駆動部品が使われていない構造のため、極めて高速なランダムアクセスを実現しています。
反面、HDDと比較してコストが高く、採用されているフラッシュメモリの種類にもよりますが書き換え可能回数が10万回前後と決まっている点がデメリットとなります。

磁気テープ

磁気テープは、HDD登場以前から使われているデータストレージです。
かつては複数の規格が存在していましたが、現在は事実上LTO(Linear Tape-Open)のみが現場で使用されています。

構造上HDDやSSDのようなランダムアクセスに対応しておらず、頭からデータを読みだすシーケンシャルアクセスとなります。

そのため、普段業務で活用するファイルを保存するストレージとしては不向きです。

反面、LTO1本あたり18TB~45TBと極めて大容量かつ低コストとなっており、かつ電源を入れない状態でも30年以上の長期保存に対応しているため、ボリューム全体のバックアップや、データのアーカイブに最適なストレージとなっています。

その他のストレージ

その他のストレージとしては、かつて配布用メディアとして普及したCD-Rに代表される「光ディスク」、既に生産は終了しているものの小容量ながら50年ほどの長期保存が可能なMOに代表される「光磁気ディスク」があります。

また、ハードディスクに大容量のフラッシュメモリを内蔵し、アクセス頻度の高いファイルをキャッシュとしてフラッシュメモリに保存することで、SSDの高速アクセスとHDDの大容量を実現した「ハイブリッドHDD」などがあります。
なお、一体型のハイブリッドHDDとは別に、単体のSSDとHDDを組み合わせて使用する場合は「ハイブリッドストレージ」と表現されます。

3. ストレージの設置場所・接続方法

次に、これらのストレージがサーバーなどのハードウェアに組み込まれた上で、どのような場所に設置されるのか、そして、接続方法について説明します。

DAS(Direct Attached Storage)

DASは、ハードウェア(主にサーバー)に直接接続し、データの保存を行うストレージです。

接続するインターフェースは、要求されるデータ転送速度に応じてSATAやSASなど使い分けられています。

メリットは、ハードウェア内部とほぼ同じインターフェースで接続し、ネットワークを介すことがないため、極めて遅延の少ない高速アクセスが可能です。

一方で、速度が要求される用途には最適ですが、共有での利用(ネットワークに接続されていないストレージ)を想定していないことから、ストレージをファイル共有に使いたいといった用途にはまったく適していません。

また、ネットワーク上から直接DASを見られないことから、ストレージの利用状況、更改時期を把握しづらいというデメリットも存在します。

SAN(Storage Area Network)

SANは、サーバーなどのハードウェアとストレージを1対1で接続していたDASの欠点を、ある程度解消している接続方法がSANとなります。

光ファイバーを使用したファイバーチャネル(Fibre Channel)でストレージを相互接続した独自のネットワークをLANから独立して構築されているため、LAN内のネットワーク状況の影響を受けることなく、複数のストレージ間での高速データ転送も実現しています。

ネットワークが独立しているためボリューム単位のバックアップ、動画などの大容量ファイル移動を頻繁に実施しても、LAN内のユーザーへ影響を与えないというメリットもあります。

SAN内はストレージを統一する必要はなく、HDD、SSD、テープドライブの混在環境でも構築できるため、コストと容量のバランスを取りながら比率を変えることもできます。

ですが、LANから分離されているメリットがある反面、SANにアクセスできる端末が限定されるというデメリットもあります。
また、LANとは別にSANを構築するため、その構築コスト・特殊な運用ノウハウに関連して人件費などの管理コストが大きくなることから、中小企業での導入が難しい場合があります。

NAS(Network Attached Storage)

NASは、企業ネットワークで最も普及しているUTPケーブルとスイッチングハブで構成されたLAN上に存在する共有ストレージです。

ファイルサーバーと機能的には近いですが、専用のオペレーティングシステム(OS)を搭載されたモデルが多く、よりファイル共有に特化されており、サーバーのような汎用性が失われる代わりに、設定の簡易化・ライセンスコストの低減などのメリットがあります。

また、NASは大きく分けて小規模事業者向けの低価格モデルと大企業向けの高価格モデルの2種類が存在します。

小規模事業者向けのNASは導入コストが非常に低く、サーバーラックマウントを想定されていない形状ということもあり、基本的にはオフィス内に設置、運用されています。
安価に導入できるものの大量のアクセスを想定しておらず、同時接続数が増えるとそれに伴いレスポンスも著しく低下します。

一方の大企業向けの「エンタープライズNAS」は、オフィス内だけにとどまらずデータセンターへ設置されることも多く、堅牢かつ高性能なものがほとんどで、大量の同時アクセスにも対応できる設計となっています。

近年は、クラウドとの連携も想定されたものも多くなっており、場所を問わない働き方にも対応できますが、導入コストが高額なため導入できる企業は限定的になります。

ニアラインストレージ(Nearline Storage)

ニアラインとは「near online」という言葉を省略したもので、オンプレミスで管理されているサーバーに代表されるオフラインストレージと、クラウドサービスとして提供されているオンラインストレージの中間に位置するストレージです。

通常の業務利用で使用されるサーバー向けストレージは「SAS(Serial Attached SCSI)」というインターフェースで接続されています。
高い信頼性を求められる企業用途において高速かつ安定したデータ転送が可能ですが、SAS対応のHDDは高額というデメリットがあります。

コストを抑えつつ大容量のデータ保存を行いたい場合、SASの代わりにPCに多く採用されている安価なSATAのHDDをSASに変換して接続するという方法をとったストレージがニアラインストレージの大きな特徴となっています。

これにより速度や信頼性は低下するものの、低コストで大容量のストレージを構築することが可能です。

用途としては、例えば1~3ヶ月に1回くらいしかアクセスしないような利用頻度の低いファイルの保存用ストレージとして活用されます。
そこそこの速度でアクセスできる大容量ストレージを安価に構築できるメリットがある反面、利用用途が限定的なことから、利用頻度は低いものの削除できないデータを大量に保存する必要がある企業以外には浸透していません。

また、昨今はクラウドサービスとしてニアラインストレージを提供している企業もあることから、費用をかけてまでオンプレミスでニアラインストレージを構築する必要性が薄れつつあります。

クラウドストレージ(Cloud Storage)

ここまではオンプレミス、すなわち自社のオフィスもしくはビル内に設置されたストレージを紹介してきました。

オンプレミス運用は簡単に設置ができる、物理的にサーバーにアクセスできる反面、地震などの災害に対する電源の冗長性、建物の倒壊リスクなどBCP対策が難しいことに加えて、場所を問わない働き方への対応が難しいというデメリットがあります。
データセンターを自社で借りるという方法もありますが、ラック単位で借りると費用面の負担が大きく、ユニット単位で借りることで費用は削減できるもののサーバーのスペックやストレージ容量を妥協する必要が出てきます。

一方でクラウドストレージは、個別でデータセンターと共有するのではなく、クラウドサービス提供事業者が運営もしくは契約しているデータセンターのリソースを自社に必要な分だけ利用できるため、コストを大きく抑えることができます。

そして、サーバーの管理はクラウドサービス提供事業者が行うため、情報システム部を社内に持たない中小企業でも安心して利用できます。
もちろん、新しい働き方にも完全に対応しており、場所にとらわれることなく業務を遂行できるため、生産性を大きく向上させることも可能です。

ストレージの中でもスタンダードになりつつあるクラウドストレージですが、クラウドストレージは提供事業者により、単純なファイル共有だけを目的にしたものから、ファイルサーバーのクラウド移行に対応した高セキュリティ、高機能なものまで多数存在するため、クラウドストレージを見極めるスキルが求められます。

そのため、ストレージに知見の無い企業ではどれを選べばよいのかわかりにくいといったデメリットがあり、自社運用に応じたサービスを選ぶ際に、現場の運用を理解し相談に対応できるサービス事業者を探す必要があります。

4. ストレージの方式(管理・保存)

ここまで、ストレージの物理的な種類、設置場所、接続方法などを説明してきました。

上記のストレージをデータセンターで高度な運用管理を行い、自社に必要な分だけを利用できるクラウドストレージが注目を集めています。
ここからはその中でも3つの方式について使用目的、特徴などを説明します。

ファイルストレージ(File Storage)

ファイルストレージは、「階層構造」にてファイルを保存することを目的としたストレージです。

階層構造とは、「ツリー構造」とも言われますが、Windowsのエクスプローラーのような階層ごとにフォルダ・ファイルを管理・表示する構造です。
どのフォルダにどのファイルが保存されているかといった情報が、視覚的にわかりやすいというメリットがあり、多くのPCで採用されていることから、ファイルストレージは、普段使用しているPCと同じ操作感で利用ができます。

ITリテラシーが高くなくても、直感的に扱うことができるため、ファイルサーバーと同じような使い方を導入直後からできる大きなメリットがあります。

その反面、ファイル数が多くなると、データの大量アップロード時に発生するオーバーヘッドによる高負荷でアクセス速度が低下する、保存ファイル数が多くなるほど速度が低下するなど、オンプレミスのファイルサーバーと似た欠点を持っています。
扱うファイルの種類としては、通常業務で多く使われるOffice系ファイルなどの非構造化データを保存されることの多いストレージ方式となります。

なお、非構造化データの詳細については、こちらのコラムをご参照ください。

ブロックストレージ(Block Storage)

ブロックストレージは、主にデータベースに代表される構造化データを扱うことを目的としたストレージです。
記録領域を「ボリューム」という単位で分割し、ブロック単位でデータを保存・管理する方法をとっていることから、極めて高速なアクセスを実現しています。

また、階層構造を持たないため、例えばデータ量が多くなったとしても瞬時に検索が完了します。
ブロックストレージは構造化データの保存に特化していることから、データベースやメールサーバーといった用途に最適なストレージとなっています。

しかし、「ファイル名」「日付」「ファイルサイズ」「データの種類」などのメタデータを持つことができないため、非構造化データの保存には適していません。

オブジェクトストレージ(Object Storage)

オブジェクトストレージは、ファイルおよびメタデータを「オブジェクト」という単位にしてフラットに保存することができるストレージ方式です。

階層構造を持っていないストレージで、ハードウェアの物理的な設置場所にとらわれないことから、場所の制限を受けることなくデータの分散保存に対応したストレージです。
ファイルストレージのような、フォルダ単位の容量上限といった制約もないことから、動画・画像・音声などの大容量データの保存に最適なストレージ方式です。

代表的なサービスとしては Amazon S3Azure Blob Storage などがあります。
オブジェクトストレージのストレージ容量上限はスケールアウトすることで拡張できるという大容量ファイル保存に適したメリットがある一方で、削除処理に時間がかかる、ファイル数が多くなると検索速度が低下するなどのデメリットも存在します。

それ以外には大きな欠点もないことから、非構造化データ保存用途で利用企業が拡大しているストレージ方式です。

5. ファイルストレージのメリット・デメリット

ここでは先ほどの3つのストレージの方式について、より詳しくメリット、デメリットを紹介していきます。
まずはファイルストレージに関するメリット、そしてデメリットについて説明します。

ファイルストレージを使うメリット

  • ・PCと同じディレクトリ構成
  • ・ITリテラシーが高くなくても直感的に扱える

PCと同じディレクトリ構成

PCと同じく階層構造が取られており、誰でも直感的に扱うことができます。
これにより、ソリューション導入直後に業務利用が可能です。

ITリテラシーが高くなくても直感的に扱える

先ほどのPCと同じ階層構造が取られているところと共通しますが、視覚的にわかりやすい構造のため、ITリテラシーに左右されないという点があります。

そのため、情報システム部が存在しない中小企業で導入する場合、現場負担なく運用ができるストレージ方式となります。

ファイルストレージを使うデメリット

  • ・フォルダ内のファイル数・ストレージ容量の上限
  • ・ファイル数が増えるほど速度が低下

フォルダ内のファイル数・ストレージ容量の上限

ファイルストレージは、フォルダに格納できるファイル数・容量に上限があります。

そのため、大容量ファイルを保存整理する場合は、事前にフォルダのツリー構成を考えておく必要があります。

1つのフォルダにまとめて保存という運用をしている場合、フォルダ内のファイル数上限に達した場合に保存ができなくなり、ファイル保存のルールが不明確なままフォルダを増やすことに繋がり、ファイルが散乱する原因となります。

ファイル数が増えるほど速度が低下

また、ファイルストレージは保存するファイルが増えれば増えるほど、レスポンスが低下する傾向があります。

そのため、よく使うファイル、使用頻度が1~3ヶ月に1回くらいの低頻度ファイル、1年に1回使うかどうかという内容であるものの、最低でも1年前後の保存をしなければならないコールドストレージ向けのファイルなど、ストレージの階層化を進めることでこの欠点を回避しやすくなります。

いずれにしてもファイル保存から再利用、廃棄といったファイルのライフサイクル管理に関するルール策定は必須となります。

6. ブロックストレージのメリット・デメリット

次にブロックストレージについてメリット、そしてデメリットについて説明します。

ブロックストレージを使うメリット

  • ・極めて高速なファイル管理が可能
  • ・検索性も高く必要なデータに瞬時にアクセス

極めて高速なファイル管理が可能

ブロックストレージストレージは、データベースに代表される構造化データのみを扱うストレージです。

そのため、3つのストレージ方式の中でも極めて高速なアクセスを実現するストレージとなっています。
顧客の購買行動分析など、回帰分析用の構造化データを保存し、高速に分析処理を行う用途に最適なストレージ方式となっています。

検索性も高く必要なデータに瞬時にアクセス

ブロックストレージは、構造化データを扱うストレージ方式ということもあり、全体的に処理が高速ですが、特に重要な点が検索も高速であるという点です。

保存されているデータには、ユニーク(一意)な識別子を使用しています。
それだけではなく、階層構造を持っていないことが検索速度に大きく影響しています。

階層構造のファイルストレージは第1階層、第2階層、第3階層とたどっていき、目的の場所へ到達、そのうえでファイル名が一致して目的のファイルを検索で探しだすことができます。

ブロックストレージは、ユニークな識別子だけで検索をしています。
それさえわかれば、瞬時に呼び出すことができる点がファイルストレージと比較して高速な検索を実現しています。

ブロックストレージを使うデメリット

  • ・メタデータを保有できない
  • ・ストレージ価格がファイルストレージと比較して高額

メタデータを保有できない

ブロックストレージは、構造化データの保存・管理に特化されたストレージです。

そのため、保持できる情報が限られています。具体的には、メタデータを保持できません。
ファイルの属性に関する情報まで含めた保存を行いたい場合は、選択肢から外れてしまいます。

ストレージ価格がファイルストレージと比較して高額

ブロックストレージは、高速な分析処理・検索といったことを目的としたストレージのため、速度が何よりも重視されます。

そのため、ストレージコストが高額になりがちです。
コストを優先してスペックを落としてしまうと、強みである速度に影響が出てしまうことから、コストと速度はトレードオフの関係にあるといえます。

7. オブジェクトストレージのメリット・デメリット

最後にオブジェクトストレージについてメリット、そしてデメリットについて説明します。

オブジェクトストレージを使うメリット

  • ・格納場所の依存性・容量制限がない
  • ・RestAPIとの連携で業務効率を向上
  • ・ファイルはメタデータとセットで管理可能
  • ・ビッグデータの3Vに対応したストレージ方式

格納場所の依存性・容量制限がない

オブジェクトストレージは階層構造がなく、フラットに非構造化データを扱うことができるストレージ方式です。
階層構造がないため、ファイルストレージのようなフォルダ毎の容量上限という概念もありません。

また、オンプレミスのファイルサーバーのような、サーバーの設置場所ごとにストレージ容量の上限があるといった概念もありません。

これは、フラットにデータを保存することのできるオブジェクトストレージの大きなメリットとなっており、代表的なオブジェクトストレージの1つであるAmazon S3のように、複数拠点に分散していても不都合を感じることなく利用することができます。

そのため、動画・画像・音声といった大容量データを保存することに特に適したストレージ方式となっています。

RestAPIとの連携で業務効率を向上

オンプレミスのファイルサーバーと違い、オブジェクトストレージは最初からRestAPI連携が考慮されているストレージ方式です。

そのため、複数のクラウドサービスを連携させて業務の自動化を行い、業務の効率化・生産性向上を実現できます。

ファイルはメタデータとセットで管理可能

構造化データ特化のブロックストレージと違い、オブジェクトストレージは非構造化データ保存に最適なストレージ方式です。

その大きな違いとしては、メタデータをファイルとセットで管理することができる点です。

ファイル名、日付、ファイルサイズ、データの種類といったメタデータを扱える点は、バイナリデータである動画、音声、画像などを管理するうえで欠かせない特徴の1つです。

ビッグデータの3Vに対応したストレージ方式

オブジェクトストレージは、ビッグデータのもつ3つの特性、通称3V(「多様性(Variety)」「データ量(Volume)」「生成速度・頻度(Velocity)」)の特性を持つデータ保存に最適なストレージ方式です。

オブジェクトストレージには、容量制限がないことから、データレイクを構築し、データドリブン経営に生かすことができます。

オブジェクトストレージを使うデメリット

  • ・検索性はブロックストレージに劣る
  • ・データの削除に時間がかかる

検索性はブロックストレージに劣る

大容量の非構造化データを大量保存に適しているストレージですが、欠点もあります。

それは、扱うデータが非構造化データであるという特性上、検索性がブロックストレージに劣る点です。
ユニークな識別子だけで管理している高速なブロックストレージには、検索性能・速度では敵いません。

データの削除に時間がかかる

大量のデータ保存に適したオブジェクトストレージですが、データを削除する場合、その削除処理はオブジェクト単位(ファイル+メタデータ+固有のID(URI))で処理されます。

その削除処理に時間がかかることが、ファイルストレージやブロックストレージと大きく異なる点となります。

8. まとめ | データの特性に合わせたストレージの活用で業務効率向上

ここまで、ストレージの種類、設置場所・接続方法、そして3つの方式について説明しました。

特に、ストレージの3つの方式ごとにメリット・デメリットは大きく異なっていることから、誤った組み合わせを選択してしまった場合には、ストレージの真価を発揮できないどころか、業務効率が低下してしまいます。

目的・利用用途に最適なストレージ方式を組み合わせることで、各ストレージの持つ強みを発揮し、生産性を向上させることが可能です。

法人向けクラウドストレージ「DirectCloud」であれば、ファイルストレージのようなわかりやすいUIと、オブジェクトストレージの大容量ファイル対応を合わせ持っており、その上でセキュアなファイル保存を企業のセキュリティポリシーに沿って設定可能です。
そして、万全の セキュリティ対策 とIT監査といった高度な機能も備えており、生産性・ガバナンス向上にも大きく寄与します。

「DirectCloud」の活用に興味のある方は、以下の資料ダウンロードから詳細情報を確認いただけます。

オンライン・クラウドストレージ「DirectCloud」へ
NAS・ファイルサーバーの
クラウド移行サービス説明書
  • NAS/ファイルサーバーのクラウド移行をご検討の方におすすめ。
  • ファイルサーバーを超えた厳格な管理機能をクラウドで実現。
    各機能やオプション、導入事例、他社比較など、ボリュームたっぷりの内容。
ダウンロードCTA
ctaダウンロードボタン
オンライン・クラウドストレージ「DirectCloud」へ
NAS・ファイルサーバーの
クラウド移行サービス説明書
  • NAS/ファイルサーバーのクラウド移行をご検討の方におすすめ。
  • ファイルサーバーを超えた厳格な管理機能をクラウドで実現。
    各機能やオプション、導入事例、他社比較など、ボリュームたっぷりの内容。
ダウンロードCTA
ctaダウンロードボタン

資料ダウンロード