データウェアハウスは、情報へのアクセスを改善し、クエリの応答時間を短縮し、企業がビッグデータからより深いインサイトを取得できるようにします。少し前までは、データウェアハウスを構築するためにインフラに多くの投資をしなければなりませんでした。しかし、クラウドテクノロジーの出現により、企業のデータウェアハウスのコストは大幅に削減されました。
今日では、高速で拡張性が高く、従量課金制で利用できるクラウドベースのデータウェアハウスツールがあります。ここでは、我々が選んだ最高のデータウェアハウスツールと、機能概要について紹介します。
-
Amazon Redshift
-
Microsoft Azure
-
Google BigQuery
-
Snowflake
-
Micro Focus Vertica
-
Teradata
-
Amazon DynamoDB
-
PostgreSQL
-
Amazon RDS
-
Amazon S3
-
SAP HANA
-
MarkLogic
-
MariaDB
-
Db2 Warehouse
-
Exadata
-
BI360 Data Warehouse
-
Cloudera
Integrate Your Data Today!
Try Xplenty free for 14 days. No credit card required.
(データ統合製品をお探しですか? こちらのブログをチェックしてみてください。)
1. Amazon Redshift
Redshiftは、企業向けのクラウドベースのデータウェアハウスです。フルマネージドなプラットフォームは、数秒でペタバイトのデータを処理することができます。そのため、高速なデータ分析に適しています。また、自動同時実行スケーリングにも対応しています。自動化により、ワークロードの需要に合わせてクエリ処理リソースを増減してくれます。これにより、運用上のオーバーヘッドなしに数百個の同時実行クエリを実行することができます。さらに、Redshiftでは、クラスタをスケーリングしたり、ノードタイプを切り替えたりすることができます。このように、データウェアハウスのパフォーマンスを最適化し、運用コストを削減することができます。
Amazon Redshift 価格
Amazon Redshiftには異なる価格設定があります。オンデマンド価格は1時間ごとに請求されます。1時間あたり0.25ドル〜です。ただし、合計コストはクラスタ内のノード数によって異なります。このプランでは、Redshiftの一時停止と再開機能を利用してコストを節約することができます。
Amazon Redshiftのマネージドストア価格は、データ1GBあたり、1ヶ月あたり0.024ドルから。地域によって価格が異なります。この価格にはバックアップを保存する費用は含まれていません。
Related Reading: How to Set Up an Amazon Redshift Data Warehouse
2. Microsoft Azure
Azure SQLデータウェアハウスは、Microsoftが提供するクラウドベースのリレーショナルデータベースです。ペタバイト規模のデータの読み込み/処理やリアルタイムのレポート作成に最適化することができます。プラットフォームはノードベースのシステムで、MPP(Massively Parallel Processing)を採用しています。同時実行のクエリを最適化するのに適したアーキテクチャとなっています。したがって、ビジネスインサイトをはるかに高速に抽出し、可視化することができます。
このデータウェアハウスは、何百ものMS Azureリソースと互換性があります。例えば、プラットフォームの機械学習ツールを使ってインテリジェントなアプリを構築することができます。また、このプラットフォームでは、構造化されたデータと非構造化されたデータの異なるタイプのデータを保存することができます。データは、オンプレミスの SQL データベースや IoT デバイスなど、多様なソースからもたらされる可能性があります。
Microsoft Azure SQL 価格
Azure SQLデータベースのサーバーレスコンピューティングの価格は、Vコア/時間あたり0.52ドル〜です。ここでは、Vコアは1つのハイパースレッドです。Azureでのサーバーレスコンピューティングは、Gen 5の論理CPUで動作します。Azureでのストレージコストは、最低5GBのストレージと最大4TBのストレージがあり、GB/時間あたり0.115ドルです。バックアップストレージの追加料金は、GB/月あたり0.20ドルです。
Related Reading: Azure SQLデータウェアハウスの後継であるAzure Synapse Analyticsに関する記事はこちら。
3. Google BigQuery
BigQueryは、機械学習機能を内蔵したコストパフォーマンスに優れたデータウェアハウスツールです。クラウドMLやTensorFlowと統合して、強力なAIモデルを作成することができます。また、ペタバイトのデータに対して数秒でクエリを実行してリアルタイムの分析を行うこともできます。
このクラウドネイティブのデータウェアハウスは、地理空間分析をサポートしています。これを使えば、ロケーションベースのデータを分析したり、新しいビジネスを発見したりすることができます。
BigQueryは、コンピューティングとストレージを分離することが可能です。そのため、ビジネス・ニーズに基づいて処理とメモリ・リソースをスケーリングすることができます。分離することで、各リソースの可用性、スケーラビリティ、およびコストを管理することができます。
Google BigQuery 価格
BigQueryでは、ストレージとクエリの価格が別々に設定されています。ストレージはアクティブか長期かで区別されています。後者は90日以上変更されていないパーティションに保存されているデータです。Google BigQueryのアクティブストレージの料金は、1GB/月あたり$0.020です。長期保存の場合は、GB/月あたり0.010ドルです。どちらも最初の10GB/月は無料です。
Google BigQueryでのクエリには、オンデマンドと定額制の2つの価格モデルがあります。Google BigQueryのオンデマンド価格は、TBあたり5ドルで、毎月1TBが無料です。月額定額制の価格設定は、500スロット(スロット:BigQueryがデータ処理に使用する仮想 CPU のこと)あたり10,000ドルで請求されます。一方、年間契約の場合は、500スロット/月につき8,500ドルで請求されます。BigQueryの定額料金は、大量のデータを扱い、予測可能なデータコストを求めている企業に最適です。
Integrate Your Data Today!
Try Xplenty free for 14 days. No credit card required.
4. Snowflake
Snowflakeを使用して、エンタープライズグレードのクラウドデータウェアハウスを設定することができます。このツールを使用すると、さまざまな非構造化および構造化されたソースからのデータを分析することができます。マルチクラスタ、シェアードアーキテクチャにより、ストレージと処理能力が分離されています。したがって、ユーザーの活動に応じてCPUリソースをスケーリングすることができます。また、このスケーラビリティにより、クエリのパフォーマンスも高速化され、実用的なインサイトをより迅速に提供することができます。
Snowflakeのマルチテナント設計により、組織全体でリアルタイムにデータを共有することができます。ユーザーはデータを移動することなく、これを行うことができます
Snowflake 価格
処理されたデータ量に基づいてチャージされる他のほとんどのデータウェアハウスツールに対して、Snowflakeの価格設定は秒単位の請求に基づいています。Snowflakeの計算コストは、最低でも60秒ごとに課金されます。ただし、価格は地域、プラットフォーム、および選択された価格プランによって異なります。ユーザーは、Standard、Enterprise、Business Critical、およびVPSから選択できます。スタンダードプランの平均計算コストは、1クレジットあたり1秒あたり0.00056ドルです。エンタープライズプランでも同じで、1クレジットあたり1秒あたり0.0011ドルです。
5. Micro Focus Vertica
Verticaは、AWSやAzureなどのプラットフォーム上でクラウドで利用できるSQLデータウェアハウスです。オンプレミスやハイブリッドとしてデプロイすることもできます。このツールはカラム型ストレージをサポートし、MPPを使用してクエリの速度を向上させます。シェアード・ナッシング・アーキテクチャにより、共有リソースの競合を減らすことができます。
Verticaは、分析のためのビルトイン機能を提供しています。これには、機械学習、パターンマッチング、時系列分析などが含まれます。また、OLEDBなどの標準的なプログラミング・インターフェースもサポートしています。また、データ圧縮を利用してストレージを最適化します。
Micro Focus Vertica 価格
Verticaには、最大1TB、ノード数3台へのインストールが可能なの無料コミュニティプランがあります。有料のクラウドプランは、時間単位で顧客に課金されます。 Verticaでのコンピューティングコストは、地域や64ビットのAmazon Machine Imageなどのフルフィルメントオプションによって異なります。価格は1時間あたり2ドル〜です。
6. Teradata
Teradataは、膨大な量のエンタープライズデータをクラウド上で収集・分析するためのデータウェアハウスプラットフォームです。このツールは、超高速な並列クエリ基盤を提供します。これにより、実用的なインサイトへのアクセスを高速化します。TeradataのQueryGridは、ベストフィットなエンジニアリングを実現します。作業の内容に適したツールを提供するために、複数の分析エンジンを展開しています。
また、スマートなインメモリ処理を採用し、追加コストをかけずにデータベースのパフォーマンスを最適化します。SQLを使用して、データウェアハウスは商用およびオープンソースの分析ツールに接続します。
Teradata 価格
Teradataは従量課金モデルです。しかし、同社はその価格設定を公開してません。
7. Amazon DynamoDB
DynamoDBは、企業向けのスケーラブルなNoSQL、クラウドベースのデータベースシステムです。ペタバイト規模のデータに対して、1日あたり10兆、あるいは20兆回のリクエストを行うことが可能で、クエリー処理能力を拡張することができます。また、キーバリューストアとドキュメントデータマネジメントを利用して柔軟なスキーマを作成します。このように、テーブルは、成長する要件に基づいて新しい列を追加することで自動的にスケーリングすることができます。
データベースシステムには、DynamoDBアクセラレータ(DAX)が付属しています。これはインメモリキャッシュで、集計されたデータを読み込むのに必要な時間をミリ秒からマイクロ秒に短縮することができます。これにより、毎秒数百万のリクエストを含む超高速なクエリ処理を実現します。
Amazon DynamoDB 価格
DynamoDBには、25GBのデータストレージと250万回のストリームリードリクエストを提供する無料プランがあります。無料プランを超えるストレージとコンピューティングについては、ユーザーはオンデマンド価格とプロビジョニングされた容量の価格プランから選択することができます。
Amazon DynamoDBのオンデマンド価格は、100万回のリードあたり0.25ドル、100万回のライトあたり1.25ドルで課金される。ストレージコストはデータ1GBあたり0.25ドルです。
プロビジョニングされた容量の価格設定は、変動の激しいトラフィックを扱うユーザーに適しています。需要を自動的に増減させることができ、計算コストを節約することができます。このモデルでは、プロビジョニングされたリードとライトに応じて、1時間あたりの柔軟な価格設定が適用されます。Amazon DynamoDBのコンピューティングコストは、需要の増加に応じて増加します。データストレージのコストは1GBあたり0.25ドル(定額)です。
8. PostgreSQL
PostgreSQLは、クラウドで利用できるオープンソースのデータベース管理ソリューションの1つです。 中小企業から大企業まで、このリソースをプライマリデータベースとして使用することができます。例えば、インターネット規模のビジネスアプリケーションを推進するために使用することができます。地理空間データを扱うには、PostgreSQLをPostGIS拡張機能と統合することを検討してください。この統合により、位置情報ベースのビジネスソリューションを提供できるようになります。
このプラットフォームはSQLとJSONクエリの両方をサポートしています。また、MVCC(Multi-Version Concurrency Control)のような機能により、データベースの性能を最適化することができます。
PostgreSQL 価格
オープンソースのソフトウェアで、無償で利用できます。
9. Amazon Relational Database Service (RDS)
Amazon RDSを利用することで、費用対効果の高いクラウドベースのリレーショナルデータベースを構築することができます。このプラットフォームは、PostgreSQLやAmazon Auroraなど6つのデータベースエンジンと互換性があります。システム内でレプリケーションを生成して、運用ワークフローの可用性を高めることができます。例えば、リードレプリカを使用すると、プライマリデータベースからの読み込みトラフィックを仮想コピーで処理させることができます。大量のアプリケーションに対応する必要がある場合のオプションです。また、RDS のコンピューティング機能とメモリ機能を 32 vCPU と 244 ギガバイト RAM に拡張することもできます。
Amazon RDS 価格
Amazon RDSのコストは、ここに挙げた他のデータウェアハウスツールと比較して、少し複雑です。Amazon RDSの価格は以下の点に依存します。
- 望ましいデータベースエンジン
- 地域
- 単一または複数のデプロイメント
- オンデマンドまたはリザーブドインスタンス、時間単位の課金
例として、Amazon RDS for PostgreSQLのコンピューティングコストは、オンデマンド価格プランでは1インスタンスあたり1時間あたり4.27ドルです。リザーブドインスタンスプランでも同様で、1年間の契約で1時間あたり2.73ドルとなっています。ストレージコストはデータベースエンジン全体で一律で、1GB/インスタンスあたり0.115ドルです。
10. Amazon Simple Storage Service S3
Amazon S3は、中小企業から大企業まで、規模に応じたクラウドストレージのニーズに応えることができます。拡張性に優れたオブジェクト指向のサービスは、ビッグデータ分析にも対応しています。データは「バケット」に保存され、1つのバケットには最大5テラバイトのデータを格納することができます。このプラットフォームでは、費用対効果の高いストレージクラスのオプションがいくつか用意されています。例えば、S3 Standard-IA(Amazon S3 標準 – 低頻度アクセス)を使用して、時々アクセスするデータを保存することでコストを下げることができます。
Amazon S3 価格
Amazon S3のストレージコストは、ストレージクラスによって異なります。ユーザーはStandardから始まる7つのストレージクラスから選ぶことができます。ストレージはGB/月ごとに課金されます。例えば、Standardクラスの場合、最初の50TBであれば、GB/月あたり0.023ドルとなります。データ量が増えるにつれてコストはわずかではありますが下がります。
Amazon S3の計算コストは、リクエストの種類、リクエスト量、ストレージクラスによって異なります。
11. SAP HANA
SAP HANAは、インメモリキャッシュ機能を備えたクラウドベースのリソースです。そのため、高速でリアルタイムなトランザクション処理や、企業全体のデータ分析をサポートします。また、データアクセス、統合、仮想化のためのシンプルで一元化されたインターフェイスも提供します。
データフェデレーションを利用すれば、データを移動することなく、リモートのデータベースにHANA上から問い合わせを行うことができます。これらのデータソースには、HadoopやSAP Adaptive Server Enterprise(SAP ASE)などがあります。SAP HANAは、テキスト分析や予測分析、インテリジェンスドリブンなアプリ開発をサポートしています。
SAP HANA 価格
SAPは、HANAの価格情報を公開していません。
12. MarkLogic
MarkLogicは、強力なクエリ機能と多彩なアプリケーションサービスを備えたNoSQLデータベースシステムを提供します。スキーマにとらわれないプラットフォームにより、あらゆる形式やタイプのデータをそのままインジェストすることができます。これは、定義済みスキーマ用のネイティブストレージを備えているからです。サポートされているフォーマットには、地理空間データ、JSON、RDF、およびビデオのような大規模なバイナリが含まれます。内蔵の検索エンジンは、データを読み込んだ後のクエリをシンプルにします。これにより、質問をしてすぐに答えを得ることができます。
MarkLogic 価格
MarkLogicは消費量に応じて課金する。価格設定は3つのプランに分かれています。
- ロープライオリティフィックス:このプランのコンピューティングコストは、1時間/MCUあたり0.074ドル。ストレージはGB/月あたり0.10ドルです。
- スタンダードオンデマンド:ユーザーは需要をスケールアップまたはスケールダウンすることができます。このプランのコストは、1時間/MCUあたり0.125ドルです。ストレージはGB/月あたり0.10ドルです。
- スタンダードリザーブ:一定量のトラフィックが予想されるユーザーは、毎年計算容量を予約することができます。このプランでは、コンピューティングは1時間/MCUあたり$0.071です。ストレージコストは他の2つのプランと同じです。
13. MariaDB
MariaDBは、顧客向けアプリケーションをサポートするエンタープライズグレードのデータベースツールです。カラム型データベースを作成してリアルタイムのアナリティクスを実行するために使用することもできます。このソリューションは、大規模並列処理(MPP)も採用しています。そのため、数千億行のSQLクエリを実行することができます。これを実行する前にインデックスを作成しておく必要はありません。MariaDBは、ワークロードとビジネスのニーズに応じて、またはクラウドでスケールアウトすることができます。
MariaDB 価格
MariaDB Cloudの価格は、Foundationプランで1時間あたり0.45ドル〜です。同社は価格設定について詳細には公開しておりません。
14. Db2 Warehouse
IBM Db2 Warehouseは、フルマネージドでスケーラブルなクラウド・データ・ストレージ・プラットフォームです。アナリティクスや人工知能アプリケーションに適しています。このシステムには機械学習ツールが組み込まれています。これらを活用して、エコシステム内でMLモデルをトレーニングして展開することができます。ML開発のためにサポートされている言語には、SQLとPythonが含まれています。
また、Db2 Warehouseは直感的なUIやREST APIを備えています。ツールを使用して、処理能力やストレージの柔軟なスケーリングを管理することができます。複数のサーバーは、プラットフォームのMPP機能をクランクアップします。これらは、大規模なデータセットのための超高速な同時クエリを容易にします。
Db2 Warehouse 価格
Db2 Warehouseでは、9つの価格帯が用意されています。Flex Oneは最も基本的なプランで、ユーザーにシングルパーティショニングされたインスタンスを提供します。データウェアハウスプロジェクトを開始しようとしている企業に最適です。このプランのコンピューティングコストは、インスタンス/時間あたり$0.68です。
15. Exadata
オラクルの「自律型データウェアハウス」は、クラウド基盤「Exadata」上で稼働します。この自律型プラットフォームは、適応型機械学習を活用して管理タスクを自動化します。これらの作業は、チューニングやパッチ適用から、データベースの監視、アップグレード、セキュリティ保護まで多岐にわたります。
自律型Exadataデータウェアハウスの作成は簡単です。テーブルを指定して、数回クリックするだけでデータをロードすることから始めます。並列処理とカラムナー処理を採用し、パフォーマンスとスケーラビリティを向上させます。
Exadata 価格
オラクルの自律型データウェアハウスには、2つの価格体系があります。従量課金モデルは、Oracle compute unit (OCP)/hourあたり2.52ドルで請求されます。ストレージ・コストはTB/月あたり222ドルです。
月間フレックス・モデルでは、ユーザーは事前にコンピュート容量を予約することができます。OCPU/時間あたり1.68ドルで請求されます。この階層のストレージは、TB/月あたり148ドルです。
16. BI360 Data Warehouse
Solver BI360は、企業が異なるソースからの大量のデータを統合することを可能にします。これには、CRM、ERP、会計ソフト、非構造化データストアなどが含まれます。BI360は、データベースのデプロイメントとビジネスインテリジェンスのワークフローをシンプルにするように事前に設定されています。 クラウドベースのソリューションでは、直感的なダッシュボードと分析インターフェースが備わっています。例えば、データエクスプローラーを使用してデータを探索することができます。また、モジュールやディメンションを追加することも可能です。
データウェアハウスはMS SQL Server上で動作します。また、ビルトインの自動データロードツールを提供しています。これらは、データベースへのクエリや検索を簡単にしてくれます。
BI360 Data Warehouse 価格
BI360はデータウェアハウスの価格を公開していません。しかし、一部の試算によると、BI360のデータウェアハウスの価格は、1ユーザー/月あたり312ドルとなっている。
17. Cloudera
Clouderaのオペレーショナルデータベースは、低レイテンシー、高コンカレンシーのクラウドホスト型プラットフォームです。ビッグデータの分析やリアルタイムのビジネスインテリジェンスの抽出に最適です。リソースはポータブルで柔軟な分散をサポートしており、費用対効果に優れています。したがって、オンプレミスとクラウドベースのサーバー間を移動するのに必要な柔軟性を提供します。
このプラットフォームは、非構造化データ用のカラム型NoSQLストレージを作成するためにHBaseを利用しています。しかし、KuduがCloudera内で構造化データ用のリレーショナルデータベースを作成するのを支援してくれます。また、このツールは、リアルタイムデータとヒストリカルデータに基づいた予測モデリングをサポートしています。
Cloudera 価格
Clouderaデータウェアハウスは1時間ごとにチャージされます。1時間/インスタンスあたり$0.72〜です。
Integrate Your Data Today!
Try Xplenty free for 14 days. No credit card required.
最後に
クラウドベースのデータウェアハウスとCRMなどのサードパーティの統合を組み合わせることで、エンタープライズデータの可能性を引き出すことができます。Xplentyは、100以上の一般的なSaaSアプリケーションとデータストアからのデータ統合を支援します。 オンラインデモを予約し、無料トライアルを開始して、データウェアハウスのためのデータの変換とクリーニングを始めましょう。
Related Reading: How to Choose the Right Data Warehouse Tool for Your Business
Originally published on August 21st, 2019.