最も待ち望まれていたAmazon Web Services (AWS)の機能の一つが、今利用できるようになっています。データレイクの概念を再び注目されるようにした立役者、Amazon Athenaです。AmazonがAmazon Athenaの専用サイトで提供しているアップデート(と有益なブログ記事)の長いリストをチェックしてみてください。 Amazon Athenaは業界に画期的な変化をもたらしています。

Amazon Athena

Athenaは、Amazon S3でSQLクエリを直接実行できるサービスです。製品としての利点はサーバーレスです。インストールまたはデプロイするものは何もありません。また、ユーザーはクエリベースで課金されます。

Prestoは、Amazon Athena Data Lakesの機能を強化してくれます。 Prestoは、ビッグデータ用の分散SQLクエリエンジンです。高速、強力、そしてスケーラブルです。 S3に保存していた大量のデータを使ってサービスをテストしましたが、パフォーマンスは素晴らしいものでした。

AthenaはGoogle BigQueryとよく比較されます。基本的に、ストレージ(S3)とクエリに対して支払います。ただし、Athenaでは、対象となるデータファイル、形式、およびディレクトリ構造もハンドリングする必要があります。これにより、処理がより複雑になる反面、より柔軟になるとも言えます。

Amazon AthenaとAmazon Redshiftの比較も非常に有効です。 Redshiftのパフォーマンスは非常に優れていますが、Redshiftクラスターの限界とコストにも縛られています。一方、Athenaはサーバーレスです。

undefined

Data Lakeにデータを入れる

Amazon AthenaのData Lake適性は、理想的な環境としてAmazon S3を利用するのに大いに役立ちます。Amazon Athenaのデータレイク互換性は、Amazon S3が企業のデータレイクとして理想的な環境にするのに大きな役割を果たします。Athenaでは、すべてのソースからのデータがS3に送られます。その後、アドホックで、パフォーマンスの高い、スケーラブルで理解しやすい方法でクエリが実行されます。データプロフェッショナルの夢が実現するのです。

ここで忘れてはいけない前提として、データをAmazon S3に取り込む必要があることです。 Amazonで使用する他のサービス(RDSやEMR)、またはAWS以外のサービス(Salesforce、MixPlanel、Facebook、Google Analyticsなど)、さらには他のプラットフォーム上の他のデータストアからデータを取り込むことになります。

Xplentyがどのように役立つか?

そのためのソリューションは?ここでXplentyに話を戻しましょう。 Xplentyは、Amazon Athenaがサポートするすべてのファイル形式(CSV、TSV、JSON、およびParquet)でデータをAmazon S3に書き込むことができます。また、Xplentyは100 以上のデータソースとデスティネーション に接続できるため、外部のデータストアからデータレイクに定期的にデータを送り込むことができます。.

それ以外の利点としては、 XplentyはSaaSサービスであるため、Xplentyを使用している企業はメンテナンスや管理について心配する必要はありません。

 Amazon AthenaおよびデータレイクにおいてXplentyが役立つと思われた方は、デモ、無料トライアル、実装チームとの無料のセットアップ会議のいずれかを是非お申し込みください。

Xplentyのオンラインデモに登録して、無料でプラットフォームを試してみよう!

(オリジナル記事は2016年12月に投稿されたものになります。)