USER MANUALS

Delta Lake

Delta Lake は、Parquet データファイルを拡張し、ACID トランザクション向けのファイルベースのトランザクションログと拡張性の高いメタデータ処理を備えたテーブル形式です。

Denodo 組み込み MPP は、Delta Lake テーブルにアクセスするために 組み込み Hive メタストア に接続される、 delta という名前の事前定義されているカタログとともに配布されます。

delta.properties
connector.name=delta

# Embedded Hive Metastore
hive.metastore.uri=thrift://hive-metastore:9083

Delta Lake テーブルをクエリするには、 CREATE TABLE 文を使用して、これらのテーブルを 手動で 組み込み MPP のメタストアに登録する必要があります。スキーマとデータファイルリストが、Delta Log の中でテーブルと同じ場所にあることから、メタストアの列なしエラーを回避するために、Delta Lake テーブルのスキーマとしてダミー列を指定する必要があります。

MPP に Delta Lake テーブルを登録する
CREATE TABLE delta.default.orders (
   dummy bigint
) WITH (
  external_location = 'abfs://<file_system>@<account_name>.dfs.core.windows.net/<path>/<file_name>',
  format = 'PARQUET'
);

CREATE TABLEWITH 句を使用して、他のプロパティをテーブルに設定することもできます。「 Delta Lake テーブルのプロパティ 」を参照してください。

Delta Lake テーブルを登録した後、Denodo で 組み込みデータソース の [From MPP Catalogs] タブを使用して、登録した Delta Lake テーブルから基本ビューを作成できます。

Explore Delta Lake tables

Delta Lake テーブルの確認

Delta Lake テーブルを直接クエリする

もう 1 つの方法として、テーブルをメタストアに登録せずに、テーブルの場所をテーブル名として使用することでテーブルを直接クエリすることもできます。

MPP から Delta Lake テーブルをクエリする
SELECT * FROM
   delta."$path$"."abfs://<file_system>@<account_name>.dfs.core.windows.net/<path>/<file_name>";

機能

Denodo 組み込み MPP が提供する Delta Lake テーブルを扱う機能を以下に示します。

  • 組み込みまたは外部のメタストアの既存の Delta Lake テーブルから基本ビューを作成します (組み込み MPP データソースの [From MPP Catalogs] タブ)。

  • クエリ

  • 組み込み MPP の高速化

制限事項

  • グラフィカル に Delta Lake データセットを確認し、MPP のテーブルや Denodo の基本ビューを作成します (組み込み MPP データソースの [From object storage] タブ)。

  • データ一括読み込み

  • キャッシュ: Full キャッシュモード

  • リモートテーブル

Add feedback