Delta Lake¶
Delta Lake は、Parquet データファイルを拡張し、ACID トランザクション向けのファイルベースのトランザクションログと拡張性の高いメタデータ処理を備えたテーブル形式です。
Denodo 組み込み MPP は、Delta Lake テーブルにアクセスするために 組み込み Hive メタストア に接続される、 delta
という名前の事前定義されているカタログとともに配布されます。
connector.name=delta
# Embedded Hive Metastore
hive.metastore.uri=thrift://hive-metastore:9083
Delta Lake テーブルをクエリするには、 CREATE TABLE
文を使用して、これらのテーブルを 手動で 組み込み MPP のメタストアに登録する必要があります。スキーマとデータファイルリストが、Delta Log の中でテーブルと同じ場所にあることから、メタストアの列なしエラーを回避するために、Delta Lake テーブルのスキーマとしてダミー列を指定する必要があります。
CREATE TABLE delta.default.orders (
dummy bigint
) WITH (
external_location = 'abfs://<file_system>@<account_name>.dfs.core.windows.net/<path>/<file_name>',
format = 'PARQUET'
);
CREATE TABLE
の WITH
句を使用して、他のプロパティをテーブルに設定することもできます。「 Delta Lake テーブルのプロパティ 」を参照してください。
Delta Lake テーブルを登録した後、Denodo で 組み込みデータソース の [From MPP Catalogs
] タブを使用して、登録した Delta Lake テーブルから基本ビューを作成できます。
Delta Lake テーブルを直接クエリする¶
もう 1 つの方法として、テーブルをメタストアに登録せずに、テーブルの場所をテーブル名として使用することでテーブルを直接クエリすることもできます。
SELECT * FROM
delta."$path$"."abfs://<file_system>@<account_name>.dfs.core.windows.net/<path>/<file_name>";
機能¶
Denodo 組み込み MPP が提供する Delta Lake テーブルを扱う機能を以下に示します。
組み込みまたは外部のメタストアの既存の Delta Lake テーブルから基本ビューを作成します (組み込み MPP データソースの [
From MPP Catalogs
] タブ)。クエリ
制限事項¶
グラフィカル に Delta Lake データセットを確認し、MPP のテーブルや Denodo の基本ビューを作成します (組み込み MPP データソースの [
From object storage
] タブ)。データ一括読み込み
キャッシュ: Full キャッシュモード
リモートテーブル