USER MANUALS

Denodo MPP によるデータ一括読み込み

組み込み MPP に接続されている標準の JDBC データソースを使用して、Denodo からデータ一括読み込みを実行できます。

このような場合、Denodo では以下を実行します。

  1. まず、挿入するデータを含む一時ファイルを Parquet ファイル形式または Iceberg テーブル形式で生成します (Delta Lake テーブル形式はサポートされていません)。

  2. 次に、該当のファイルを、このセクションで構成した特定のパスにアップロードします。

  3. 最後に、指定したパスからデータベーステーブルがデータを取り込むために必要な操作を行います。

詳細については、Denodo の MPP の Hadoop 互換ストレージを使用するデータベースへのデータ一括読み込み の説明を参照してください。

Denodo でデータ一括読み込みを設定する前に、Denodo が作成するファイルを配置する場所を設定する新しいスキーマを、Denodo 組み込み MPP で作成する必要があります。

それには、Denodo ストアドプロシージャ CREATE_SCHEMA_ON_SOURCE を使用できます。

CALL CREATE_SCHEMA_ON_SOURCE(
   'admin_denodo_mpp',
   'embedded_mpp',
   'hive',
   'test',
   '<filesystem_schema>://<host>/<folders>');

データ一括読み込みを構成するには、 embedded_mpp データソースの [Read & Write] タブで [Use Bulk Data Load APIs] をチェックし、少なくとも以下のパラメータを入力します。

  • HDFS URI

  • Server time zone

  • Catalog

  • Schema

Configure Bulk Data Load

データ一括読み込みの構成

次に、選択したファイルシステムによっては、いくつかの Hadoop properties を追加し、認証を構成する必要があります。「 Hadoop 互換ルートのサポート 」のセクションを参照してください。

Azure Data Lake Storage へのアクセスを構成するプロパティを以下の例に示します。

Configure Azure Data Lake Storage properties

Azure Data Lake Storage のプロパティの構成

最後に [Test bulk load] ボタンをクリックし、すべて正常に動作していることを確認します。

Add feedback