Hive¶
Denodo 組み込み MPP は、Parquet ファイルの Hive テーブルにアクセスするために 組み込み Hive メタストア に接続される、 hive
という名前の事前定義されているカタログとともに配布されます。
connector.name=hive-hadoop2
# Embedded Hive Metastore
hive.metastore.uri=thrift://hive-metastore:9083
Parquet¶
Parquet データセットをクエリするには、Denodo 組み込み MPP で Hive テーブルを作成する必要があります。そのために、Denodo で 組み込み MPP データソース を使用して、 グラフィカル に Parquet データセット (Hive スタイルのパーティション分割を使用するデータセットを含む) を確認し、MPP のテーブルや Denodo の基本ビューを作成できます。
重要
グラフィカル に Parquet データセットを確認するには、Denodo エンタープライズプラスサブスクリプションバンドルと更新プログラム 8.0u20230301 が必要です。
機能¶
Denodo 組み込み MPP が提供する Parquet ファイルを扱う機能を以下に示します。
グラフィカル に Parquet データセットを確認し、MPP のテーブルや Denodo の基本ビューを作成します (組み込み MPP データソースの [
From object storage
] タブ)。外部メタストアの既存の Hive テーブルから基本ビューを作成します (組み込み MPP データソースの [
From MPP Catalogs
] タブ)。クエリ
制限事項¶
挿入: 組み込み MPP データソースの [
From Object Storage
] タブを使用して Parquet ファイルから作成したビューにデータを挿入することはできません。詳細については、「 Parquet ファイルから作成されたビューの管理 」を参照してください。
Avro、CSV、ORC¶
Avro、CSV、ORC など、Parquet 以外のファイル形式のデータセットをクエリするには、Denodo 組み込み MPP に Hive テーブルを作成する必要があります。その場合、Denodo 組み込み MPP データソースにはグラフィカルな方法が存在しないため、JDBC クライアントを使用する必要があります。次に、組み込み MPP データソースの [From MPP Catalogs
] タブを使用して、作成した Hive テーブルから Denodo 基本ビューを作成します。
手順を以下に示します。
組み込み MPP データソースの [
From MPP Catalogs
] タブからhive
という名前の事前定義されているカタログにアクセスすることはできないため、組み込み MPP に新しいカタログを作成します。たとえば、
presto/conf/catalog/hive_orc_formats
という名前の新しいカタログプロパティファイルを追加します。次に、connector.name
プロパティにカタログタイプ``hive-hadoop2`` を追加し、このカタログタイプに必要な他のプロパティを追加します。以下に、Avro、CSV、または ORC のデータセットを読み込むために 組み込み Hive メタストア に接続する Hive カタログプロパティの例を示します。
connector.name=hive-hadoop2 hive.metastore.uri=thrift://hive-metastore:9083 hive.config.resources=/opt/presto-server/etc/catalog/core-site.xml hive.allow-drop-table=true hive.non-managed-table-writes-enabled=true
JDBC クライアントを使用して、組み込み MPP に上記の Hive テーブルを作成します。このような単純な SQL クエリの場合、以下に示す Presto UI を使用できます。この SQL クエリエディターには、クエリあたりで返されるのは最大 100 レコードのみという制限事項があります。
次に、組み込み MPP データソースの [
From MPP Catalogs
] タブを使用して、前に作成した Hive テーブルから Denodo 基本ビューを作成します。