はじめに

最新のビジネスプロセスは、数十年にわたって開発された無数の情報システムを利用する必要があります。

そしてこれらのシステムは、ほとんどの場合、まったく異なるテクノロジー (リレーショナルデータベース、Web サービス、XML ドキュメント、スプレッドシート、フラットファイルなど) と、まったく類似点のないデータモデルを使用して開発された無数のデータソースを利用します。これらのデータソースの中には「適切に構造化」されていてクライアントアプリケーションから簡単にクエリを実行できるものもありますが、それほど適切に構造化されておらず、クライアントのやり取りを円滑化するための初歩的なスキーマさえ持たないデータソースがますます増えています。実際、一部のデータソースは単なるテキストドキュメントであり、何らかの「構造」に従っているようには見えません。

最新の情報システムを開発し、ビジネスプロセスを最適化するには、継承されてきたこの無数のデータリポジトリに保存されているデータにアクセスし、そのデータを利用する必要があります。

考慮すべきもう 1 つの重要なトレンドは、ソーシャルメディアとビッグデータの拡大です。これらは、必要な情報が広範に散らばっていること、そして多種多様なデータ形式が混在していることを明確に表している例です。このデータは、通常、Web を閲覧することにより様々な形式で見つかり、企業の情報システムに決定的な価値をもたらすことがよくあります。

また多くの場合、顧客、サプライヤー、および競合他社は、その情報やサービスにアクセスするために、単純または複雑な Web インターフェイスを利用します。

Denodo Platform は、異種混合型で分散された構造化および非構造化データソースをリアルタイムに統合する グローバルソリューション です。そのために、以下に示すさまざまな統合モジュールが結合されています。

  • Virtual DataPort モジュールは、企業のあらゆる関連情報を、その発生元、形式、および構造化レベルに関係なく、リアルタイムに統合します。このモジュールを使用して、データベース、SOAP Web サービス、REST Web サービス、XML フラットファイル、従来の Web サイト (ITPilot モジュール経由)、LDAP サーバーなど、あらゆる種類のデータソースからのデータの統合ビューで構成される「仮想データベース」を作成できます。

  • ITPilot モジュールは、Web に存在するデータにアクセスして構造化する簡単な方法を提供します。このプロセスでは、特定の Web ソースから、ラッパーと呼ばれる抽象層を構築します。ラッパーによって、クライアントアプリケーションはサイト固有の特性 (アクセスプロトコル、ネイティブデータ構造など) から分離されます。したがって、従来のデータベースに含まれるデータの場合と同じように、見落としがちな Web に存在するデータに対して簡単かつ効果的にクエリを実行し、そのデータを統合できます。それに加えて、ITPilot は、PDF、Microsoft Excel、および Microsoft Word の各ドキュメントから構造化データを抽出することもできます。ITPilot は、ラッパーを生成および実行して、ラッパーが正しく動作していることを検証するための拡張性の高い分散環境を提供します。

  • さらに、Scheduler モジュールは、上記のモジュールを使用してさまざまなソースから自動的にデータを抽出してフィルターし、必要な形式でエクスポートするバッチタスクをスケジューリングできる補完ツールです。

General architecture of the Denodo Platform

Denodo Platform の一般的なアーキテクチャ

本書は、プラットフォームのインストールと構成について紹介し、中でもプラットフォームに含まれるすべてのサーバーやツールを起動および停止できる単一パネルを提供する、Denodo Platform Control Center の使用方法を解説します。

Solution Manager のインストールの詳細については、『 Solution Manager インストールガイド 』を参照してください。