一般的なアーキテクチャ¶
大まかに言えば、Virtual DataPort を使用することで、外部ソースを含む、分散した異種混合のデータソース群を、大規模な「仮想」データベースに格納されたデータのようにビジネスアプリケーションで処理できます。この「仮想データベース」を使用して、これらのデータを組み合わせてまとめたビューを作成できます。
Virtual DataPort は、システムに存在するすべてのデータソースのデータを構造化して統合したビューを提供する仲介機能として動作します。これによって、構造化の程度がさまざまな幅広いデータソースを容易に扱うことができます。このようなデータソースとして、データベース、Web サイト、スプレッドシート、XML ドキュメント、Web サービス、LDAP サーバー、フラットテキストファイル、非構造化情報のインデックスなどがあります。
このようなシステムでは、各データソースを容易に「仮想データベース」にインポートできます。インポートした後は、SQL に類似の言語である Denodo VQL (Virtual Query Language) を使用して、そのようなクエリのリレーションにあるデータを任意に組み合わせたビューを作成します。そこでは、選択、投影、和結合、結合、グループなどの操作を使用します。このようにして、ソースデータの統合ビューを作成します。Virtual DataPort では、限られたクエリ機能を備えたソースをこのプロセスで処理できます (たとえば、多くの Web サービスでは、特定の必須パラメータを指定したクエリのみを使用できます)。また、Virtual DataPort のクエリエンジンは、非構造化データにクエリを実行し、そのデータを構造化データや半構造化データと組み合わせることができます。
事前に定義されているビューに VQL クエリを実行したシステムでは、クエリの実行プランを作成できます。このプランは、関連するさまざまなソースにリアルタイムで送信するサブクエリのリスト、および各ソースから得られたデータを組み合わせる操作群で構成されています。
さらに、Virtual DataPort には、ソースデータへのアクセスに使用するメカニズムを管理者が決定できるシステム (キャッシュモジュール) が用意されています。
システムは、リアルタイムでソースデータにアクセスして、全面的に最新のデータを提供できます。
必要に応じてソースまたはビューで使用するキャッシュを作成し、構成できます。
データソースでトランザクションがサポートされている場合は、Virtual DataPort を使用してそのデータソースを更新することもできます。
Virtual DataPort で提供されるデータ統合システムは、ユーザーレイヤー、論理レイヤー、および物理レイヤー (ラッパー) の 3 つのレイヤーでモデル化されています。このシステムアーキテクチャの概要を「 Virtual DataPort Architecture 」で説明しています。各レイヤーについては、この後の説明を参照してください。