メタデータ検索¶
メタデータ検索では、メタデータに検索語句を含むビューや Web サービスを検索できます。エレメントのメタデータは以下のとおりです。
名前
説明
各フィールドの名前
各フィールドの説明
割り当てられているカスタムプロパティの値
メタデータ検索を作成する手順は次のとおりです。
左上隅にある検索バーにクエリを入力します。
左側 ([Filter results] セクション) で、[メタデータ] を選択します。
フィルタリングオプションを選択します。
次のいずれかの方法でクエリを開始します。
注釈
何らかの語句を初めて検索する場合、Data Catalog はメタデータ検索を行います。また、 コンテンツ検索 ができない場合は、すべてメタデータ検索になります。
結果リストは、リストとグリッドという 2 つの表示モードに対応しています。各結果の詳細を参照するには、 アイコンをクリックしてリストモードを有効にします。逆に、ページ内に表示する結果の件数を増やしたい場合は、 アイコンをクリックしてグリッドモードを有効にします。
各結果について、検索キーワードに一致したフィールドやカスタムプロパティの個数と、VDP タグに一致したフィールドの個数を確認できます。これらのフィールドやプロパティの詳細を知りたい場合は、一致の個数のリンクをクリックし、一致したフィールドやカスタムプロパティを確認します。
メタデータ検索では、複数の検索語に対応しており、包含的で、大文字と小文字を区別しません。
複数の検索語: 1 つまたは複数の単語で構成される正確な語句の検索に対応しています。また、入力されたすべての検索語を含むエレメントや、少なくとも 1 つの検索語を含むエレメントの検索も可能です。
包含的: ビューや Web サービスが結果リストに表示されるには、そのメタデータに検索語句が含まれている必要があります。たとえば、検索語句
customer
は、ビューcustomer
やdv_customers
の名前に含まれているため、これらのビューに一致します。大文字と小文字を区別しない: Data Catalog では、検索語句とメタデータ内の語句を比較する際、大文字と小文字が同等に扱われます。たとえば、検索語句
CUSTOMER
は、同じ文字で構成されるビューcustomer
やCustomer
に一致します。
注釈
クエリが空の場合は、すべてのビューと Web サービスが一致します。
また、[結果のフィルタリング] セクションにあるフィルタリングオプションの一部を適用すると、結果をさらに絞り込むことができます。
Element type: 結果に表示するエレメントのタイプを選択します。
ビューと Web サービス
ビューのみ
Web サービスのみ
Search option: 目的の検索タイプを選択します。
Exact match: デフォルトのオプションです。1 つまたは複数の単語で構成される正確な語句を検索でき、入力した順序で特定の語句を含むエレメントのみが取得されます。
All the words: すべての検索語を含む検索が可能です。すべての単語を検索する場合、一部の検索フィールドのすべての単語を含むエレメントのみが返されます (すべての単語がエレメント名に含まれる、すべての単語が説明文に含まれる、すべての単語がフィールド名に含まれる、すべての単語がフィールドの説明文に含まれる、すべての単語がプロパティ値に含まれる場合)。
Any of the words: 少なくとも 1 つの検索語を含む検索が可能です。いずれかの単語を検索すると、一部の検索フィールドの少なくとも 1 つの単語を含むエレメントのみが返されます。
注釈
[All the words] と [Any of the words] の検索オプションの最大単語数は 6 です。7 番目以降の単語は無視されます。
フィールドの検索: デフォルトでは、メタデータのすべてのフィールドが検索対象になります。この設定は、検索対象にするフィールドを選択することで変更できます。
名前
説明
フィールド名
フィールドの説明
プロパティ値
コラボレーション: 選択したコラボレーションを 1 つ以上含むビューまたは Web サービスのみが結果に表示されます。
承認済み
警告あり
廃止済み
データベース: デフォルトでは、Virtual DataPort サーバーのすべてのデータベースが検索対象になります。対象にするデータベースのリストを選択すると、結果リストを絞り込むことができます。
カテゴリ: カテゴリ を選択すると、そのカテゴリに属するビューと Web サービスのみが結果リストに表示されます。
タグ: タグ を選択すると、そのタグが割り当てられているビューと Web サービスのみが結果リストに表示されます。VDP タグがインポートされると、結果リストにはタグに割り当てられたフィールドを含むビューも表示されます。
重要
Data Catalog の管理者は以下を考慮する必要があります。
メタデータ検索を機能させるためには、Data Catalog を Virtual DataPort サーバーと 1 回以上 同期 しておく必要があります。同期されていないと、結果リストが空になります。
ビューや Web サービスが結果リストに表示されるには、ユーザーにそのデータベースに関する
接続
権限とメタデータ
権限が付与されている必要があります。
インデックスのメタデータ検索¶
インデックスのメタデータ検索は、メタデータインデックスが現在の Virtual DataPort サーバーに正しく構成されている場合のみ使用できます。詳細については、「 検索エンジンの構成 - メタデータ検索 」のセクションを参照してください。
インデックスでメタデータ検索を行う手順は次のとおりです。
左上隅にある検索バーにクエリを入力します。
左側 ([Filter results] セクション) で、[メタデータ] を選択します。
フィルタリングオプションを選択します。
次のいずれかの方法でクエリを開始します。
インデックスのメタデータ検索では、メタデータに検索語句を含むビューや Web サービスを検索できます。また、次のような高度な機能を備えた複雑なクエリにも対応しています。
検索語句内のワイルドカード。
あいまい検索は、検索語句がインデックス化されたメタデータの語句と完全に一致しない場合でも、検索クエリと類似した結果を見つけることができます。
近接検索。特定の間隔で互いに近接している語句を検索します。
クエリ内の検索語句のブースト。
ブール式。
その他...
メタデータインデックスでサポートされている検索エンジンは Lucene を内部で使用する Scheduler Index サーバーであるため、サポートされているクエリ構文は Apache Lucene 検索構文 で確認できます。
検索用のフィルタオプションは、前のセクションで説明したデータベース内のメタデータ検索用のオプションと同じですが、インデックスのメタデータ検索には適用されない検索オプションは除きます。
インデックスのメタデータ検索の結果リストでは、メタデータで見つかった検索語句が ハイライト表示 され、検索に一致した場所をわかりやすく表示します。
次の点に注意してください。
表示される検索結果は、メタデータインデックスの作成に使用される アナライザー に依存します (検索エンジンのセクションで構成されている場合)。これは、インデックス検索がどのように機能するかを理解し、関連するすべてのプロセスを考慮する場合に重要です。
トークン化: このプロセスでは、テキストやドキュメントをトークンと呼ばれる個々の単位に分割します。Lucene ではトークナイザーを使用して、言語固有のルールに基づいてテキストを単語に分割します。空白、句読点、特殊文字などの一般的な区切り文字は、通常、単語の境界を識別する場合に使用します。
小文字化: トークン化の後、テキストは小文字に変換されます。このステップでは、検索の大文字と小文字が区別されません。つまり、クエリは大文字と小文字に関係なく単語を一致させることができます。
ストップワードの削除 はテキスト分析プロセスのステップで、インデックスを作成する前に、テキストからストップワードとして知られる一般的な単語をフィルタリングします。ストップワードは、言語中に頻繁に出現しますが、ほとんど意味を持たない単語です。英語の場合、「and」、「the」、「is」、「in」などのストップワードがあります。ストップワード削除の目的は、インデックスのサイズを小さくして、検索結果の関連性に寄与しない単語を削除して検索の効率を向上させることです。
ステミング は、単語をその語根の形にするプロセスで、検索時に単語の変化した形が一致するようにします。ステミングに適用されるアルゴリズムは、メタデータのインデックス作成で選択されたアナライザーにも依存します。
以下の点に留意してください。
Lucene には複数の組み込みアナライザーがあり、それぞれがサポートする特定の言語に対応するステム機能 (該当する場合) を備えています。
StandardAnalyzer
ではステミングを行いません。Data Catalog には、英語とスペイン語のアナライザーのカスタム実装があり、その目的で
org.tartarus.snowball.ext.EnglishStemmer
とorg.tartarus.snowball.ext.SpanishStemmer
を使用します。EnglishStemmer はオリジナルの Porter アルゴリズムの 修正版 を実装しています。